¿Por qué tantos métodos de computación PSD?


53

El método de Welch ha sido mi algoritmo de referencia para calcular la densidad espectral de potencia (PSD) de series de tiempo de muestreo uniforme. Noté que hay muchos otros métodos para calcular PSD. Por ejemplo, en Matlab veo:

  • PSD usando el método Burg
  • PSD usando el método de covarianza
  • PSD usando periodogram
  • PSD utilizando el método de covarianza modificado
  • PSD utilizando el método multitaper (MTM)
  • PSD usando el método de Welch
  • PSD usando el método Yule-Walker AR
  • Espectrograma que usa la transformada de Fourier a corto plazo
  • Estimación espectral

¿Cuáles son las ventajas de estos diversos métodos? Como pregunta práctica, ¿cuándo querría usar algo diferente al método de Welch?


Ni siquiera un novato en el procesamiento de señales, pero supongo que {esto} puede ser relevante, también {esto} . Yo solo busqué en Google.
Desarrollador

44
En realidad, no "computa" el PSD sino que lo "estima". Hay una gran diferencia
leonbloy

1
Este enlace contiene ejemplos de algunas de las técnicas mencionadas anteriormente: mathworks.com/help/signal/ug/nonparametric-methods.html

Respuestas:


67

No estoy familiarizado con el método Multitaper. Dicho esto, has hecho una gran pregunta. Para obtener mi título de MSEE, tomé un curso completo que cubría la estimación de PSD. El curso cubrió todo lo que enumeró (con excepción del método Multitaper), y también métodos subespaciales. Incluso esto solo cubre algunas de las ideas principales, y existen muchos métodos derivados de estos conceptos.

Para empezar, hay dos métodos principales de estimación de densidad espectral de potencia: no paramétrica y paramétrica.

Los métodos no paramétricos se utilizan cuando se sabe poco acerca de la señal antes de tiempo. Por lo general, tienen menos complejidad computacional que los modelos paramétricos. Los métodos en este grupo se dividen en dos categorías: periodogramas y correlogramas. Los periodogramas también se denominan a veces métodos directos, ya que dan como resultado una transformación directa de los datos. Estos incluyen el espectro de muestra, el método de Bartlett, el método de Welch y el Periodograma de Daniell. Los correlogramas a veces se denominan métodos indirectos, ya que explotan el teorema de Wiener-Khinchin. Por lo tanto, estos métodos se basan en tomar la transformada de Fourier de algún tipo de estimación de la secuencia de autocorrelación. Debido a la gran cantidad de varianza asociada con los retrasos de orden superior (debido a una pequeña cantidad de muestras de datos utilizadas en las correlaciones), Se utiliza la ventana. El método Blackman-Tukey generaliza los métodos de correlograma.

Los métodos paramétricos suelen asumir algún tipo de modelo de señal antes del cálculo de la estimación de densidad espectral de potencia. Por lo tanto, se supone que algunos conocimientos de la señal se conocen de antemano. Hay dos categorías principales de métodos paramétricos: métodos autorregresivos y métodos de subespacio.

Los métodos autorregresivos suponen que la señal se puede modelar como la salida de un filtro autorregresivo (como un filtro IIR) impulsado por una secuencia de ruido blanco. Por lo tanto, todos estos métodos intentan resolver los coeficientes IIR, por lo que la densidad espectral de potencia resultante se calcula fácilmente. Sin embargo, se debe determinar el orden del modelo (o el número de tomas). Si el orden del modelo es demasiado pequeño, el espectro se suavizará mucho y carecerá de resolución. Si el orden del modelo es demasiado alto, comienzan a aparecer picos falsos de una gran cantidad de polos. Si la señal puede ser modelada por un proceso AR del modelo 'p', entonces la salida del filtro de orden> = p conducido por la señal producirá ruido blanco. Hay cientos de métricas para la selección de pedidos de modelos. Tenga en cuenta que estos métodos son excelentes para señales de banda estrecha de SNR de alta a moderada. El primero se debe a que el modelo se descompone en un ruido significativo y se modela mejor como un proceso ARMA. Esto último se debe a la naturaleza impulsiva del espectro resultante de los polos en la transformada de Fourier del modelo resultante. Los métodos AR se basan en la predicción lineal, que es lo que se usa para extrapolar la señal fuera de sus valores conocidos. Como resultado, no sufren lóbulos laterales y no requieren ventanas.

Los métodos de subespacio descomponen la señal en un subespacio de señal y subespacio de ruido. La explotación de la ortogonalidad entre los dos subespacios permite que se forme un pseudoespectro donde pueden aparecer picos grandes en componentes de banda estrecha. Estos métodos funcionan muy bien en entornos de baja SNR, pero son computacionalmente muy caros. Se pueden agrupar en dos categorías: métodos de subespacio de ruido y métodos de subespacio de señal.

Ambas categorías se pueden utilizar de una de dos maneras: descomposición del valor propio de la matriz de autocorrelación o descomposición de valores singulares de la matriz de datos.

Los métodos de subespacio de ruido intentan resolver 1 o más de los vectores propios del subespacio de ruido. Luego, la ortogonalidad entre el subespacio de ruido y el subespacio de señal produce ceros en el denominador de las estimaciones de espectro resultantes, lo que resulta en grandes valores o picos en componentes de señal verdaderos. El número de sinusoides discretos, o el rango del subespacio de señal, debe determinarse / estimarse o conocerse con anticipación.

Los métodos de subespacio de señal intentan descartar el subespacio de ruido antes de la estimación espectral, mejorando la SNR. Se forma una matriz de autocorrelación de rango reducido con solo los vectores propios que se determina que pertenecen al subespacio de señal (de nuevo, un problema de orden de modelo), y la matriz de rango reducido se usa en cualquiera de los otros métodos.

Ahora, intentaré cubrir rápidamente tu lista:

  • PSD usando el método Burg: El método Burg aprovecha la recursividad de Levinson de manera ligeramente diferente que el método Yule-Walker, ya que estima los coeficientes de reflexión minimizando el promedio del error de predicción lineal hacia adelante y hacia atrás. Esto da como resultado una media armónica de los coeficientes de correlación parcial del error de predicción lineal hacia adelante y hacia atrás. Produce estimaciones de muy alta resolución, como todos los métodos autorregresivos, porque utiliza predicción lineal para extrapolar la señal fuera de su registro de datos conocido. Esto elimina efectivamente todos los fenómenos del lóbulo lateral. Es superior al método YW para registros de datos cortos, y también elimina el compromiso entre utilizar las estimaciones de autocorrelación sesgadas e imparciales, ya que los factores de ponderación se dividen. Una desventaja es que puede exhibir división de línea espectral. Adicionalmente, sufre los mismos problemas que tienen todos los métodos AR. Es decir, la SNR baja a moderada degrada gravemente el rendimiento, ya que ya no está modelado adecuadamente por un proceso AR, sino más bien un proceso ARMA. Los métodos ARMA rara vez se usan, ya que generalmente dan como resultado un conjunto no lineal de ecuaciones con respecto a los parámetros de la media móvil.

  • PSD utilizando el método de covarianza : el método de covarianza es un caso especial del método de mínimos cuadrados, por el cual se descarta la porción en ventana de los errores de predicción lineal. Esto tiene un rendimiento superior al método Burg, pero a diferencia del método YW, la matriz inversa a resolver no es Hermitian Toeplitz en general, sino el producto de dos matrices Toeplitz. Por lo tanto, la recursividad de Levinson no se puede usar para resolver los coeficientes. Además, no se garantiza que el filtro generado por este método sea estable. Sin embargo, para la estimación espectral esto es algo bueno, ya que resulta en picos muy grandes para el contenido sinusoidal.

  • PSD que usa periodograma : este es uno de los peores estimadores, y es un caso especial del método de Welch con un solo segmento, ventana rectangular o triangular (dependiendo de qué estimación de autocorrelación se use, sesgada o imparcial), y sin superposición. Sin embargo, es uno de los "más baratos" computacionalmente hablando. La variación resultante puede ser bastante alta.

  • PSD utilizando el método de covarianza modificado : esto mejora tanto el método de covarianza como el método de Burg. Se puede comparar con el método Burg, por el cual el método Burg solo minimiza el error de predicción lineal promedio hacia adelante / hacia atrás con respecto al coeficiente de reflexión, el método MC lo minimiza con respecto a TODOS los coeficientes AR. Además, no sufre división de línea espectral y proporciona mucha menos distorsión que los métodos enumerados anteriormente. Además, si bien no garantiza un filtro IIR estable, su realización de filtro de red es estable. También es más exigente computacionalmente que los otros dos métodos.

  • PSD utilizando el método de Welch: el método de Welch mejora el periodograma al abordar la falta del promedio del conjunto que está presente en la verdadera fórmula de PSD. Generaliza el método de Barlett mediante el uso de superposición y ventanas para proporcionar más "muestras" de PSD para el promedio del pseudoconjunto. Puede ser un método barato y efectivo según la aplicación. Sin embargo, si tiene una situación con sinusoides muy espaciados, los métodos AR pueden ser más adecuados. Sin embargo, no requiere estimar el orden del modelo como los métodos AR, por lo que si se sabe poco sobre su espectro a priori, puede ser un excelente punto de partida.

  • PSD usando el método AR de Yule-Walker : este es un caso especial del método de mínimos cuadrados donde se utilizan los residuales de error completos. Esto da como resultado una disminución del rendimiento en comparación con los métodos de covarianza, pero puede resolverse de manera eficiente utilizando la recursividad de Levinson. También se conoce como el método de autocorrelación.

  • Espectrograma que utiliza la transformación de Fourier a corto plazo : ahora está cruzando a un dominio diferente. Esto se usa para espectros que varían en el tiempo. Es decir, uno cuyo espectro cambia con el tiempo. Esto abre otra lata de gusanos, y hay tantos métodos como los que ha enumerado para el análisis de frecuencia de tiempo. Este es sin duda el más barato, por eso se usa con tanta frecuencia.

  • Estimación espectral : este no es un método, sino un término general para el resto de su publicación. A veces, el Periodograma se conoce como el "espectro de muestra" o el "Periodograma de Schuster", al cual puede referirse el primero.

Si está interesado, también puede buscar métodos subespaciales como MUSIC y Descomposición armónica de Pisarenko. Estos descomponen la señal en señal y subespacio de ruido, y explotan la ortogonalidad entre el subespacio de ruido y los vectores propios del subespacio de señal para producir un seudoespectro. Al igual que los métodos AR, es posible que no obtenga una estimación PSD "verdadera", ya que la potencia probablemente no se conserva y las amplitudes entre los componentes espectrales son relativas. Sin embargo, todo depende de su aplicación.

Salud


¡Gracias por la gran respuesta! ¿Podría agregar algunas observaciones introductorias sobre la diferencia entre los métodos paramétricos y no paramétricos? Además, podría ser más claro agrupar los métodos que están estrechamente relacionados o derivados entre sí, es decir, periodograma ⊆ método de Bartlett ⊆ método de Welch.
nibot

Ciertamente. Acabo de agregar una introducción y algunas categorías.
Bryan

Bienvenidos. Gracias por contribuir con una respuesta tan detallada.
Jason R

Si pudiera entrar en más detalles sobre las ventajas / desventajas, en lugar de cómo se calcula cada una, nos daría una mejor idea de cómo seleccionar una para una aplicación específica.
CyberMen

1
Si lees la respuesta, acabo de hacer eso. Además, para implementaciones prácticas, la forma en que se calcula cada una es en gran medida una ventaja / desventaja. Algunos de ellos son muy computacionalmente eficientes, pero no funcionan tan bien. Algunos de ellos funcionan muy bien, pero son muy complejos y difíciles de implementar en objetivos de baja potencia.
Bryan

12

Quería agregar a la única categoría que la primera publicación no cubría. El método multitaper es un método no paramétrico para calcular un espectro de potencia similar al enfoque del periodograma. En este método, se calcula un espectro de potencia mediante la ventana de datos y el cálculo de una transformada de Fourier, tomando la magnitud del resultado y cuadrándolo. El método multitaper promedia un número predeterminado de periodogramas cada uno calculado con una ventana diferente. Este método funciona porque las ventanas seleccionadas tienen dos propiedades matemáticas. Primero, las ventanas son ortogonales. Esto significa que cada uno de los periodogramas no está correlacionado, por lo que promediar varios periodogramas da una estimación con una varianza menor que el uso de un solo cono. En segundo lugar, las ventanas tienen la mejor concentración posible en el dominio de frecuencia para una longitud de señal fija.

En matlab, las funciones de ventana se pueden invocar utilizando la función dpss. Además de utilizar ventanas óptimas, se ha derivado un algoritmo para ponderar los diferentes periodogramas en función de la cantidad de fuga que agregarán a la estimación del espectro de potencia. El algoritmo produce un conjunto de pesos adaptables a los datos. La obtención de una estimación del espectro con un conjunto de pesos adaptables a los datos se puede hacer en Matlab creando un objeto spectrum.mtm con 'adaptativo' utilizado como opción de combinación.

Con respecto a los métodos no paramétricos, el método MT es posiblemente el mejor método para estimar un espectro de potencia para una serie temporal estacionaria.


Mirando la última oración de tu publicación, siempre querrás usar un cálculo de MT sobre el método de Welch.
ncRubert