Evaluación del Estimador de Máxima Verosimilitud Aplicado a la
Transcripción
Evaluación del Estimador de Máxima Verosimilitud Aplicado a la
Encuentro de Investigación en IE, 17—18 Marzo, 2005 Encuentro de Investigación en Ingeniería Eléctrica Zacatecas, Zac, Marzo 17 —18, 2005 Evaluación del Estimador de Máxima Verosimilitud Aplicado a la Localización de Fuentes en Comunicaciones Móviles Celulares Darío Bonilla1, David Covarrubias1, José G. Arceo1,2 Centro de Investigación Científica y de Educación Superior de Ensenada Grupo de Comunicaciones Inalámbricas, Km. 107 Carretera Tijuana-Ensenada. Ensenada, Baja California, 22860. TEL: (646)1750500, ext. 25347, 25438, 25429, correo-e:[dbonilla, dacoro, arceojg]@cicese.mx 1 2 Centro de Investigación y Desarrollo de Tecnología Digital-IPN Av. del Parque # 1310, Tijuana, BC, 22510. correo-e: [email protected], Resumen — La estimación de la Dirección de Arribo, DoA (Direction of Arrival) de fuentes o terminales móviles en sistemas de comunicaciones móviles celulares, necesita de métodos de estimación con altas prestaciones. En este trabajo se evalúan las prestaciones de los métodos de estimación del DoA de las señales de interés, en un entorno de comunicaciones celulares. Se utilizan arreglos lineales de antenas para los métodos de Inferencia Estadística (Máxima Verosimilitud, ML) y el algoritmo MUSIC, el cual está basado en técnicas de subespacio. Para eliminar los problemas de maximización no lineales, se utiliza el método iterativo Maximización de la Esperanza (EM) para el cálculo de la estimación de máxima verosimilitud. Dados estos métodos de estimación del DoA, se evalúa el error de estimación y se obtiene el error cuadrático medio (RMSE) contra la relación señal a ruido (SNR). Abstract. The estimation of direction of Arrival (DoA) of narrow band sources for cellular mobile communications systems requires high performance estimation methods. In this work, we evaluate the characteristics and performance of the DoA estimation methods, for a mobile cellular communications environment. We use a Uniform Linear Array (ULA) of antennas for the Maximum Likelihood Estimator (ML) and MUSIC Algorithm, which is based on subspace techniques. To avoid the nonlinear maximization problems, we used the Expectation/Maximization (EM) iterative method to compute the maximum likelihood estimate. Given these DoA estimation methods, we evaluate the estimation error and the root mean squared error (RMSE) against the signal to noise ratio (SNR). Palabras clave —Antenas Inteligentes, Dirección de Arribo, Inferencia Estadística, Máxima Verosimilitud, Music. D I. INTRODUCCIÓN ENTRO de la tecnología de Antenas Inteligentes en comunicaciones móviles celulares, la detección de la Dirección de Arribo (DoA) de múltiples terminales móviles de banda angosta, es uno de los temas de mayor investigación en la actualidad. Para este propósito se han estudiado distintos métodos, de los cuales los basados en sub-espacios son de los más utilizados hasta el momento. Pensando en algoritmos que proporcionen una mejor separación de fuentes, menor error y buena eficiencia en ambientes ruidosos, es necesario utilizar algoritmos mejores. Dadas las cualidades de los métodos de inferencia estadística, tal como la consistencia, sesgo y de 288 Encuentro de Investigación en IE, 17—18 Marzo, 2005 289 varianza mínima, es interesante considerar los métodos de Máxima Verosimilitud (ML) para el problema de detección del DoA en sistemas de comunicaciones celulares. En particular, sobre los métodos anteriores, presentan ventajas tanto estadísticas como en cuanto a prestaciones para los nuevos sistemas; esto ya que pueden ser aplicables a sistemas con señales de banda ancha, con mayor número de usuarios, e incluso bajo ambientes muy agresivos donde se tenga una baja Relación Señal a Ruido (SNR). Dado que se han demostrado las ventajas estadísticas de estos métodos en [3], es importante evaluar las prestaciones de estos métodos considerando el costo computacional y el error en la detección del DoA de las señales de las fuentes de interés. Otro método que se eligió fue el algoritmo MUSIC propuesto por Schimidt [2], el cual considera la geometría del arreglo de antenas y que se encuentra en la clase de algoritmos basados en la técnica de subespacios. Se utiliza un modelo de señal donde se considera la esfericidad del frente de onda, a fin de ser más realista y que se pueda ajustar a cualquier entorno celular, sea micro o macrocelular o incluso para interiores. La utilización de este modelo también sirve en el caso del estimador de Máxima Verosimilitud, para estimar la distancia entre la estación base y los terminales móviles. El cálculo de la estimación ML genera problemas de optimización no lineales y tiene que ser resuelto por métodos iterativos. Para esto se emplea el algoritmo de Maximización de la Esperanza (EM) el cual es un método iterativo diseñado para casos donde existen datos incompletos. Aunque este algoritmo nos llevará a los parámetros estimados, necesita una inicialización adecuada a fin de que el algoritmo pueda converger rápidamente hacia éstos. Por último, para analizar el comportamiento asintótico de la eficiencia del estimador se utiliza la Cota de Cramer-Rao (CRB) como un indicador de su desempeño. De esta forma, se puede observar la eficiencia del estimador. En la sección II se describe el modelado del Estimador de Máxima Verosimilitud, la cota de Cramer- Rao (CRB) y el algoritmo de Maximización de la Esperanza (EM), todos ellos aplicados a la localización de fuentes de interés en las comunicaciones móviles celulares, así como las consideraciones más importantes de este método. La sección III muestra los resultados de las simulaciones de ambos algoritmos, en cuanto a sus prestaciones utilizando arreglos de antenas lineales de 8 elementos con separación uniforme [3]. Por último, en la sección IV se presentan las conclusiones de este trabajo. II. MÉTODO DE ESTIMACIÓN DE MÁXIMA VEROSIMILITUD APLICADO A COMUNICACIONES MÓVILES CELULARES El método basado en máxima verosimilitud (ML) ofrece ventajas estadísticas [3] en cuanto a consistencia, sesgo y mínima varianza, dado un entorno. A. Modelo de la señal El modelo para construir la matriz de datos x(t), contiene las K muestras de D fuentes que inciden en el arreglo, D es el índice de fuentes. El arreglo está compuesto por M elementos de antena, distribuidos sobre el eje x, según se indica en la Figura 1. Cada elemento tiene un peso Im, con una separación entre elementos d en términos de longitud de onda. Por simplicidad, se asignan ganancias Im unitarias. 290 Encuentro de Investigación en IE, 17—18 Marzo, 2005 Y Fuente r sθ co dp I1 θ I2 I3 I m-1 I4 Im X, θ=0º d Figura 1. Modelo de datos, distribución de elementos del array, frente de onda esférico. La salida de cada elemento del array se representa por (1), donde el término exponencial de cada elemento conforma el vector de dirección v del arreglo (2), el cual establece la diferencia de fase entre elementos, q es el índice de fuentes. El cambio de fase se representa por dos componentes, q que representa la componente de fase de campo lejano y q que es el término para aproximar el campo cercano dado el frente de onda esférico. La forma Matricial se representa en (3) donde el vector V está constituido por los vectores dirección v a cada una de las q fuentes, s es la señal y n el vector de ruido x m ( t) = D e j ( µ q m +ζ q m 2 ) s q (t ) + n(t ) , (1) q =1 v( µ q , ζ q ) = e Donde: µq = − 2πd λ j ( µ q +ζ q 2 ) sin(θ q ) , ζ q = ,Λ e j ( µ q M +ζ q M 2 ) T . (2) πd 2 cos 2 θ q , λrq X(k) = V ( µ , ζ ) s (k ) + N (k ) , k = 1,2 ,...,K . (3) Las fuentes radiantes son omni-direccionales, representadas en magnitud y fase por s (t ) = α (t ) exp − j 2πft , donde α (t ) = 1/ r ε son las pérdidas por propagación, ε es el exponente de pérdidas y f la frecuencia de interés. En t=r/c+kT se considera el tiempo de propagación y el muestreo, en el instante k con periodo T y N(k) es el ruido, [4, 5, 6]. Se asume que la señal s(t) y el ruido n(t) están incorrelacionados para cualquier t, y que ambos poseen una función de densidad de probabilidad (pdf) compleja gaussiana con media igual a cero. Esto nos lleva a que los datos observados X, son un vector complejo Gaussiano con media 0 y con matriz de covarianza Kx( ). La señal de ruido Gaussiano tiene una desviación 2 conocida, [4]. B. Estimador Incondicional de Máxima Verosimilitud Primero es necesario establecer la función de Máxima verosimilitud, así consideramos que la información traída por una observación x, acerca del parámetro , está completamente contenida en la función de densidad de probabilidad p(x). Donde p(x) para un arreglo de M elementos de antena es de la forma [4]: 1 p x|θ ( x) = exp[−( x H − m xH (θ )) K x−1 (θ )( x − m x (θ ))] . (4) det[πK x (θ )] La pdf conjunta para varias observaciones sucesivas, dado que cada observación x es independiente e idénticamente distribuida (i.i.d.), y que mx( ) es igual a cero, queda entonces: Encuentro de Investigación en IE, 17—18 Marzo, 2005 p x1 , x2 ,..., xk |θ ( x) = K ∏ det[π k =1 1 exp[− X kH K x−1 (θ ) X k ] . K x (θ )] N 291 (5) Como podemos ver, esta expresión es algo difícil de manejar, por lo cual utilizamos la función logarítmica (log-verosimilitud). La función log-verosimilitud se define como el logaritmo de la pdf conjunta de las observaciones de la siguiente manera: L x (θ ) = ln p x1 , x2 ,..., xk |θ ( x) , L x (θ ) = − ln det[ K x (θ )] + (6) 1 K K k =1 X kH K x−1 (θ ) X k , (7) Y por las propiedades de la matriz de covarianza se puede reducir de (7) a (8): [ [ ] Lx (θ) = − lndet[Kx (θ)]+ tr Kx−1(θ) • Cx . (8) Donde Cx es la matriz de correlación del muestreo. Dada la función de verosimilitud logarítmica Lx( ), ahora hay que encontrar el parámetro ’ML el cual maximiza dicha función. Maximizar esta expresión se puede complicar bastante por problemas no lineales, principalmente cuando D crece, por lo cual se deben utilizar técnicas eficientes para resolver el problema. El método utilizado es el algoritmo EM (Maximización de la Esperanza) diseñado para problemas de maximización donde se tiene pérdida de datos y alta complejidad matemática, el cual es un método iterativo. C. Algoritmo iterativo EM de maximización de la esperanza Se asume que existen dos espacios muéstrales Xk={x1,…xk} y Yk={y1,…yk}, para k=1…K, los datos Xk observados se consideran incompletos, Yk, son los datos completos pero desconocidos [7]. En un arreglo lineal de antenas con D fuentes de interés, se tienen D problemas de maximización. Consideraremos que Yl(k) es de la forma: Yl (k ) = v( l )s l (k) + nl (k), l = 1,2 ,...,D . (9) La relación entre los datos incompletos X(k) y los datos completos Yl(k) está dada por la transformación H, definida en (10). X (k ) = D Yl (k ), k = 1,..., K . (10) l =1 Podemos observar que (10) es una transformación lineal por tanto X(k) y Yl(k) son conjuntamente Gaussianas y tenemos que la función log-verosimilitud para Yl(k) es de la misma forma que para X(k), [4]: K 1 Lc (Y : θ , K s ) = −[ln det K Yl + tr[ K yl−1 Yl (k )Yl H (k )]] . (11) N k =1 Una vez definida (11) lo que resta es maximizarla con respecto a ( , Ks), para esto utilizamos el algoritmo EM el cual consta de los siguientes pasos, [4, 7]: Inicialización de los parámetros 292 Encuentro de Investigación en IE, 17—18 Marzo, 2005 Estimar la esperanza de los valores ausentes (datos incompletos), dados los parámetros iniciales y el resto de las observaciones (estimar los valores ausentes) Obtener un nuevo valor de los parámetros, que maximice la función de verosimilitud. Si se cumple que | n+1 - n| < , se detiene, de lo contrario regresa al segundo paso. La inicialización puede darse utilizando una aproximación por otro método como el presentado en [8], o incluso utilizando los valores que nos arroja el algoritmo MUSIC. En forma más detallada, para cada iteración se calcula la esperanza condicionada, de la función de máxima verosimilitud, a los datos observados X y al valor del parámetro (n): Q( | ’(n))= E[ln f(Y: |X, ’(n))]. Donde: ’(n) es la estimación actual de para la n-ésima iteración. (12) En nuestro caso es suficiente que calculemos la esperanza condicionada de la matriz de covarianza de los datos completos CYl ya que es estadísticamente suficiente para inferir los datos, [9]. CYln +1 = E[CYln | K Yln , K Xn , C X ] . (13) El siguiente paso es maximizar (12) con respecto a , para obtener ’(n+1), el cual se utilizará en la siguiente iteración: ’(n+1)=argmax Q( | ’(n)), (14) Así llegamos a sustituir la esperanza condicional de CYl, calculado en el paso anterior, en la función de verosimilitud para los datos completos. A continuación se obtiene el determinante de KYl y se desarrolla KYl-1 para volver a sustituirse en la función de verosimilitud Estos dos pasos se repetirán hasta que: | ’(n+1) – ’(n)| < . (15) Al término de lo cual se asegura que el valor final de ’ maximiza la función de verosimilitud. D. Cota de Cramer-Rao Una vez encontrado el estimador, es necesario verificar que es eficiente, esto se hace a través de la cota de Cramer-Rao (CCR). Y sabiendo que el estimador de máxima verosimilitud es un estimador insesgado [4]. Un estimador insesgado se dice que es eficiente desde el punto de vista estadístico si la covarianza de la estima alcanza la CCR [1, 4, 10]. La cota Cramer-Rao para la matriz de varianza de un estimador insesgado de θ está dado por: Var (θˆ) ≥ J −1 (θ ) , (16) donde J es la Matriz de Información de Fisher (FIM), J( ( = E ∂ log f ( X; ∂ ) 2 = −E ∂2 log f ( X; ∂ 2 ) . (17) Esta cota inferior aplicada al problema de interés nos da una matriz J donde los elementos se dan de la siguiente manera: 293 Encuentro de Investigación en IE, 17—18 Marzo, 2005 J ij = − E ∂2 ∂ i∂ [L x ( ) ] = Ktr K x−1 ( j ) ∂K x ( ) −1 Kx ( ∂( i ) ) ∂K x ( ) ∂m H ( ) −1 + 2 Re Kx ( ∂( j ) ∂( i ) ) ∂m( ) ∂( j ) , como la media es cero J ij = Ktr K x−1 ( ) ∂K x ( ) −1 Kx ( ∂( i ) ) ∂K x ( ) . ∂( j ) (18) III. SIMULACIONES Para la evaluación de las prestaciones de ambos métodos de estimación de DoA, nuestra simulación considera la utilización de un arreglo lineal de antenas de 8 elementos con separación uniforme de 0.5 . Se consideraran 3 fuentes o terminales móviles transmitiendo simultáneamente. Todas las fuentes transmiten con la misma potencia, se establecen las separaciones entre la estación base y terminal móvil o fuente, y frecuencia portadora f=1900 MHz. Para el algoritmo MUSIC se considera el espectro de ruido para estimar el DOA, el cual proporciona mejores resultados que el de señal, [3, 6]. Para el caso del algoritmo MUSIC aplicado a la localización de usuarios de interés, el espectro de ruido es el que se presenta en la Figura 2, los picos mayores indican las posiciones estimadas de las fuentes. En la Figura 2, se considera la estimación de tres terminales móviles en una posición angular de 90°, 115° y 140º, con radio r de separación de 700, 650 y 750 metros respectivamente hacia la estación base. En este caso, el array permite estimar adecuadamente las tres fuentes. Cuantitativamente, se indican los valores de la estimación de las fuentes en la Tabla I Figura 2. Espectro MUSIC Estimado para 3 Fuentes. Del espectro de ruido presentado en la Figura 2, se obtienen los valores numéricos para determinar la posición de cada fuente estimada y se calcula el error. Para determinar la posición de las fuentes en el espectro de ruido, se buscan los D picos más altos. El ángulo en el cual se encuentra ubicado el pico, indica la posición estimada de la fuente. 294 Encuentro de Investigación en IE, 17—18 Marzo, 2005 En la Tabla I se presentan los resultados de la estimación y su error correspondiente. El error en la estimación de las fuentes es pequeño, de alrededor de medio grado y en otros casos de una vigésima parte e inclusive menos. Esta estimación se puede deteriorar en ambientes donde la relación señal a ruido (SNR) es baja, por lo cual, se requieren algoritmos más robustos para efectuar la estimación, tal es el caso de la técnica de máxima verosimilitud. TABLA I ERROR EN LA DETECCIÓN DEL DOA PARA TRES FUENTES UTILIZANDO EL ALGORITMO MUSIC. 3 Fuentes Fuente I Fuente II Fuente III Posición fuentes (°) 90 115 140 θ Estimado (°) 89.95 114.97 139.576 Error (°) 0.0417 0.0243 .4239 Para el estimador de máxima verosimilitud se requiere una inicialización de datos en la etapa del algoritmo EM. Una opción es utilizar los datos generados por el algoritmo MUSIC. Un parámetro utilizado para evaluar la eficiencia del estimador de máxima verosimilitud es el error cuadrático medio. La expresión utilizada para el cálculo del RMSE es: RMSEθi = 1 k k k =1 2 (θ i − θˆik ) , i = 1,2,..., d (19) La Figura 3 nos muestra el error cuadrático medio de la estimación de una fuente, según varía el SNR. De los valores de SNR considerados, el error cuadrático medio máximo es menor a un décimo de grado, para un valor elevado de SNR, el error disminuye a un valor aproximado de una centésima de grado. Figura 3. Error RMSE en la estimación ML del DoA de una fuente. De acuerdo a estas simulaciones es necesario hacer notar la importancia de la inicialización a fin de que el algoritmo EM pueda converger rápidamente hacia los valores máximos estimados, de lo contrario esto puede ser contraproducente. Una mala inicialización retarda el proceso de búsqueda del algoritmo, por lo tanto produce que el error aumente. El método de máxima verosimilitud permite obtener resultados cercanos al óptimo con un número de observaciones pequeño. Este algoritmo se aproxima a la solución en forma asintótica. Encuentro de Investigación en IE, 17—18 Marzo, 2005 295 IV. CONCLUSIONES Y TRABAJO FUTURO Se ha modelado y simulado los métodos de Máxima Verosimilitud y MUSIC para la detección de DoA en campo cercano. El primer método presenta ventajas en su eficiencia (i.e. Resolución, eficiencia, ambientes adversos), con respecto a las limitaciones de los métodos de subespacio (MUSIC). El modelo que se consideró en el problema, hace referencia a señales aleatorias, lo cual nos lleva a utilizar el estimador incondicional de ML. Es importante tener valores de inicialización óptimos a fin de asegurar la convergencia rápida hacia los valores máximos estimados. Además es importante analizar la eficiencia de nuestro estimador a través de la Cota Cramer-Rao, asegurando que no exista otro mejor, de esta manera podemos asignar una validez y soporte a nuestros cálculos. Hecho esto podemos concluir que los métodos de máxima verosimilitud son estadísticamente más eficientes que los métodos de subespacio. RECONOCIMIENTOS Este trabajo fue realizado gracias al apoyo de CONACYT mediante el proyecto U39514-Y REFERENCIAS [1] Stoica, P. y Nehorai, A.: MUSIC, Maximum Likelihood, and Cramer-Rao Bound. IEEE Trans. On Acoustics, Speech, and Signal Processing, vol. 37, no. 5, pp. 720-741, May 1989 [2] Ralph O. Schmidt, Multiple Emitter Location and Signal Parameter Estimation, IEEE Transactions on Antennas and Propagation, 34, 3, (Marzo, 1986), 276-280. [3] Arceo José, Bonilla Darío, Covarrubias David: Estimación del DOA con Arrays Optimizados de Separación No-Uniforme. 2004, XIX congreso de Instrumentación SOMI, memorias en CD [4] Van Trees, Harry L. Optimum array procesing. Part IV, Wiley-interscience, Canada 2002. [5] Jean-Pierre Delmas, Yann Meurisse, Robustness of narrowband DOA algorithms with respect to signal bandwidth, Elsevier-Signal Processing, 83, 3, (Marzo, 2003), 493-510. [6] Joseph C. Liberti Jr, Theodore S. Rappaport, Smart Antennas for Wireless Communications: IS-95 and Third Generation CDMA Applications, (Prentice Hall, New Jersey), 253-284, (1999). [7] Miller, M. I., Fuhrmann, D. R.: Maximum-Likelihood Narrow-Band Direction Finding and the EM Algorithm. IEEE Trans. Acoustics. Speech, and Signal Processing, vol. 38, pp. 1560–1577, Sept. 1990 [8] Ziskind and M.Wax, “Maximum Likelihood Localization of Multiple sources by Alternating Projection” IEEE Trans. on Acoustics, speech, and Signal processing, vol. 36, No.10 pp 1553-1560, Oct. 1998. [9] E. Çekli, H. A. Çirpan: Unconditional Maximum likelihood Approach for localization of Near-Field. AEÜ Int. J. of Electron. and Commun., vol. 57, no. 1, pp. 9–15, 2003. [10] Hochwald, B. and Nehorai, A.: Concentrated Cramer Rao Bound Expression. IEEE Trans. on Information Theory, vol. 40, pp. 363– 371, March 1994.