Evaluación del Estimador de Máxima Verosimilitud Aplicado a la

Transcripción

Evaluación del Estimador de Máxima Verosimilitud Aplicado a la
Encuentro de Investigación en IE, 17—18 Marzo, 2005
Encuentro de Investigación en Ingeniería Eléctrica
Zacatecas, Zac, Marzo 17 —18, 2005
Evaluación del Estimador de Máxima
Verosimilitud Aplicado a la Localización de
Fuentes en Comunicaciones Móviles Celulares
Darío Bonilla1, David Covarrubias1, José G. Arceo1,2
Centro de Investigación Científica y de Educación Superior de Ensenada
Grupo de Comunicaciones Inalámbricas, Km. 107 Carretera Tijuana-Ensenada. Ensenada, Baja
California, 22860.
TEL: (646)1750500, ext. 25347, 25438, 25429, correo-e:[dbonilla, dacoro, arceojg]@cicese.mx
1
2
Centro de Investigación y Desarrollo de Tecnología Digital-IPN
Av. del Parque # 1310, Tijuana, BC, 22510.
correo-e: [email protected],
Resumen — La estimación de la Dirección de Arribo, DoA (Direction of Arrival) de fuentes o
terminales móviles en sistemas de comunicaciones móviles celulares, necesita de métodos de estimación
con altas prestaciones. En este trabajo se evalúan las prestaciones de los métodos de estimación del
DoA de las señales de interés, en un entorno de comunicaciones celulares. Se utilizan arreglos lineales
de antenas para los métodos de Inferencia Estadística (Máxima Verosimilitud, ML) y el algoritmo
MUSIC, el cual está basado en técnicas de subespacio. Para eliminar los problemas de maximización
no lineales, se utiliza el método iterativo Maximización de la Esperanza (EM) para el cálculo de la
estimación de máxima verosimilitud. Dados estos métodos de estimación del DoA, se evalúa el error de
estimación y se obtiene el error cuadrático medio (RMSE) contra la relación señal a ruido (SNR).
Abstract. The estimation of direction of Arrival (DoA) of narrow band sources for cellular mobile
communications systems requires high performance estimation methods. In this work, we evaluate the
characteristics and performance of the DoA estimation methods, for a mobile cellular communications
environment. We use a Uniform Linear Array (ULA) of antennas for the Maximum Likelihood
Estimator (ML) and MUSIC Algorithm, which is based on subspace techniques. To avoid the nonlinear
maximization problems, we used the Expectation/Maximization (EM) iterative method to compute the
maximum likelihood estimate. Given these DoA estimation methods, we evaluate the estimation error
and the root mean squared error (RMSE) against the signal to noise ratio (SNR).
Palabras clave —Antenas Inteligentes, Dirección de Arribo, Inferencia Estadística, Máxima
Verosimilitud, Music.
D
I. INTRODUCCIÓN
ENTRO de la tecnología de Antenas Inteligentes en comunicaciones móviles celulares, la
detección de la Dirección de Arribo (DoA) de múltiples terminales móviles de banda angosta,
es uno de los temas de mayor investigación en la actualidad. Para este propósito se han
estudiado distintos métodos, de los cuales los basados en sub-espacios son de los más utilizados
hasta el momento. Pensando en algoritmos que proporcionen una mejor separación de fuentes,
menor error y buena eficiencia en ambientes ruidosos, es necesario utilizar algoritmos mejores.
Dadas las cualidades de los métodos de inferencia estadística, tal como la consistencia, sesgo y de
288
Encuentro de Investigación en IE, 17—18 Marzo, 2005
289
varianza mínima, es interesante considerar los métodos de Máxima Verosimilitud (ML) para el
problema de detección del DoA en sistemas de comunicaciones celulares. En particular, sobre los
métodos anteriores, presentan ventajas tanto estadísticas como en cuanto a prestaciones para los
nuevos sistemas; esto ya que pueden ser aplicables a sistemas con señales de banda ancha, con
mayor número de usuarios, e incluso bajo ambientes muy agresivos donde se tenga una baja
Relación Señal a Ruido (SNR).
Dado que se han demostrado las ventajas estadísticas de estos métodos en [3], es importante
evaluar las prestaciones de estos métodos considerando el costo computacional y el error en la
detección del DoA de las señales de las fuentes de interés. Otro método que se eligió fue el
algoritmo MUSIC propuesto por Schimidt [2], el cual considera la geometría del arreglo de antenas
y que se encuentra en la clase de algoritmos basados en la técnica de subespacios. Se utiliza un
modelo de señal donde se considera la esfericidad del frente de onda, a fin de ser más realista y que
se pueda ajustar a cualquier entorno celular, sea micro o macrocelular o incluso para interiores. La
utilización de este modelo también sirve en el caso del estimador de Máxima Verosimilitud, para
estimar la distancia entre la estación base y los terminales móviles.
El cálculo de la estimación ML genera problemas de optimización no lineales y tiene que ser
resuelto por métodos iterativos. Para esto se emplea el algoritmo de Maximización de la Esperanza
(EM) el cual es un método iterativo diseñado para casos donde existen datos incompletos. Aunque
este algoritmo nos llevará a los parámetros estimados, necesita una inicialización adecuada a fin de
que el algoritmo pueda converger rápidamente hacia éstos. Por último, para analizar el
comportamiento asintótico de la eficiencia del estimador se utiliza la Cota de Cramer-Rao (CRB)
como un indicador de su desempeño. De esta forma, se puede observar la eficiencia del estimador.
En la sección II se describe el modelado del Estimador de Máxima Verosimilitud, la cota de
Cramer- Rao (CRB) y el algoritmo de Maximización de la Esperanza (EM), todos ellos aplicados a
la localización de fuentes de interés en las comunicaciones móviles celulares, así como las
consideraciones más importantes de este método. La sección III muestra los resultados de las
simulaciones de ambos algoritmos, en cuanto a sus prestaciones utilizando arreglos de antenas
lineales de 8 elementos con separación uniforme [3]. Por último, en la sección IV se presentan las
conclusiones de este trabajo.
II. MÉTODO DE ESTIMACIÓN DE MÁXIMA VEROSIMILITUD APLICADO A COMUNICACIONES
MÓVILES CELULARES
El método basado en máxima verosimilitud (ML) ofrece ventajas estadísticas [3] en cuanto a
consistencia, sesgo y mínima varianza, dado un entorno.
A. Modelo de la señal
El modelo para construir la matriz de datos x(t), contiene las K muestras de D fuentes que inciden
en el arreglo, D es el índice de fuentes. El arreglo está compuesto por M elementos de antena,
distribuidos sobre el eje x, según se indica en la Figura 1. Cada elemento tiene un peso Im, con una
separación entre elementos d en términos de longitud de onda. Por simplicidad, se asignan
ganancias Im unitarias.
290
Encuentro de Investigación en IE, 17—18 Marzo, 2005
Y
Fuente
r
sθ
co
dp
I1
θ
I2
I3
I m-1
I4
Im
X, θ=0º
d
Figura 1. Modelo de datos, distribución de elementos del array, frente de onda esférico.
La salida de cada elemento del array se representa por (1), donde el término exponencial de cada
elemento conforma el vector de dirección v del arreglo (2), el cual establece la diferencia de fase
entre elementos, q es el índice de fuentes. El cambio de fase se representa por dos componentes, q
que representa la componente de fase de campo lejano y q que es el término para aproximar el
campo cercano dado el frente de onda esférico. La forma Matricial se representa en (3) donde el
vector V está constituido por los vectores dirección v a cada una de las q fuentes, s es la señal y n el
vector de ruido
x m ( t) =
D
e
j ( µ q m +ζ q m 2 )
s q (t ) + n(t ) ,
(1)
q =1
v( µ q , ζ q ) = e
Donde:
µq = −
2πd
λ
j ( µ q +ζ q 2 )
sin(θ q ) , ζ q =
,Λ e
j ( µ q M +ζ q M 2 )
T
.
(2)
πd 2
cos 2 θ q ,
λrq
X(k) = V ( µ , ζ ) s (k ) + N (k ) ,
k = 1,2 ,...,K .
(3)
Las fuentes radiantes son omni-direccionales, representadas en magnitud y fase por
s (t ) = α (t ) exp − j 2πft , donde α (t ) = 1/ r ε son las pérdidas por propagación, ε es el exponente de
pérdidas y f la frecuencia de interés. En t=r/c+kT se considera el tiempo de propagación y el
muestreo, en el instante k con periodo T y N(k) es el ruido, [4, 5, 6].
Se asume que la señal s(t) y el ruido n(t) están incorrelacionados para cualquier t, y que ambos
poseen una función de densidad de probabilidad (pdf) compleja gaussiana con media igual a cero.
Esto nos lleva a que los datos observados X, son un vector complejo Gaussiano con media 0 y con
matriz de covarianza Kx( ). La señal de ruido Gaussiano tiene una desviación 2 conocida, [4].
B. Estimador Incondicional de Máxima Verosimilitud
Primero es necesario establecer la función de Máxima verosimilitud, así consideramos que la
información traída por una observación x, acerca del parámetro , está completamente contenida en
la función de densidad de probabilidad p(x). Donde p(x) para un arreglo de M elementos de antena
es de la forma [4]:
1
p x|θ ( x) =
exp[−( x H − m xH (θ )) K x−1 (θ )( x − m x (θ ))] .
(4)
det[πK x (θ )]
La pdf conjunta para varias observaciones sucesivas, dado que cada observación x es
independiente e idénticamente distribuida (i.i.d.), y que mx( ) es igual a cero, queda entonces:
Encuentro de Investigación en IE, 17—18 Marzo, 2005
p x1 , x2 ,..., xk |θ ( x) =
K
∏ det[π
k =1
1
exp[− X kH K x−1 (θ ) X k ] .
K x (θ )]
N
291
(5)
Como podemos ver, esta expresión es algo difícil de manejar, por lo cual utilizamos la función
logarítmica (log-verosimilitud). La función log-verosimilitud se define como el logaritmo de la pdf
conjunta de las observaciones de la siguiente manera:
L x (θ ) = ln p x1 , x2 ,..., xk |θ ( x) ,
L x (θ ) = − ln det[ K x (θ )] +
(6)
1
K
K
k =1
X kH K x−1 (θ ) X k ,
(7)
Y por las propiedades de la matriz de covarianza se puede reducir de (7) a (8):
[
[
]
Lx (θ) = − lndet[Kx (θ)]+ tr Kx−1(θ) • Cx .
(8)
Donde Cx es la matriz de correlación del muestreo.
Dada la función de verosimilitud logarítmica Lx( ), ahora hay que encontrar el parámetro ’ML el
cual maximiza dicha función. Maximizar esta expresión se puede complicar bastante por problemas
no lineales, principalmente cuando D crece, por lo cual se deben utilizar técnicas eficientes para
resolver el problema. El método utilizado es el algoritmo EM (Maximización de la Esperanza)
diseñado para problemas de maximización donde se tiene pérdida de datos y alta complejidad
matemática, el cual es un método iterativo.
C. Algoritmo iterativo EM de maximización de la esperanza
Se asume que existen dos espacios muéstrales Xk={x1,…xk} y Yk={y1,…yk}, para k=1…K, los datos
Xk observados se consideran incompletos, Yk, son los datos completos pero desconocidos [7]. En un
arreglo lineal de antenas con D fuentes de interés, se tienen D problemas de maximización.
Consideraremos que Yl(k) es de la forma:
Yl (k ) = v( l )s l (k) + nl (k),
l = 1,2 ,...,D .
(9)
La relación entre los datos incompletos X(k) y los datos completos Yl(k) está dada por la
transformación H, definida en (10).
X (k ) =
D
Yl (k ),
k = 1,..., K .
(10)
l =1
Podemos observar que (10) es una transformación lineal por tanto X(k) y Yl(k) son conjuntamente
Gaussianas y tenemos que la función log-verosimilitud para Yl(k) es de la misma forma que para
X(k), [4]:
K
1
Lc (Y : θ , K s ) = −[ln det K Yl + tr[ K yl−1 Yl (k )Yl H (k )]] .
(11)
N
k =1
Una vez definida (11) lo que resta es maximizarla con respecto a ( , Ks), para esto utilizamos el
algoritmo EM el cual consta de los siguientes pasos, [4, 7]:
Inicialización de los parámetros
292
Encuentro de Investigación en IE, 17—18 Marzo, 2005
Estimar la esperanza de los valores ausentes (datos incompletos), dados los parámetros
iniciales y el resto de las observaciones (estimar los valores ausentes)
Obtener un nuevo valor de los parámetros, que maximice la función de verosimilitud.
Si se cumple que | n+1 - n| < , se detiene, de lo contrario regresa al segundo paso.
La inicialización puede darse utilizando una aproximación por otro método como el presentado
en [8], o incluso utilizando los valores que nos arroja el algoritmo MUSIC.
En forma más detallada, para cada iteración se calcula la esperanza condicionada, de la función
de máxima verosimilitud, a los datos observados X y al valor del parámetro (n):
Q( | ’(n))= E[ln f(Y: |X, ’(n))].
Donde: ’(n) es la estimación actual de para la n-ésima iteración.
(12)
En nuestro caso es suficiente que calculemos la esperanza condicionada de la matriz de
covarianza de los datos completos CYl ya que es estadísticamente suficiente para inferir los datos,
[9].
CYln +1 = E[CYln | K Yln , K Xn , C X ] .
(13)
El siguiente paso es maximizar (12) con respecto a , para obtener ’(n+1), el cual se utilizará en
la siguiente iteración:
’(n+1)=argmax Q( | ’(n)),
(14)
Así llegamos a sustituir la esperanza condicional de CYl, calculado en el paso anterior, en la
función de verosimilitud para los datos completos. A continuación se obtiene el determinante de KYl
y se desarrolla KYl-1 para volver a sustituirse en la función de verosimilitud
Estos dos pasos se repetirán hasta que:
| ’(n+1) – ’(n)| < .
(15)
Al término de lo cual se asegura que el valor final de ’ maximiza la función de verosimilitud.
D. Cota de Cramer-Rao
Una vez encontrado el estimador, es necesario verificar que es eficiente, esto se hace a través de la
cota de Cramer-Rao (CCR). Y sabiendo que el estimador de máxima verosimilitud es un estimador
insesgado [4]. Un estimador insesgado se dice que es eficiente desde el punto de vista estadístico si
la covarianza de la estima alcanza la CCR [1, 4, 10].
La cota Cramer-Rao para la matriz de varianza de un estimador insesgado de θ está dado por:
Var (θˆ) ≥ J −1 (θ ) ,
(16)
donde J es la Matriz de Información de Fisher (FIM),
J( ( = E
∂
log f ( X;
∂
)
2
= −E
∂2
log f ( X;
∂ 2
)
.
(17)
Esta cota inferior aplicada al problema de interés nos da una matriz J donde los elementos se dan
de la siguiente manera:
293
Encuentro de Investigación en IE, 17—18 Marzo, 2005
J ij = − E
∂2
∂ i∂
[L x ( ) ] = Ktr K x−1 (
j
)
∂K x ( ) −1
Kx (
∂( i )
)
∂K x ( )
∂m H ( ) −1
+ 2 Re
Kx (
∂( j )
∂( i )
) ∂m( )
∂(
j
)
,
como la media es cero
J ij = Ktr K x−1 (
)
∂K x ( ) −1
Kx (
∂( i )
)
∂K x ( )
.
∂( j )
(18)
III. SIMULACIONES
Para la evaluación de las prestaciones de ambos métodos de estimación de DoA, nuestra
simulación considera la utilización de un arreglo lineal de antenas de 8 elementos con separación
uniforme de 0.5 . Se consideraran 3 fuentes o terminales móviles transmitiendo simultáneamente.
Todas las fuentes transmiten con la misma potencia, se establecen las separaciones entre la estación
base y terminal móvil o fuente, y frecuencia portadora f=1900 MHz. Para el algoritmo MUSIC se
considera el espectro de ruido para estimar el DOA, el cual proporciona mejores resultados que el
de señal, [3, 6].
Para el caso del algoritmo MUSIC aplicado a la localización de usuarios de interés, el espectro de
ruido es el que se presenta en la Figura 2, los picos mayores indican las posiciones estimadas de las
fuentes.
En la Figura 2, se considera la estimación de tres terminales móviles en una posición angular de
90°, 115° y 140º, con radio r de separación de 700, 650 y 750 metros respectivamente hacia la
estación base. En este caso, el array permite estimar adecuadamente las tres fuentes.
Cuantitativamente, se indican los valores de la estimación de las fuentes en la Tabla I
Figura 2. Espectro MUSIC Estimado para 3 Fuentes.
Del espectro de ruido presentado en la Figura 2, se obtienen los valores numéricos para determinar
la posición de cada fuente estimada y se calcula el error. Para determinar la posición de las fuentes
en el espectro de ruido, se buscan los D picos más altos. El ángulo en el cual se encuentra ubicado
el pico, indica la posición estimada de la fuente.
294
Encuentro de Investigación en IE, 17—18 Marzo, 2005
En la Tabla I se presentan los resultados de la estimación y su error correspondiente. El error en la
estimación de las fuentes es pequeño, de alrededor de medio grado y en otros casos de una vigésima
parte e inclusive menos. Esta estimación se puede deteriorar en ambientes donde la relación señal a
ruido (SNR) es baja, por lo cual, se requieren algoritmos más robustos para efectuar la estimación,
tal es el caso de la técnica de máxima verosimilitud.
TABLA I
ERROR EN LA DETECCIÓN DEL DOA PARA TRES FUENTES UTILIZANDO EL ALGORITMO MUSIC.
3 Fuentes
Fuente I
Fuente II
Fuente III
Posición fuentes (°)
90
115
140
θ Estimado (°)
89.95
114.97
139.576
Error (°)
0.0417
0.0243
.4239
Para el estimador de máxima verosimilitud se requiere una inicialización de datos en la etapa del
algoritmo EM. Una opción es utilizar los datos generados por el algoritmo MUSIC. Un parámetro
utilizado para evaluar la eficiencia del estimador de máxima verosimilitud es el error cuadrático
medio. La expresión utilizada para el cálculo del RMSE es:
RMSEθi =
1
k
k
k =1
2
(θ i − θˆik ) , i = 1,2,..., d
(19)
La Figura 3 nos muestra el error cuadrático medio de la estimación de una fuente, según varía el
SNR. De los valores de SNR considerados, el error cuadrático medio máximo es menor a un décimo
de grado, para un valor elevado de SNR, el error disminuye a un valor aproximado de una
centésima de grado.
Figura 3. Error RMSE en la estimación ML del DoA de una fuente.
De acuerdo a estas simulaciones es necesario hacer notar la importancia de la inicialización a fin
de que el algoritmo EM pueda converger rápidamente hacia los valores máximos estimados, de lo
contrario esto puede ser contraproducente. Una mala inicialización retarda el proceso de búsqueda
del algoritmo, por lo tanto produce que el error aumente. El método de máxima verosimilitud
permite obtener resultados cercanos al óptimo con un número de observaciones pequeño. Este
algoritmo se aproxima a la solución en forma asintótica.
Encuentro de Investigación en IE, 17—18 Marzo, 2005
295
IV. CONCLUSIONES Y TRABAJO FUTURO
Se ha modelado y simulado los métodos de Máxima Verosimilitud y MUSIC para la detección de
DoA en campo cercano. El primer método presenta ventajas en su eficiencia (i.e. Resolución,
eficiencia, ambientes adversos), con respecto a las limitaciones de los métodos de subespacio
(MUSIC). El modelo que se consideró en el problema, hace referencia a señales aleatorias, lo cual
nos lleva a utilizar el estimador incondicional de ML. Es importante tener valores de inicialización
óptimos a fin de asegurar la convergencia rápida hacia los valores máximos estimados. Además es
importante analizar la eficiencia de nuestro estimador a través de la Cota Cramer-Rao, asegurando
que no exista otro mejor, de esta manera podemos asignar una validez y soporte a nuestros cálculos.
Hecho esto podemos concluir que los métodos de máxima verosimilitud son estadísticamente más
eficientes que los métodos de subespacio.
RECONOCIMIENTOS
Este trabajo fue realizado gracias al apoyo de CONACYT mediante el proyecto U39514-Y
REFERENCIAS
[1]
Stoica, P. y Nehorai, A.: MUSIC, Maximum Likelihood, and Cramer-Rao Bound. IEEE Trans. On Acoustics, Speech, and Signal
Processing, vol. 37, no. 5, pp. 720-741, May 1989
[2] Ralph O. Schmidt, Multiple Emitter Location and Signal Parameter Estimation, IEEE Transactions on Antennas and Propagation,
34, 3, (Marzo, 1986), 276-280.
[3] Arceo José, Bonilla Darío, Covarrubias David: Estimación del DOA con Arrays Optimizados de Separación No-Uniforme. 2004,
XIX congreso de Instrumentación SOMI, memorias en CD
[4] Van Trees, Harry L. Optimum array procesing. Part IV, Wiley-interscience, Canada 2002.
[5] Jean-Pierre Delmas, Yann Meurisse, Robustness of narrowband DOA algorithms with respect to signal bandwidth, Elsevier-Signal
Processing, 83, 3, (Marzo, 2003), 493-510.
[6] Joseph C. Liberti Jr, Theodore S. Rappaport, Smart Antennas for Wireless Communications: IS-95 and Third Generation CDMA
Applications, (Prentice Hall, New Jersey), 253-284, (1999).
[7] Miller, M. I., Fuhrmann, D. R.: Maximum-Likelihood Narrow-Band Direction Finding and the EM Algorithm. IEEE Trans.
Acoustics. Speech, and Signal Processing, vol. 38, pp. 1560–1577, Sept. 1990
[8] Ziskind and M.Wax, “Maximum Likelihood Localization of Multiple sources by Alternating Projection” IEEE Trans. on Acoustics,
speech, and Signal processing, vol. 36, No.10 pp 1553-1560, Oct. 1998.
[9] E. Çekli, H. A. Çirpan: Unconditional Maximum likelihood Approach for localization of Near-Field. AEÜ Int. J. of Electron. and
Commun., vol. 57, no. 1, pp. 9–15, 2003.
[10] Hochwald, B. and Nehorai, A.: Concentrated Cramer Rao Bound Expression. IEEE Trans. on Information Theory, vol. 40, pp. 363–
371, March 1994.