modelos lineales mixtos generalizados: estudio de los

Transcripción

modelos lineales mixtos generalizados: estudio de los
XI Congreso Galego de Estatística e Investigación de Operacións
A Coruña, 242526 de outubro de 2013
MODELOS LINEALES MIXTOS GENERALIZADOS: ESTUDIO DE LOS
INCENDIOS EN GALICIA
1
1
2
Miguel Boubeta Martínez , María José Lombardía Cortiña , Domingo Morales González y
3
Manuel Francisco Marey Pérez
1
Departamento de Matemáticas. Universidade da Coruña.
2
Centro de Investigación Operativa. Universidad Miguel Hernández de Elche.
3
Departamento de Enxeñería Agroforestal. Universidade de Santiago de Compostela.
RESUMEN
Los modelos lineales mixtos generalizados ofrecen una metodología estadística exible capaz de modelizar la dependencia dentro de un mismo nivel o cluster, siendo esto
de gran utilidad en las aplicaciones a datos reales. El objetivo de este estudio consiste
en ajustar el número de incendios ocurrido en la comunidad autónoma de Galicia por
área forestal durante el verano del 2007. Para ello abordaremos el problema desde la
perspectiva de los modelos mixtos y los modelos de Poisson clásicos.
Palabras y frases clave: Bootstrap, efecto aleatorio, empirical best predictor, error
cuadrático medio, modelo lineal mixto generalizado, regresión de Poisson.
INTRODUCCIÓN
Los incendios constituyen una componente importante en muchos ecosistemas forestales, dada
su gran inuencia en las consecuencias ecológicas y las funciones económicas del bosque. A su
vez experimentan comportamientos muy distintos según los diferentes ámbitos en los que se puedan localizar, variando en función de variables naturales y socioeconómicas ligadas a los paisajes
forestales. La necesidad de anticiparse al efecto de estas ocurrencias es cada vez mayor para los
planicadores, pues conocer con un razonable plazo de tiempo el número de incendios o la supercie quemada constituye un avance muy importante para establecer mecanismos más ecientes
para la lucha contra el fuego.
La modelización de los incendios forestales mediante metodologías clásicas a niveles de desagregación geográca inferiores a provincia o distrito presenta importantes inconvenientes, pues
los estimadores directos poseen un elevado error. En estos casos debemos recurrir a técnicas de
estimación en áreas pequeñas o a métodos de estimación indirectos.
En este trabajo estudiaremos los incendios forestales desde la perspectiva de los modelos lineales mixtos generalizados (GLMMs), siendo éstos una generalización de los modelos lineales (LMs)
y los modelos lineales generalizados (GLMs), que permiten incorporar efectos aleatorios, efectos
jerárquicos, medidas repetidas, correlaciones espaciales y estimación de áreas pequeñas. La estimación de los parámetros en este contexto es tediosa puesto que la logverosimilitud marginal se
representa por una integral que no puede ser calculada explícitamente. La mayoría de los métodos
propuestos en la literatura para resolver este problema se reeren a la linealización de Taylor y/o
el método de Laplace para aproximaciones integrales. Otros métodos utilizados son los algoritmos
EM asistidos por métodos de Monte-Carlo o el algoritmo PQL combinado con la aproximación
Gausiana de la densidad marginal.
Concretamente, modelizaremos el recuento de los incendios gallegos en verano del
2007
por
área forestal. Para ello utilizaremos modelos de regresión de Poisson con efectos de área, donde la
distribución de la variable objetivo
yd ,
condicionada al efecto aleatorio
yd |ud ∼ P oiss(νd pd ),
1
d = 1, . . . , D,
ud ,
siendo
ud ∼ N(0, ϕ),
es
con
νd
la variable de exposición o tamaño y
d el índice del área forestal (en Galicia se tienen D = 63
áreas). Para el parámetro natural suponemos que
ηd = log µd = log νd + xd β + ud ,
d = 1, . . . , D.
Las covariables utilizadas en este estudio son de tipo meteorológico (temperatura media, precipitación acumulada y días sin llover), demográco (población), socioeconómico (censo agrario,
o
catastro y mapa forestal español n 4) e infraestructuras (número de entidades de población y km.
de carreteras construidas).
Estimaremos el número de incendios por área forestal a partir del modelo de regresión de
Poisson obtenido y su error de estimación.
2