modelos lineales mixtos generalizados: estudio de los
Transcripción
modelos lineales mixtos generalizados: estudio de los
XI Congreso Galego de Estatística e Investigación de Operacións A Coruña, 242526 de outubro de 2013 MODELOS LINEALES MIXTOS GENERALIZADOS: ESTUDIO DE LOS INCENDIOS EN GALICIA 1 1 2 Miguel Boubeta Martínez , María José Lombardía Cortiña , Domingo Morales González y 3 Manuel Francisco Marey Pérez 1 Departamento de Matemáticas. Universidade da Coruña. 2 Centro de Investigación Operativa. Universidad Miguel Hernández de Elche. 3 Departamento de Enxeñería Agroforestal. Universidade de Santiago de Compostela. RESUMEN Los modelos lineales mixtos generalizados ofrecen una metodología estadística exible capaz de modelizar la dependencia dentro de un mismo nivel o cluster, siendo esto de gran utilidad en las aplicaciones a datos reales. El objetivo de este estudio consiste en ajustar el número de incendios ocurrido en la comunidad autónoma de Galicia por área forestal durante el verano del 2007. Para ello abordaremos el problema desde la perspectiva de los modelos mixtos y los modelos de Poisson clásicos. Palabras y frases clave: Bootstrap, efecto aleatorio, empirical best predictor, error cuadrático medio, modelo lineal mixto generalizado, regresión de Poisson. INTRODUCCIÓN Los incendios constituyen una componente importante en muchos ecosistemas forestales, dada su gran inuencia en las consecuencias ecológicas y las funciones económicas del bosque. A su vez experimentan comportamientos muy distintos según los diferentes ámbitos en los que se puedan localizar, variando en función de variables naturales y socioeconómicas ligadas a los paisajes forestales. La necesidad de anticiparse al efecto de estas ocurrencias es cada vez mayor para los planicadores, pues conocer con un razonable plazo de tiempo el número de incendios o la supercie quemada constituye un avance muy importante para establecer mecanismos más ecientes para la lucha contra el fuego. La modelización de los incendios forestales mediante metodologías clásicas a niveles de desagregación geográca inferiores a provincia o distrito presenta importantes inconvenientes, pues los estimadores directos poseen un elevado error. En estos casos debemos recurrir a técnicas de estimación en áreas pequeñas o a métodos de estimación indirectos. En este trabajo estudiaremos los incendios forestales desde la perspectiva de los modelos lineales mixtos generalizados (GLMMs), siendo éstos una generalización de los modelos lineales (LMs) y los modelos lineales generalizados (GLMs), que permiten incorporar efectos aleatorios, efectos jerárquicos, medidas repetidas, correlaciones espaciales y estimación de áreas pequeñas. La estimación de los parámetros en este contexto es tediosa puesto que la logverosimilitud marginal se representa por una integral que no puede ser calculada explícitamente. La mayoría de los métodos propuestos en la literatura para resolver este problema se reeren a la linealización de Taylor y/o el método de Laplace para aproximaciones integrales. Otros métodos utilizados son los algoritmos EM asistidos por métodos de Monte-Carlo o el algoritmo PQL combinado con la aproximación Gausiana de la densidad marginal. Concretamente, modelizaremos el recuento de los incendios gallegos en verano del 2007 por área forestal. Para ello utilizaremos modelos de regresión de Poisson con efectos de área, donde la distribución de la variable objetivo yd , condicionada al efecto aleatorio yd |ud ∼ P oiss(νd pd ), 1 d = 1, . . . , D, ud , siendo ud ∼ N(0, ϕ), es con νd la variable de exposición o tamaño y d el índice del área forestal (en Galicia se tienen D = 63 áreas). Para el parámetro natural suponemos que ηd = log µd = log νd + xd β + ud , d = 1, . . . , D. Las covariables utilizadas en este estudio son de tipo meteorológico (temperatura media, precipitación acumulada y días sin llover), demográco (población), socioeconómico (censo agrario, o catastro y mapa forestal español n 4) e infraestructuras (número de entidades de población y km. de carreteras construidas). Estimaremos el número de incendios por área forestal a partir del modelo de regresión de Poisson obtenido y su error de estimación. 2