SciELO - Scientific Electronic Library Online

 
vol.43 número1Variabilidad de la precipitacion en el altiplano Argentino: Incidencia de la transición climática 1976/1977 y del fenómeno El Niño - oscilación del sur en el Noroeste Argentino índice de autoresíndice de assuntospesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

  • Não possue artigos citadosCitado por SciELO

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


Meteorologica

versão On-line ISSN 1850-468X

Meteorologica vol.43 no.1 Ciudad Autónoma de Buenos Aires jun. 2018

 

ARTíCULOS ORIGINALES

Generación de pronósticos probabilísticos de visibilidad a partir de pronósticos numéricos retrospectivos y observaciones

 

Juan José Ruiz1,2,3, Tamara Schonholz4 y Celeste Saulo1,2,3,4

1 Centro de Investigaciones del Mar y la Atmósfera (CONICET-UBA)
2 UMI-IFAECI (CNRS-UBA-CONICET)
3 Departamento de Ciencias de la Atmósfera y los Océanos (FCEyN-UBA)
4 Servicio Meteorológico Nacional
Dirección Electrónica: jruiz@cima.fcen.uba.ar

Manuscrito recibido el 2 de febrero de 2017,
en su versión final el 17 de mayo de 2017


RESUMEN

Los eventos de visibilidad reducida producen complicaciones y accidentes en el transporte aéreo y terrestre. Por tal motivo, su pronóstico ayuda a reducir las pérdidas materiales y humanas asociadas a dichos fenómenos. El presente estudio contribuye a mejorar el pronóstico de visibilidad mediante un modelo dinámico-estadístico que produce pronósticos probabilísticos de visibilidad. Dicho modelo está basado en la combinación de un conjunto de pronósticos retrospectivos globales y observaciones in-situ. El modelo propuesto es utilizado para generar pronósticos probabilísticos de visibilidad para diferentes umbrales de visibilidad en el aeropuerto de Ezeiza en el período comprendido entre diciembre de 1984 y enero de 2011. Los resultados de la evaluación muestran que la combinación de los datos observados con las variables pronosticadas por el modelo dinámico produce pronósticos que tienen mejor desempeño que los que utilizan solo observaciones o solo las variables pronosticadas por el modelo dinámico. Asimismo se encontró que considerar la variación de los errores sistemáticos del modelo, con la época del año permite introducir mejoras adicionales en el desempeño del pronóstico probabilístico.

Palabras clave: Pronósticos retrospectivos; Visibilidad; Pronósticos probabilísticos.

ABSTRACT

Visibility probabilistic forecasts based on numerical retrospective forecasts and observations

Low visibility events are sometimes associated with delays and accidents related with air and land transportation. An accurate forecast of low visibility events can help to reduce the economical and human life losses associated with this phenomenon. This work contributes to the improvement of visibility forecast proposing a dynamic-statistical model that generates probabilistic visibility forecasts. This model combines retrospective forecast generated with a global model and in-situ observations. The proposed model is used to generate probabilistic visibility forecasts for Ezeiza airport between December 1984 and January 2011. Results show that combining in-situ observations and numerical model outputs increases the skill of the probabilistic forecasts with respect to the probabilistic forecast that are based only on observations or only on numerical model outputs. Considering the dependence of systematic numerical model errors with the time of the year produce an additional increase in the forecast skill.

Keywords: Retrospective forecasts; Visibility; Probabilistic forecasts.


 

1. INTRODUCCIóN

El impacto de los eventos de visibilidad reducida se ha ido incrementando en las últimas décadas dado el vertiginoso aumento del tránsito aéreo, marino y terrestre. La reducción de la visibilidad en la atmósfera y los cambios en la visibilidad no sólo pueden producir demoras en el transporte, sino que también son causa frecuente de accidentes, que causan pérdidas de vidas humanas y materiales. En el caso particular de la navegación aérea, la visibilidad reducida en los aeropuertos, puede producir cuantiosas pérdidas materiales debido a la cancelación, demora de vuelos y la necesidad de incorporar combustible extra en las aeronaves (Keith y Leyton 2007). El impacto de la visibilidad sobre la navegación aeronáutica es tan importante, que actualmente los principales aeropuertos del mundo cuentan con un sistema de aterrizaje instrumental que permite que un avión sea guiado con precisión durante la aproximación a la pista de aterrizaje aún en casos en los que la visibilidad es reducida. No obstante, no todos los aeropuertos cuentan con esta tecnología y no todos los aviones están en condiciones de utilizarla.
Debido a esto, el pronóstico de la visibilidad es de particular importancia para el transporte marítimo, fluvial, terrestre y aéreo. Una de las principales causas de visibilidad reducida cerca de superficie, es la formación de neblinas y nieblas y por tal motivo, el pronóstico de este fenómeno recibió gran atención durante los últimos años. No obstante, la formación y evolución de la niebla no son fáciles de predecir dado que el fenómeno ocurre en un rango relativamente amplio de condiciones meteorológicas modulado por diferentes procesos que pueden originarlo, muchos de los cuales son pobremente representados por los modelos de pronóstico numérico operativos. Por otra parte, en ocasiones, la distribución horizontal de la niebla presenta una gran variabilidad en escalas espaciales pequeñas (del orden del kilómetro o menores). Existen diferentes metodologías que pueden ser aplicadas para desarrollar un pronóstico de niebla entre las que se destacan: el modelado numérico explícito de la niebla, los modelos dinámico-estadísticos basados en el post procesamiento de las salidas de modelos numéricos y su combinación con observaciones y los modelos estadísticos, basados solamente en las observaciones. Estas metodologías son en gran medida complementarias por lo que deberían esperarse mejores resultados de una combinación óptima de los diferentes modelos.
Los modelos puramente estadísticos utilizan un conjunto de variables observadas que sirvan como predictores del fenómeno de interés (Leyton y Fritsch 2003, Bremnes y Michaelides 2007). Por ejemplo, en el trabajo de Quinteros de Menzies y Obertello (1978), se determinan predictores de la ocurrencia de niebla en el aeropuerto de Ezeiza a través del estudio de los datos horarios proporcionados por la estación. Los pronósticos puramente estadísticos sólo pueden ser aplicados a plazos de unas pocas horas dado que no cuentan con herramientas que permitan determinar la evolución futura de la circulación atmosférica sobre la región de interés. Los pronósticos de niebla basados en el modelado numérico explícito del fenómeno requieren el uso de modelos con una resolución horizontal y vertical suficiente para representar las variaciones de humedad relativa responsables de la formación de las nieblas y que sean capaces de representar los procesos de interacción entre la atmósfera y la superficie que son fundamentales en la formación de la niebla. Una manera de encarar el modelado numérico explícito de las nieblas, es mediante la utilización de modelos tridimensionales de nube (Müller y otros, 2006), otra opción computacionalmente más económica se basa en el uso de modelos unidimensionales que pronostican los perfiles verticales de las diferentes variables cerca de la superficie (Bott, 1991, Gultepe y otros 2006; Gultepe y Milbrandt, 2007, Bott y Trautmann, 2002. Roquelaure and Bergot 2008).
El modelado dinámico-estadístico se basa en una combinación de la información aportada por los modelos numéricos con observaciones (Baker y otros, 2002, Roquelaure and Bergot 2008, Zhou y otros 2010, Chmielecki y Raftery 2011, Herman and Schumacher 2016 entre otros). Estos métodos pueden implementarse tanto en modelos que resuelven explícitamente la ocurrencia del fenómeno, en cuyo caso el modelo estadístico se utiliza para corregir la componente sistemática de los errores del modelo dinámico, como en casos en donde el modelo estadístico puede combinarse con un modelo dinámico que no resuelve explícitamente el fenómeno de interés. En ese caso el modelo estadístico complementa parte de la física que no está presente en el modelo dinámico estableciendo la relación entre la escala resuelta por el modelo y los fenómenos que son consecuencia de procesos de escalas no resueltas por el modelo. Más allá de la mejora en los modelos de predicción del tiempo y en particular en los modelos de niebla, siempre existe un grado de incertidumbre en el pronóstico que es necesario cuantificar y reducir. Esta incertidumbre tiene su origen en dos fuentes principales: por un lado los errores en la condición inicial, que combinados con la naturaleza caótica de la atmósfera, afectan al pronóstico de las condiciones que pueden dar origen a la niebla y por otra parte, los errores en los modelos que podrán ser más o menos importantes dependiendo de qué tan sofisticado sea el modelo que estemos utilizando. En el caso particular de la niebla juegan un rol fundamental los errores asociados a la estimación de los flujos de calor y humedad en la superficie y la representación de la turbulencia que ocurre cerca de la superficie. Más allá de las fuentes de incertidumbre, Keith y Leyton (2007) muestran con ejemplos concretos que cuando se cuantifica la incertidumbre asociada al pronóstico dentro de la información que se provee al usuario, la capacidad de reducir los costos asociados a la ocurrencia del fenómeno es mayor que cuando solo se utilizan pronósticos determinísticos.
En este trabajo se propone un sistema de pronóstico basado en un modelo dinámico-estadístico que genera pronósticos probabilísticos confiables para diferentes umbrales de visibilidad en base a salidas de modelos numéricos y a observaciones in-situ. El sistema está particularmente enfocado a los eventos de reducción de visibilidad por niebla y neblina. El mismo se diseña de forma tal que pueda ser implementado operativamente con la información disponible en la actualidad. El desempeño del mismo es evaluado para la estación Ezeiza.

2. DATOS Y METODOLOGíA

2.1. Pronósticos retrospectivos
En el presente trabajo se utiliza a los pronósticos numéricos retrospectivos (PR, http://www.esrl.noaa.gov/psd/forecasts/reforecast2/) de segunda generación, (Hamill y otros, 2013), los cuales consisten en un set de pronósticos históricos generados por una misma versión del modelo, siguiendo una idea similar a la utilizada en la generación de los reanálisis. El modelo utilizado es el GEFS (Global Ensemble Forecast System) en la versión que se encontraba operativa en el año 2012. Para cada día del período, el NCEP (National Centers for Environmental Prediction) genera un único pronóstico diario por ensambles formado por 11 miembros, inicializados a las 00 UTC y a un plazo de hasta 15 días. Las salidas están disponibles cada 3 horas en las primeras 72 horas y cada 6 horas para plazos mayores a 72 horas. Dicho modelo cuenta con una resolución espectral T254 los primeros 8 días de pronóstico (aproximadamente una resolución de 40 km en 40o de latitud). Los PR están disponibles desde diciembre de 1984 hasta la actualidad. Para el período utilizado en el presente trabajo, que se extiende entre diciembre de 1984 y enero de 2011, los pronósticos retrospectivos fueron inicializados utilizando los Climate Forecast System Reanalysis (CFSR, Saha y otros 2010) los cuales fueron perturbados utilizando el algoritmo presentado en (Wei y otros, 2008) para generar el ensamble de pronósticos. En la actualidad, los pronósticos retrospectivos continúan actualizándose en forma operativa, lo que permite la implementación operacional de las herramientas de pronóstico que se presentan en este trabajo. Una de las principales ventajas asociadas a los PR es que se puede obtener información robusta sobre la componente sistemática de los errores del modelo, en base a la comparación de los pronósticos previos con observaciones durante un período de tiempo mucho más prolongado que el que se puede conseguir con las versiones operativas de los modelos de pronóstico que se actualizan frecuentemente. Hamill y otros (2008), mostraron que la utilización de PR para corregir los errores sistemáticos del modelo, produce impactos positivos en los pronósticos de precipitación y temperatura a corto y mediano plazo y, en particular, en el pronóstico de eventos extremos. Por esto, elegimos utilizar este conjnto de datos para pronosticar los casos de visibilidad reducida asociados a niebla en la estación de Ezeiza a un plazo de hasta 48 horas. Es importante notar que debido a la resolución utilizada por los PR no pueden resolver explícitamente los fenómenos de niebla y neblina que generan reducción de la visibilidad cerca de superficie. Por tal motivo la probabilidad pronosticada de ocurrencia de eventos de visibilidad reducida en este trabajo se obtiene a partir de variables que los PR generan y que están directa o indirectamente relacionadas con la ocurrencia de niebla.
En este trabajo se utiliza la media del ensamble de pronósticos hasta 48 horas de plazo de diferentes variables para el punto de retícula más cercano a la estación Ezeiza. Las variables utilizadas fueron: humedad relativa a 2 metros (HR2_PR), intensidad de viento a 10 metros (V10_PR), humedad de suelo (HS_PR) y el porcentaje total de nubosidad (NU_PR).

2.2. Datos observados
En este trabajo se utilizaron datos observados de diferentes variables que intervienen tanto en la generación como en la validación de los pronósticos probabilísticos de visibilidad. Se utilizaron a tal efecto los datos observados en la estación Ezeiza del Servicio Meteorológico Nacional. En particular se utilizaron los datos horarios de humedad relativa (HR2_O), intensidad del viento (V10_O), visibilidad estimada por el observador (VIS_O) y los octavos de cielo cubierto (NU_O). La VIS_O utilizada en este trabajo, es la visibilidad estimada por el observador, ya que es la que presenta un registro de mayor longitud en la estación Ezeiza.

2.3. Modelo estadístico utilizado
Para combinar los pronósticos retrospectivos con las observaciones de forma tal de generar un modelo estadístico que relacione un cierto número de predictores con un cierto número de predictandos (en este caso la probabilidad de ocurrencia de visibilidad por debajo de un determinado umbral) pueden utilizarse diferentes metodologías. En este trabajo se utilizó la regresión logística multidimensional. La regresión logística (Wilks 2005) se ha utilizado extensamente para la generación de pronósticos probabilísticos confiables de variables meteorológicas en función de 1 o más predictores (Ver por ejemplo Leyton y Fritsch 2004, Hamill et al. 2006, Ruiz y Saulo 2012 y referencias allí citadas para ejemplos de su aplicación a precipitación). Por tal motivo, se consideró la utilización de esta herramienta para la generación de pronósticos probabilísticos confiables de visibilidad. La relación entre el valor de un conjunto de predictores y la probabilidad de que la variable aleatoria y esté por debajo de un determinado umbral U, se puede ajustar mediante una función de la siguiente forma:

 

Donde los coeficientes _0,...,_n son constantes y su valor se determina a partir de un conjunto de casos para los cuales se conoce el valor de los predictores y se conoce si el evento y < U tuvo lugar o no.

En este trabajo se utilizan variables observadas y salidas de modelos como predictores. Dado que las salidas de los pronósticos retrospectivos están disponibles con una frecuencia de 3 horas (a las 00, 03, 06, 09, 12, 15, 18 y 21 UTC), se llevaron los valores observados a una frecuencia tri-horaria. Para la mayoría de las variables observadas se tomó simplemente el valor de la variable que coincidía con las horas a las que estaban disponibles los PR. Para el caso de la visibilidad, se tomo el correspondiente a la hora que coincide con los PR pero también se tomó el valor mínimo de visibilidad en un intervalo de 3 horas centrado alrededor de las horas en las que estaban disponibles los PR. A la visibilidad mínima en períodos de 3 horas se la denomina VISMIN. El evento a pronosticar, se define como valores de VISMIN por debajo de determinados umbrales. En este trabajo se utilizan los umbrales de 0.1, 0.4, 1.0 y 5 km. Los umbrales de 0.4 y 1 km se seleccionaron siguiendo a Tardif y Rasmussen 2007 en donde los eventos con visibilidad por debajo de 0.4 km son considerados severos, mientras que la visibilidad por debajo de 1 km son considerados moderados. El umbral de 0.1 km se agregó dado que es el umbral a partir del cual la cual la operación del aeropuerto de Ezeiza comienza a restringirse, y el umbral de 5 km se agregó para permitir evaluar la efectividad del pronóstico en detectar la ocurrencia de eventos más leves. En todos los casos, los pronósticos se realizan a un plazo máximo de 48 horas. Los coeficientes de la regresión logística se calculan en forma independiente para cada plazo de pronóstico. Es importante resaltar que dado que los PR se inicializan una vez por día a las 00UTC, esto es equivalente tener en cuenta la dependencia de los errores sistemáticos con la hora del día.

2.4. Validación de los pronósticos probabilísticos
Para validar los pronósticos probabilísticos obtenidos se utiliza la variable VISMIN observada en Ezeiza. Para garantizar la independencia entre las observaciones utilizadas para la validación de los pronósticos y aquellas utilizadas para entrenar el modelo estadístico se utiliza la técnica de validación cruzada (Wilks 2005, Herman and Schumacher 2016). Para generar el pronóstico correspondiente al i-ésimo día de la muestra, se entrenan los coeficientes de la regresión logística utilizando todos los datos de la muestra a excepción de aquellos comprendidos entre el día i-20 e i+20. Es decir que para generar el pronóstico de cada día se utiliza un valor ligeramente diferente de los parámetros de la regresión logística. En la práctica se encontró que para la regresión logística, la diferencia de aplicar o no el método de validación cruzada tiene poco impacto sobre el valor de los índices que miden el desempeño del pronóstico y en ningún caso afecta a las conclusiones obtenidas en este trabajo. Para verificar la calidad de los pronósticos probabilísticos obtenidos utilizando las diferentes metodologías propuestas se utiliza el índice de acierto de Brier (BSS, Wilks 2005) que se calcula de la siguiente manera:

donde BR es el índice de Brier y se obtiene de la siguiente expresión:

Donde pi es la probabilidad de ocurrencia del evento según el pronóstico y oi es 1 cuando el fenómeno ocurre y 0 cuando no ocurre. BRc es el índice de Brier que se obtendría si el pronóstico siempre indicara la probabilidad climatológica del evento pc y puede ser calculado como BRc = pc(1 - pc). Valores de BSS iguales a 1 indican un pronóstico perfecto, mientras que un valor de 0 indica que el pronóstico no agrega valor por encima del conocimiento de la probabilidad climatológica de ocurrencia de un evento.

Para determinar los límites de confianza para el BSS y determinar la significancia estadística de las diferencias encontradas al comparar diferentes metodologías para la generación de los pronósticos, se utilizó una técnica de bootstrap (Wilks 2005). Esta técnica es particularmente atractiva cuando se desconoce la función de distribución de probabilidad del parámetro o estadístico cuyos límites de confianza se busca determinar. En la técnica de bootstrap se genera un cierto número N de muestras que tienen igual tamaño que la muestra original. Las N muestras se obtienen seleccionando elementos al azar pero con repetición a partir de los elementos de la muestra original. En este caso se utilizaron 1000 muestras generadas a partir de la muestra original. El nivel de significancia utilizado para evaluar la significancia estadística de las diferencias es de 5% distribuido en ambas colas de la distribución.

3. RESULTADOS

3.1. Caracterización de la ocurrencia de visibilidad reducida en Ezeiza
En esta sección se analiza la distribución diurna y estacional de los casos de visibilidad reducida en Ezeiza en base a los umbrales definidos en la sección anterior. La Figura 1 presenta la frecuencia relativa de ocurrencia de eventos de visibilidad reducida para las diferentes horas del día. Las frecuencias se calculan para las diferentes estaciones del año definidas como: verano (diciembre, enero y febrero), otoño (marzo, abril y mayo), invierno (junio, julio y agosto) y primavera (septiembre, octubre y noviembre). Esta figura muestra que la mayor frecuencia de ocurrencia de eventos de visibilidad reducida ocurre principalmente en horas de la mañana, con un máximo inmediatamente después de la salida del sol. La frecuencia es máxima en los meses de otoño e invierno. Si bien diferentes mecanismos de origen de las nieblas suelen mostrar un mínimo diurno y estival en su frecuencia de ocurrencia, las nieblas radiativas muestran un aumento marcado de la frecuencia a medida que se acerca la hora de la salida del sol (Tardif y Rasmussen 2007, su figura 9). Estos resultados sugieren que la distribución estacional y diurna de la frecuencia de eventos de visibilidad reducida en Ezeiza responde principalmente a nieblas de tipo radiativas lo que no implica que todos los eventos obedezcan a esa causa. Un aspecto llamativo de la distribución es la menor frecuencia de nieblas en la primavera respecto del otoño. Una posible explicación para la mayor frecuencia de nieblas en otoño tiene que ver con la mayor humedad en el suelo que se registra durante dicha estación (no se muestra). Otro mecanismo que podría estar presente es el de las nieblas de evaporación (Tardif y Rasmussen, 2007) que se dan inmediatamente después de la salida del sol, debido a un aumento más rápido de la temperatura de rocío cerca de superficie respecto de la temperatura del aire. Este mecanismo podría estar asociado al aumento relativamente abrupto que se observa en la frecuencia de nieblas justo después de la salida del sol, sobre todo en el otoño y en el invierno (Tardif y Rasmussen 2007).


Figura 1
: Ciclo diurno de la frecuencia relativa de ocurrencia de visibilidad por debajo de 5 (rojo), 1 (verde), 0.4 (negro) y 0.1 km (azul) durante los meses de (a) verano, (b) otoño, (c) invierno y (d) primavera en la estación Ezeiza como función de la hora del día para el período en el cual están disponibles los pronósticos retrospectivos.

Las reducciones de visibilidad por debajo de 1 km prácticamente no se producen en horas de la tarde a excepción de unos pocos casos en el invierno. Sin embargo, las reducciones por debajo de 5 km, pueden ocurrir en cualquier momento del día y en cualquier época del año, aún cuando son más frecuentes en invierno. Estas reducciones pueden obedecer a diferentes procesos, incluso a factores como polvo levantado por viento, precipitación, humo, etc.
En el caso de las nieblas de origen radiativo existen diferentes variables que pueden determinar si un entorno es favorable para la ocurrencia de dicho fenómeno. Entre ellas se destacan la humedad relativa, la intensidad del viento y la estabilidad vertical cerca de la superficie, la concentración y tipo de aerosoles, la nubosidad y la humedad del suelo entre otros. Quinteros de Menzies y Obertello (1978) documentaron la relación entre algunas de estas variables y la ocurrencia de visibilidad reducida en la estación Ezeiza. La Figura 2, muestra a modo de ejemplo, la relación que existe entre la humedad relativa, el viento y la visibilidad cuando los 3 son observados simultáneamente. Se puede observar como el valor de la visibilidad observado disminuye al aumentar la humedad relativa y al disminuir la intensidad del viento cerca de superficie. Por otra parte se muestra también la probabilidad de que la visibilidad esté por debajo de determinados umbrales como función de la humedad relativa y el viento (Figura 2b y 2c). Estos gráficos permiten cuantificar la incertidumbre de la relación entre humedad relativa, viento y visibilidad. El origen de dicha incertidumbre tiene que ver en este caso con los errores de medición asociados a dichas variables junto con el hecho de que la ocurrencia de visibilidad reducida no está totalmente explicada por el valor de humedad relativa o la intensidad del viento. Se puede ver además que los valores de visibilidad comienzan a reducirse a partir de humedades relativas en torno al 85% y que los eventos de reducción de visibilidad más extremos (visibilidad por debajo de 0.1 km) ocurren casi exclusivamente con humedades relativas superiores al 95% e intensidades de viento menores a 2 ms-1.


Figura 2
: (a) Visibilidad media (km), (b) probabilidad de visibilidad menor a 1 km y (c) probabilidad de visibilidad menor a 0.1 km como función de la intensidad del viento (ms-1) y la humedad relativa (adimensional). Los datos corresponden a las horas comprendidas entre las 3 y las 11 UTC, para la localidad de Ezeiza, en el período en el cual están disponibles los pronósticos retrospectivos.

3.2. Desempeño de los PR en Ezeiza
Dado que las variables pronosticadas por el PR serán utilizados como predictores en el modelo estadístico de visibilidad, resulta de interés analizar los errores en los pronósticos de aquellas variables que son directamente medidas en la estación Ezeiza, es decir HR2_PR y V10_PR. En esta sección, se comparan los valores instantáneos de HR2_PR y V10_PR con los valores instantáneos observados (HR2_O y V10_O) durante las primeras 48 horas de pronóstico y a intervalos de 3 horas. La Figura 3, muestra el ciclo diurno medio observado y pronosticado por el PR para HR2 y V10. Ambas variables presentan un marcado ciclo diurno con máximos nocturnos de HR2 y máximos diurnos de V10. Tanto en HR como en V10, las diferencias medias o sesgos entre el PR y las observaciones muestra una dependencia con la hora del día y el plazo de pronóstico como es habitual para las variables atmosféricas dentro de la capa límite. Esta dependencia surge, en parte, de una limitada representación de los procesos de capa límite e intercambio de energía entre la superficie y la atmósfera. Para HR2_PR existe un marcado error sistemático en las primeras horas de la simulación, en donde los pronósticos tienen humedades relativas menores a las observadas, particularmente durante los meses de verano, no obstante este sesgo cambia de signo en la segunda noche de pronóstico. El V10_PR muestra un ciclo diurno de menor amplitud respecto del observado lo cual conduce a subestimaciones diurnas y sobreestimaciones nocturnas.


Figura 3
: Ciclo diurno medio de HR_PR (adimensional) (lína azul contínua) y V10_PR (ms-1) (lìnea roja) observada (línea a trazos) y pronosticada por el reforecast (línea contínua) para los meses de (a) verano, (b) otoño, (c) invierno y (d) primavera.

La Figura 4, muestra el valor del error cuadrático medio (RMSE) y del coeficiente de correlación lineal entre pronóstico y observaciones para HR2_PR y V10_PR, como función del plazo de pronóstico. Al igual que como sucede con el sesgo, el RMSE de ambas variables presenta un marcado ciclo diurno. Este ciclo diurno obedece en gran medida a los sesgos discutidos en la Figura 3. Los errores en ambas variables presentan además una dependencia con la época del año que es del mismo orden de importancia que las variaciones que se observan con la hora del día. HR2_PR presenta errores mayores durante las primeras horas de la simulación correspondientes a horas de la madrugada del primer día de pronóstico. Los errores en la HR2_PR en las primeras horas son más intensos en verano debido al sesgo seco que ocurre durante esta época del año (Figura 3a y Figura 4a). La variable V10_PR muestra errores que son más importantes durante el día y durante el verano, pero que tienen poca variación diurna durante el invierno y el otoño. Gran parte de este ciclo diurno en el error está explicado por el sesgo discutido en la Figura 3. El coeficiente de correlación (Figuras 4c y 4d) permite detectar en que horas el modelo captura más adecuadamente la variabilidad temporal de HR2 y V10. En el caso de HR2_PR en horas de la noche es cuando el modelo tiene mayor dificultad para capturar la variabilidad temporal. Para el V10_PR el escenario es similar con correlaciones bajas durante las últimas horas de la tarde y primeras horas de la noche, aunque la correlación aumenta más rápidamente en las primeras horas del día con respecto a lo que sucede con la HR2_PR. Por otra parte, la variable V10_PR presenta mayores diferencias entre estaciones, siendo el invierno la estación en la cual las correlaciones son más altas y que presentan menos variación a lo largo del día. El hecho de que los coeficientes de correlación sean más bajos durante la noche complica particularmente el pronóstico de eventos de visibilidad reducida, ya que los mismos ocurren con mayor frecuencia en esta parte del día según lo discutido en la Figura 1.


Figura 4
: (a) y (b) Error cuadrático medio y (c) y (d) coeficiente de correlación lineal como función del plazo de pronóstico para la HR2_PR (adimensional) (a y c) y para el V10_PR (ms-1) (b y d) para los meses de verano (línea azul), otoño (línea roja), invierno (línea verde) y primavera (línea negra).

3.3. Desempeño de los pronósticos probabilísticos
En esta sección se evalúan los modelos estadísticos y dinámico-estadísticos empleados en este trabajo. Se realizan 3 conjuntos de experimentos que se encuentran resumidos en la Tabla I. En el primer conjunto de experimentos se utilizan únicamente predictores tomados de los PR. Debido a esto, este primer grupo sería considerado un modelo dinámico-estadístico, ya que las variables del PR provienen de un modelo dinámico. Los diferentes predictores considerados son la HR2_PR, V10_PR, HS_PR y NU_PR. El segundo conjunto de experimentos consiste en modelos puramente estadísticos que utilizan como predictores únicamente variables observadas. Para que los resultados sean comparables con los resultados que utilizan variables provenientes de los PR, se utiliza el valor observado al momento de la inicialización de los PR, es decir a las 00 UTC. A partir de dicho valor, se generan pronósticos probabilísticos de VISMIN para las próximas 48 horas. Como predictores se utilizan: la humedad relativa a 2 metros (HR2_O), el viento observado a 10 metros (V10_O), la visibilidad estimada por el observador (VIS_O) y los octavos de cielo cubierto (NU_O).

Tabla I: Lista de experimentos presentados en el texto junto con la cantidad de predictores utilizados. La última columna indica si la regresión logística fue realizada independientemente para cada época del año.

Finalmente se realiza un tercer conjunto de experimentos en donde se evalúa la combinación de las observaciones disponibles y las variables pronosticadas por el PR. El nombre de cada experimento responde a la siguiente notación: Regresión Logística (RL), Regresión logística con coeficientes dependientes de la época del año (RLE); Pronósticos retrospectivos (PR) y observaciones (O) y donde nP indica la cantidad de predictores utilizados. El período utilizado para el entrenamiento y la validación de los pronósticos se extiende desde diciembre 1984 a enero de 2011. La Figura 5, muestra los resultados obtenidos con el primer conjunto de experimentos, donde se utilizan solo las variables obtenidas a partir del PR como predictores. En dicha figura, se muestra el índice BSS para los diferentes plazos de pronóstico y para los diferentes umbrales de visibilidad. Para algunos plazos de pronóstico y umbrales en donde la frecuencia observada del fenómeno es muy baja (por ejemplo para el umbral de 0.1 km en horas diurnas), no fue posible calcular en forma robusta el BSS, dado que muchas de las muestras generadas utilizando el algoritmo bootstrap no contenían ningún evento observado. Estos casos se indican como datos faltantes en la Figura 5 y subsiguientes. Cuando se utiliza como único predictor a la HR2_PR (LR_PR_P1), el BSS tiene un importante ciclo diurno que para el umbral de 5 km presenta un máximo en horas diurnas y un mínimo en horas de la madrugada y primeras horas de la mañana. Esta no es una característica deseable, ya que la mayoría de los eventos de visibilidad reducida en Ezeiza ocurren en horas de la madrugada y primeras horas de la mañana. No obstante, los umbrales asociados a reducciones de visibilidad por debajo de 1, 0.4 y 0.1 km muestran un mejor desempeño durante las horas de la madrugada. El desempeño del pronóstico empeora a medida que utilizamos umbrales menos frecuentes (como sucede habitualmente con los pronósticos probabilísticos), no obstante aún para el umbral de 0.1 km el pronóstico probabilístico generado supera a la climatología durante las horas de mayor frecuencia de ocurrencia de estos eventos.


Figura 5
: BSS como función del plazo de pronóstico, para los umbrales de (a) 5 km, (b) 1 km, (c) 0.4 km y (d) 0.1 km, para el pronóstico probabilístico de visibilidad generado en el experimento RL_RF_1P (línea negra), RL_RF_2P (línea roja), RL_RF_3P (línea verde) y RL_RF_4P (línea azul). Las líneas negras punteadas indican los límites de confianza del BSS para el pronóstico correspondiente al experimento RL_RF_1P.

La diferencia de comportamientos entre el umbral de 5 km y los umbrales más bajos puede responder a los mecanismos que generan las reducciones de visibilidad. El umbral de 5 km es el único que presenta frecuencias importantes en horas diurnas. El hecho que durante las horas diurnas los pronósticos de visibilidad que utilizan un único predictor (HR2_PR) presenten un buen desempeño sugiere que estas reducciones de visibilidad están asociadas a procesos atmosféricos que tienen impacto en dicha variable como podría ser la ocurrencia de precipitación. Es importante destacar que si bien los sesgos en los predictores son importantes, sobre todo para la humedad relativa en las primeras horas de pronóstico, la regresión logística realiza implícitamente una corrección de la componente sistemática del error en la media y en la desviación estándar de la distribución de probabilidades de las variables pronosticadas (no se muestra). La Figura 5, muestra además como mejora el desempeño del pronóstico de visibilidad a medida que se incrementa la cantidad de predictores del PR. En el experimento RL_PR_2P se utiliza a la HR2_PR y la V10_PR como predictores. La inclusión de la V10_PR introduce una mejora en los valores del BSS particularmente en horas nocturnas para ambos días de pronóstico, período durante el cual, los pronósticos muestran un BSS significativamente más alto que utilizando sólo la HR2_PR. Esto se debe a que es, principalmente en horas nocturnas, cuando las condiciones de poco viento cerca de superficie, contribuyen a incrementar el enfriamiento del aire cercano a la superficie y a favorecer la ocurrencia de nieblas radiativas. Durante el día, la relación entre visibilidad y viento es prácticamente nula (no se muestra) y por ende la inclusión de la V10_PR no mejora significativamente el valor del BSS. La incorporación del viento produce un impacto más significativo sobre los umbrales más bajos probablemente porque dada la naturaleza mayormente radiativa de las nieblas que ocurren en Ezeiza, contar con condiciones de poco viento es un elemento prácticamente indispensable para generar reducciones grandes en la visibilidad. Claramente este no sería el caso si las nieblas fueran de origen advectivo o de pendiente.
La inclusión de la HS_PR como predictor (RL_PR_3P), produce una mejora relativamente pequeña por sobre el experimento RL_PR_2P. El hecho de que exista una cierta mejora, aunque marginalmente significativa, indica que existe una relación entre la humedad de suelo y la ocurrencia de nieblas, no obstante, o bien este efecto no es muy importante, o bien los errores con los cuales dicha variable está representada en los PR hacen que su inclusión no produzca un gran impacto. Finalmente, el experimento RL_PR_4P que incluye como predictor a la NU_PR, presenta mejoras significativas, sobre todo en horario nocturno con respecto al experimento RL_PR_3P. La nubosidad es un factor importante en el control
del enfriamiento radiativo nocturno que crea las condiciones para la formación de niebla, por tal motivo es esperable que agregar este predictor produzca un impacto positivo en el desempeño de los pronósticos. En los experimentos discutidos hasta ahora, se utilizó a la media del ensamble de pronósticos retrospectivos como predictor. Para los pronósticos a 48 horas, utilizar la media del ensamble no produjo mejoras importantes en la calidad del pronóstico probabilístico respecto de utilizar el pronóstico control del ensamble de pronósticos retrospectivos (no se muestra). No obstante, es probable que utilizar la media del ensamble produzca resultados más robustos a plazos más largos que los estudiados en este trabajo. En un segundo conjunto de experimentos se evalúa el desempeño de los pronósticos probabilísticos que utilizan como predictores a variables observadas en la estación Ezeiza a las 00 UTC. La motivación para el análisis de estos pronósticos es variada. Por un lado, en muchas aplicaciones se conoce que la persistencia o los pronósticos basados en extrapolación temporal de los valores observados, tienen un buen desempeño en las primeras horas posteriores a la observación y que muchas veces compiten o superan a los pronósticos dinámicos y dinámico-estadísticos en este período. Por tal motivo los pronósticos basados exclusivamente en las observaciones son un buen punto de comparación para medir el desempeño de los pronósticos estadístico-dinámicos. Por otra parte los pronósticos basados en las últimas observaciones disponibles pueden actualizarse con mucha mayor frecuencia (en este caso 1 vez por hora) debido a que la frecuencia de las observaciones es mucho mayor que la frecuencia con la que se actualizan los pronósticos numéricos. Esto los convierte en una herramienta potencialmente útil para la toma de decisiones en un contexto operativo. Este conjunto de experimentos permitirá responder hasta qué plazo persiste la ventaja de los pronósticos estadísticos por sobre los estadístico-dinámicos para el pronóstico de visibilidad en Ezeiza y como es el desempeño relativo para los diferentes plazos y las variables observadas que producen un mayor impacto en la calidad de los pronósticos basado puramente en observaciones.
La Figura 6 muestra el BSS como función del umbral y del plazo de pronóstico, obtenido para los experimentos RL_O_1P, RL_O_2P, RL_O_3P y RL_O_4P. Los pronósticos basados en la última observación disponible, presentan como era de esperarse, un buen desempeño en las primeras horas para todos los umbrales considerados. Sin embargo, su habilidad se reduce notablemente en las primeras 12 horas de pronóstico, siendo su BSS cercano a cero para plazos mayores. No obstante se observa un segundo máximo relativo de BSS en la segunda noche de pronóstico. Con respecto al aporte de los diferentes predictores, durante la primera noche de pronóstico, la inclusión del viento observado produce una mejora significativa en la calidad del pronóstico (experimento RL_O_P2). Tal como sucede en el caso de los experimentos que utilizan solo los PR, el impacto de la inclusión del viento parece ser más importante para los umbrales de visibilidad más bajos. La inclusión de la visibilidad (RL_O_P3), muestra un aumento muy importante en el BSS durante las primeras 6 horas de pronóstico, pero el impacto decae muy rápidamente y para plazos mayores las diferencias respecto del experimento RL_O_P2 no son significativas para la mayoría de los umbrales. Finalmente incluir la nubosidad como predictor (experimento RL_O_4P) produce alguna mejora significativa durante las primeras 12 horas de pronóstico y sobre todo para los umbrales de visibilidad más bajos.


Figura 6
: Como en la Figura 5, pero para el pronóstico probabilístico generado en los experimentos RL_O_1P (línea negra), RL_O_2P (línea roja), RL_O_3P (línea verde) y RL_O_4P (línea azul).

Es importante destacar que tal como ocurre en otras aplicaciones y variables (e.g. Wainmann 2016) durante las primeras 6 horas de pronóstico, el desempeño de los pronósticos basados en las observaciones de las 00 UTC son mejores que el obtenido con los PR (Figura 5), lo cual indica que a plazos de hasta algunas horas, la información provista por las últimas observaciones disponibles, tiene mayor potencial predictivo. Es importante notar que, en este caso, lo que estamos utilizando es la relación que existe entre el valor observado de un conjunto de variables en un determinado tiempo con la ocurrencia de visibilidad por debajo de un determinado umbral una cierta cantidad de horas más tarde. En esta relación, la regresión logística está teniendo en cuenta implícitamente el ciclo diurno medio, ya que los coeficientes se entrenan en forma independiente para cada plazo de pronóstico. Esto implica que el pronóstico basado en las observaciones no se basa en la mera persistencia del valor observado. El buen desempeño que muestran los pronósticos basados en las observaciones para las primeras horas complementa adecuadamente la deficiencia de los pronósticos basados en el PR durante este mismo período. Esto motiva la realización de un tercer grupo de experimentos en donde se utilizan simultáneamente, las salidas del PR y las observaciones correspondientes al momento de la inicialización de los PR como predictores. En primer lugar, se realizaó un experimento con un total de 6 predictores (RL_OPR_6P), en donde se utilizaron los 3 predictores que produjeron mayor incremento del BSS tanto en el caso de las observaciones como en el caso de las variables pronosticadas por el PR. Los predictores en este experimento son HR2_O, HR2_PR, V10_O, V10_PR, VIS_O, NU_PR. Los resultados se muestran en la Figura 7, donde se compara el BSS obtenido con el BSS de los experimentos RL_PR_4P y RL_O_4P. El BSS del experimento RL_OPR_6P es mayor que el de los experimentos RL_PR_4P y RL_O_4P para todos los plazos de pronóstico, lo cual indica la mejora que resulta de la combinación de las observaciones con las variables pronosticadas por el PR. Las mejoras son significativas para la primera noche de pronóstico (para plazos mayores a 6 horas). Para la segunda noche, las mejoras son considerablemente menores aunque continúan siendo estadísticamente significativas. La combinación de predictores observados y pronosticados por el PR no produce mejoras significativas durante las horas diurnas. Un experimento adicional utilizó los cuatro predictores basados en observaciones y los 4 predictores basados en las variables pronosticadas por el PR (RL_OPR_8P). Este experimento produce una leve mejora (aunque estadísticamente significativa) durante la primera noche de pronóstico (entre las 6 y las 12 horas de pronóstico) pero no produce ningún impacto para plazos mayores.


Figura 7
: Como en la Figura 5, pero para los experimentos RL_PR_4P (línea negra), RL_O_4P (línea roja), RL_OPR_6P (línea verde) y RL_OPR_8P (línea azul). Las líneas negras punteadas indican los intervalos de confianza del BSS correspondiente al experimento RL_PR_4P. impacto para plazos mayores.

Los valores de BSS encontrados en los experimentos que combinan las observaciones y las simulaciones de modelos numéricos son similares a los reportados en otros trabajos como por ejemplo Roquelaure and Bergot (2008). En dicho trabajo, se utilizan pronósticos dinámicos por ensambles y observaciones y se obtienen valores de BSS relativamente altos (cercanos a 0.5) para la primera hora de pronóstico, bajando rápidamente a valores cercanos a 0.2 para las 6 horas de pronóstico y para un umbral de visibilidad de 600 metros. Como se discutió previamente en la Sección 3.1 la ocurrencia de eventos de visibilidad reducida presenta un marcado ciclo anual. Por otra parte, el desempeño de los PR en pronosticar humedad relativa y viento cerca de superficie también tiene un marcado ciclo anual. Es de esperar entonces que el BSS del pronóstico de visibilidad cambie a lo largo del año. Para explorar estos cambios se calculo el valor del BSS para los diferentes días del año. Para esto se tomaron ventanas móviles de 60 días centradas en cada uno de los días del año y se calculó el BSS de los pronósticos dentro de dichas ventanas. La Figura 8, muestra el BSS máximo considerando los plazos entre 6 y 48 horas de pronóstico para el experimento RL_OPR_6P, como función del día del año. Se puede apreciar que el máximo de BSS ocurre entre mayo y junio, dentro de la época en donde la ocurrencia de nieblas es más frecuente. Este máximo de BSS puede explicarse en parte por el mejor desempeño de algunos de los predictores durante la época invernal (e.g. HR2_PR y V10_PR) como así también por el hecho de que durante esta época los eventos de visibilidad reducida son más frecuentes y que por lo general, el BSS de un fenómeno más frecuente tiende a ser más alto (como ocurre por ejemplo al considerar el BSS de los diferentes umbrales, donde los umbrales más bajos y menos frecuentes suelen tener un BSS asociado más pequeño).


Figura 8
: BSS máximo entre los plazos de 6 y 48 horas, como función del día del año para los experimentos RL_OPR_8P (línea continua) y RLE_OPR_8P (línea discontinua) y para los umbrales de 0.4 (línea roja), 1.0 (línea verde) y 5 km (línea azul).

Una implicancia de la dependencia estacional del BSS, es que los valores que se obtienen al considerar simultáneamente todas las épocas del año pueden estar sobreestimados, debido a que la climatología del evento a lo largo del año no es uniforme (ver por ejemplo Hamill y Juras 2006 para una discusión de este efecto). No obstante esto no afecta la comparación que se realiza entre los diferentes experimentos, si bien puede afectar la comparación con los valores de BSS obtenidos en otras localidades. Por otra parte, la dependencia de los errores de los PR con la época del año puede ser considerada explícitamente en el diseño del sistema de pronóstico dinámico-estadístico. Para analizar el impacto que tiene considerar la dependencia de los errores con la época del año, se realiza un experimento, en donde los coeficientes de la regresión logística se entrenan utilizando un conjunto de días que corresponden a la misma época del año (RLE_OPR_8P). En este caso, la época del año se define como un período centrado en el día para el cual se está realizando el pronóstico con una longitud total de 120 días. En la Figura 8 se muestran los valores de máximos de BSS entre las 6 y 48 horas de pronóstico obtenidos en los experimentos RL_OPR_8P y RLE_OPR_8P. La dependencia de los coeficientes con la época del año mejora los valores de BSS en la mayoría de los casos. La Figura 9, compara los mismos experimentos, mostrando los BSS como función del plazo de pronóstico. Las mejoras más importantes y estadísticamente significativas, se producen para la segunda noche de pronóstico y se encuentran en 2 de los cuatro umbrales considerados siendo los resultados marginalmente significativos para el umbral de 0.4 y 0.1 km. La razón por la cual las mejoras significativas se producen en la segunda noche, es porque en estos plazos, los predictores de los PR tienen más peso relativo y sus errores sistemáticos son dependientes de la época del año. Para los plazos más cortos, el mayor peso lo tienen las variables observadas. Para el pronóstico que utiliza predictores provenientes únicamente del PR, las mejoras obtenidas al considerar la dependencia anual de los parámetros, son significativas en la primera y en la segunda noche de pronóstico (no se muestra). Para las horas diurnas, considerar coeficientes dependientes de la época del año, produce en general peores resultados. Esto se debe a que durante estas horas la frecuencia de casos con visibilidad reducida disminuye y al considerar una muestra de entrenamiento más pequeña, el ajuste obtenido con la regresión logística puede no ser bueno conduciendo a la degradación de los resultados.


Figura 9
: Como en la Figura 5, pero para los experimentos RL_OPR_8P (línea azul) y RLE_OPR_8P (línea roja). Las líneas punteadas azules indican los umbrales de significancia. ajuste obtenido con la regresión logística puede no ser bueno conduciendo a la degradación de los resultados.

La Figura 10, muestra el diagrama de confiabilidad de los pronósticos generados en el experimento RLE_OPR_8P para diferentes umbrales y para los plazos de 9 y 33 horas de pronóstico (que corresponden a las 9 UTC que es cuando se produce la máxima frecuencia de niebla en la estación Ezeiza). El diagrama de confiabilidad muestra la frecuencia observada del fenómeno condicionada a la probabilidad pronosticada e indica qué tan buena es la correspondencia entre ambas. En el caso ideal, la frecuencia observada del evento debería ser igual a la probabilidad pronosticada y la curva del diagrama de confiabilidad debería ser muy cercana a la diagonal. Como se puede ver en la Figura 10, los pronósticos resultan confiables, ya que la relación entre la probabilidad pronosticada para los diferentes umbrales y la frecuencia observada es muy cercana a la diagonal. En el plazo de 9 horas de pronóstico aparecen valores de probabilidad pronosticado de más de 50% para todos los umbrales considerados, llegando hasta 80% para los umbrales de 1 y 5 km. Durante la segunda noche de pronóstico (33 horas de plazo), los máximos de probabilidad pronosticada disminuyen, lo cual es consecuencia del aumento en la incertidumbre del pronóstico, pero los pronósticos siguen siendo confiables y muy cercanos a la diagonal. En esta misma figura, se incluyen gráficos que indican la cantidad de veces que el pronóstico indica los diferentes valores de probabilidad. La cantidad de veces que se pronostica un determinado valor de probabilidad decae rápidamente a medida que se incrementa el valor de probabilidad. Esto indica que el sistema genera pocos pronósticos con valores de probabilidad altos y que la mayoría de las veces pronostica valores de probabilidad de ocurrencia del fenómeno por debajo de 50 %. Si bien pueden parecer valores de probabilidad demasiado bajos como para tomar una decisión respecto de la ocurrencia del fenómeno, hay que tener en cuenta que la probabilidad climatológica de ocurrencia de este fenómeno también es muy pequeña con lo cual un valor de 50% está muy por encima de la probabilidad climatológica del evento (Figura 10).


Figura 10
: Diagramas de confiabilidad para los pronósticos probabilísticos de visibilidad a un plazo de (a) 9 horas y (b) 33 horas para los umbrales de 0.1 km (línea roja), 0.4 km (línea verde) y 5 km (línea azul). La línea negra punteada indica la curva correspondiente a una confiabilidad perfecta y las líneas punteadas de colores indican el valor correspondiente a la probabilidad climatológica de cada umbral. Los ejes en la esquina superior izquierda del gráfico muestran la frecuencia de ocurrencia de los pronósticos en función de la probabilidad pronosticada.

Para ejemplificar el funcionamiento de los pronósticos probabilísticos utilizando la regresión logística y los PR, se analiza el desempeño de dichos pronósticos en 4 eventos particulares. Primero se seleccionaron todos los eventos con visibilidad por debajo de 0.4 km durante más de 5 horas y en particular aquellos en donde la visibilidad mínima durante el período haya disminuido por debajo de 0.1 km. En los 27 años de la muestra hubo 73 casos con estas características de los cuales se seleccionaron 4 para ilustrar el desempeño del pronóstico probabilístico de niebla. En la Figura 11, se pueden ver la probabilidad pronosticada como función del plazo de pronóstico, generado a partir de los pronósticos inicializados a las 00 UTC para los 4 casos seleccionados (25 de julio de 2008, 31 de octubre de 2004, 24 de julio de 1996 y 14 de junio de 1998). En todos los casos se puede apreciar una buena correspondencia entre la probabilidad de ocurrencia de visibilidad reducida por debajo de los diferentes umbrales y los valores de visibilidad. En la Figura 11b, también se puede ver un caso en donde la visibilidad no se redujo por debajo de los 10 km en la segunda noche de pronóstico. Los valores de probabilidad de ocurrencia de niebla en este caso también resultaron ser menores que los registrados en las noches donde si hubo visibilidad reducida.


Figura 11
: Visibilidad mínima observada en períodos de 3 horas (línea negra) y probabilidad de visibilidad reducida pronosticada en base al experimento RLE_OPR_8P para los umbrales de 1 km (línea azul), 0.4 km (línea verde) y 0.1 km (línea roja) para los pronósticos inicializados a las 00 UTC de los días (a) 25 de julio de 2008, (b) 31 de octubre de 2004, (c) 24 de julio de 1996 y (d) 14 de junio de 1998.

La Figura 12, muestra para estas mismas fechas, la evolución de HR2 y V10M pronosticado y observado. Se puede ver que los pronósticos retrospectivos capturaron bien la evolución de HR2 aunque con una tendencia a subestimar el valor en horas de la noche, mientras que la velocidad del viento en horas nocturnas se encuentra sobreestimada lo cual es consistente con los sesgos mostrados en la Figura 3. No obstante, gracias a la corrección de los sesgos introducida por el pronóstico dinámico-estadístico, se pudo detectar adecuadamente la ocurrencia de estos


Figura 12
: Valores pronosticados (línea continua) y observados (línea a trazos) para V10M (línea roja) y HR2M (línea azul) para los pronósticos inicializados a las 00 UTC de los días (a) 25 de julio de 2008, (b) 31 de octubre de 2004, (c) 24 de julio de 1996 y (d) 14 de junio de 1998. eventos extremos de reducción de visibilidad.

4. CONCLUSIONES

Este trabajo presenta una técnica para la predicción de la visibilidad reducida para diferentes umbrales utilizando pronósticos retrospectivos. La técnica consiste en un modelo de post-procesamiento estadístico que se aplica a un conjunto de pronósticos retrospectivos globales y que se entrena en base a observaciones provenientes de una estación de superficie. El modelo fue evaluado exitosamente con datos provenientes de la estación meteorológica del aeropuerto de Ezeiza para la obtención de pronósticos probabilísticos de eventos de visibilidad reducida asociado a nieblas o neblinas. Los resultados obtenidos muestran que utilizar las últimas observaciones disponibles permite obtener pronósticos cuya performance es superior a la de los pronósticos generados a partir de los modelos numéricos para las primeras 6-18 horas de pronóstico. Combinar la información de las últimas observaciones disponibles con la provista por el modelo numérico permitió maximizar el desempeño del pronóstico para todos los plazos de pronóstico. Las observaciones proveen una buena estimación de la evolución futura del evento, en casos en los que no haya cambios en las condiciones cercanas a la superficie o en la nubosidad.
A unas pocas horas producen pronósticos más precisos que el modelo numérico, debido a que no sufren de los errores sistemáticos presentes en los pronósticos retrospectivos. No obstante, los pronósticos numéricos mejoran la calidad de los pronósticos debido a que pueden detectar cambios en las condiciones imperantes como por ejemplo el pasaje de un frente o el aumento de la nubosidad. Por otra parte se encontró que tener en cuenta la dependencia estacional de los errores sistemáticos en los pronósticos numéricos, permitió introducir una mejora adicional en los pronósticos probabilísticos de visibilidad. No obstante, esta mejora se observa en los umbrales de visibilidad más altos, ya que estos ocurren con mayor frecuencia. Para los umbrales más bajos que corresponden con los eventos más extremos, considerar la dependencia estacional no produce una mejora, debido a que se reduce considerablemente el tamaño de la muestra a partir de la cual se entrena el modelo dinámico-estadístico. Existen diversos aspectos en los cuales la técnica propuesta puede ser mejorada. La relación entre la visibilidad y los predictores seleccionados, así como algunos aspectos de la distribución de frecuencias de los eventos de visibilidad reducida en Ezeiza, sugieren que en esta estación dominan los eventos de nieblas radiativas. No obstante, esto no implica que puedan ocurrir eventos de niebla asociados a otros procesos. En estos casos, es posible que la relación existente entre la visibilidad y los predictores no sea la misma que para los eventos de nieblas radiativas lo cual conduciría a un pronóstico impreciso.
Este trabajo constituye uno de los primeros estudios dedicados a la verificación objetiva de los pronósticos probabilísticos de visibilidad en la estación Ezeiza y en Argentina. El pronóstico de esta variable ha sido pocas veces abordado en la literatura local sugiriendo un área de vacancia. Esta vacancia se extiende al desarrollo e implementación de modelos de post-procesamiento estadístico que combinen salidas de modelos numéricos y observaciones para incrementar la precisión de los pronósticos. En los últimos años la disponibilidad de conjuntos de datos como los pronósticos globales retrospectivos abre un amplio campo de posibilidades para la implementación e inter-comparación de diversas metodologías que permitan llevar adelante esta combinación.
En el caso particular de la visibilidad existen numerosos aspectos que resta explorar a nivel local. En primer lugar es necesario avanzar en el entendimiento de los procesos que determinan la climatología de la visibilidad en las diferentes regiones de Argentina. Esto no sólo permitirá ganar entendimiento sobre la ocurrencia de este fenómeno en nuestra región sino que además allanará el camino para una selección eficiente de predictores que permitan incrementar la precisión del pronóstico de visibilidad en diferentes regiones de nuestro país. Es posible que en muchos casos, exista más de un proceso asociado con la ocurrencia de eventos de visibilidad reducida, en cuyo caso habrá que diseñar modelos específicos basados en un conjunto de predictores que estén relacionados con cada uno de esos procesos de forma tal de capturar la mayor cantidad de eventos de reducción de visibilidad. Por otra parte es necesario avanzar en la evaluación y comparación de diferentes metodologías como por ejemplo las propuestas por Herman y Schumacher 2016 y la regresión por análogos (Aldeco 2011). En estos trabajos no solo se utilizan técnicas alternativas a las propuestas en este trabajo sino que además se incorporan como predictores la distribución espacial de las salidas de modelo. Algo similar puede hacerse con las observaciones, considerando no solo los valores observados en la estación para la cual se quiere pronosticar sino teniendo en cuenta también las estaciones cercanas (Leyton y Fritsch 2003). Los productos generados a partir de los pronósticos en baja resolución como son los pronósticos retrospectivos, deben ser además comparados con los pronósticos generados a partir de modelos en alta resolución (Matsudo y otros 2015) en donde los procesos de formación de niebla pueden ser representados al menos parcialmente en forma explícita.
Por otra parte, también se debe explorar la utilización de diferentes fuentes de observación. En este trabajo, se utilizaron las series de visibilidad estimada por el observador, dado que constituye el registro más extenso de datos en la estación Ezeiza. No obstante, en la actualidad existen sistemas de observación automáticos que proveen mayor frecuencia temporal de datos y que miden la visiblidad de una manera más local. Incorporar este tipo de observaciones en la calibración de los sistemas de pronóstico dinámico-estadísticos puede ayudar a mejorar el desempeño del pronóstico probabilístico de visibilidad. Otro aspecto fundamental a considerar en los desarrollos futuros será el valor que tiene esta herramienta para los tomadores de decisiones (Richardson, 2006). Este desafío presenta un aspecto interdisciplinario, ya que requiere el diálogo y la co-construcción de conocimiento con los usuarios de la información. Esto permitirá diseñar modelos dinámico-estadísticos en donde las variables resultantes sean diseñadas en conjunto con los tomadores de decisión.

Agradecimientos

Al Servicio Meteorológico Nacional por proveer los datos de la estación meteorológica Ezeiza, los cuales fueron fundamentales para el desarrollo de esta investigación. Al National Centers for Environmental Prediction por brindar acceso a los pronósticos retrospectivos. Este trabajo fue financiado parcialmente por los siguientes proyectos: PICT-2014/1000 y UBACYT20020130100820BA.

REFERENCIAS

1. Aldeco L. S., 2011. Aplicación de la técnica de análogos a la generación de pronósticos probabilísticos de precipitación sobre algunas estaciones de la Argentina. Tesis de licenciatura del Departamento de Ciencias de la atmósfera y los Océanos, Universidad de Buenos Aires. 90 páginas.         [ Links ]

2. Baker, R., Cramer, J. y Peters, J. ,2002. Radiation fog: UPS Airlines conceptual models and forecast methods. In Proc. 10th Conf. on Aviation, Range and Aerospace Meteorology, págs. 154-159.         [ Links ]

3. Bremnes, J. B., and S. C. Michaelides, 2007: Probabilistic visibility forecasting using neural networks. Pure Appl. Geophys., 164, 1365-1381, doi:10.1007/s00024-007-0223-6.         [ Links ]

4.Chmielecki, R. M., and A. E. Raftery, 2011: Probabilistic visibility forecasting using Bayesian model averaging. Monthly Weather Review, 139, 1626-1636, doi:10.1175/2010MWR3516.1.         [ Links ]

5. Gultepe, I., Tardif, R., Michaelides, C., Cermak, J., Bott, A., Bendix, J., Müller, M.D., Pagowski, M., Hansen, B., Ellrod, G., Jacobs, W., Toth, G. y Cober, S.G. ,2007. Fog Research: A Review of Past Achievements and Future Perspectives. Pure and Applied Geophysics. 164, págs1121-1159.         [ Links ]

6. Hamill, T. M. and Juras, J., 2006: Measuring forecast skill: is it real skill or is it the varying climatology?. Quarterly Journal of the Royal Meteorological Society, 132: 2905-2923. doi:10.1256/qj.06.25        [ Links ]

7. Hamill, T. M., Whitaker, J. S., y Mullen, S. L., 2006. Reforecasts: An important dataset for improving weather predictions. Bulletin of the American Meteorological Society, 87(1).         [ Links ]

8. Hamill, T. M., Bates, G. T., Whitaker, J. S., Murray, D. R., Fiorino, M., Galarneau, T. J. y Lapenta, W. ,2013. NOAA's Second-Generation Global Medium-Range Ensemble Reforecast Dataset. Bulletin of the American Meteorological Society, 94(10).         [ Links ]

9. Herman G. R., y Schumacher R. S., 2016: Using Reforecasts to Improve Forecasting of Fog and Visibility for Aviation. Weather and Forecasting. 31, 467-482. doi.org/10.1175/WAF-D-15-0108.1        [ Links ]

10. Gultepe I., Tardif R., Michaelides S. C., Cemak J., Bott A., Bendix J., Muller M. D., Pagowski M., Hansen B., Ellrod G., Jacobs W., Toth G., Cober S. G., 2007: Fog research: A review of past achievements and future perspectives. DOI 10.1007/987-3-7643-84197_3.         [ Links ]

11. Keith R. y Leyton S., 2007.An experiment to measure the value of statistical probability forecast for Airports. Weather and Forecasting, 22, 928-935.         [ Links ]

12. Müller, M. D., Schmutz, C. y Parlow, E., 2007. A one-dimensional ensemble forecast and assimilation system for fog prediction. Pure and Applied Geophysics, 164 (6-7), 1241-1264.         [ Links ]

13. Leyton, S. M., and J. M. Fritsch, 2003: Short-term probabilistic forecasts of ceiling and visibility utilizing high-density surface weather observations. Weather and Forecasting, 18, 891-902.         [ Links ]

14. Quinteros de Menzies, C. Y. Obertello I. ,1978. Pronóstico objetivo de nieblas en Ezeiza. Publicación de la Fuerza Aérea Argentina, Comando de regiones aéreas, Servicio Meteorológico Nacional, Serie C, 12, 32 páginas.         [ Links ]

15. Richardson, D., 2006: Predictability and economic value en "Predictability of weather and climate", Cambridge University Press, editado por Tim Palmer y Renate Hagedorn.         [ Links ]

16. Roquelaure y Bergot, 2008: A Local Ensemble Prediction System for Fog and Low Clouds Construction, Bayesian Model Averaging Calibration, and Validation. Journal Of Applied Meteorology and Climatology. 47, 3072-3088.         [ Links ]

17. Ruiz, J. J., y Saulo, C., 2012. How sensitive are probabilistic precipitation forecasts to the choice of calibration algorithms and the ensemble generation method? Part I: Sensitivity to calibration methods. Meteorological Applications, 19(3), 302-313.         [ Links ]

18. Saha, S., S. Moorthi, H. Pan, X. Wu, J. Wang, S. Nadiga, P. Tripp, R. Kistler, J. Woollen, D. Behringer, H. Liu, D. Stokes, R. Grumbine, G. Gayno, J. Wang, Y. Hou, H. Chuang, H. Juang, J. Sela, M. Iredell, R. Treadon, D. Kleist, P. Van Delst, D. Keyser, J. Derber, M. Ek, J. Meng, H. Wei, R. Yang, S. Lord, H. Van Den Dool, A. Kumar, W. Wang, C. Long, M. Chelliah, Y. Xue, B. Huang, J. Schemm, W. Ebisuzaki, R. Lin, P. Xie, M. Chen, S. Zhou, W. Higgins, C. Zou, Q. Liu, Y. Chen, Y. Han, L. Cucurull, R. Reynolds, G. Rutledge, and M. Goldberg, 2010: The NCEP Climate Forecast System Reanalysis. Bulletin of the American Meteorological Society. ,91, 1015-1057, doi: 10.1175/2010BAMS3001.1.         [ Links ]

19. Tardif R., and Rasmussen R. M., 2007: Event-based climatology and typology of fog in the New York city region. Journal of Applied Meteorology and Climatology, 46, 1141-1168, doi10.1175/JAM2516.1.         [ Links ].

20. Wei, M., Z. Toth, R. Wobus, y Y. Zhu, 2008. Initial perturbations based on the ensemble transform (ET) technique in the NCEP global operational forecast system. Tellus, 60A, 62-79.         [ Links ]

21. Wilks, D. S., 2005. Statistical Methods in the Atmospheric Sciences: An Introduction. Academic Press, 467 páginas.         [ Links ]

22. Waimann, C. 2016, Desarrollo de un sistema de pronóstico estocástico-dinámico de producción de energía eólica basado en el modelo WRF/CIMA. Tesis doctoral de la Universidad de Buenos Aires, 189 pp.         [ Links ]

23. Zhou, B., Du, J., Gultepe, I., y Dimego, G., 2012. Forecast of low visibility and fog from NCEP: current status and efforts. Pure and Applied Geophysics, 169(5-6), 895-909.         [ Links ]

Creative Commons License Todo o conteúdo deste periódico, exceto onde está identificado, está licenciado sob uma Licença Creative Commons