Frecuentemente, en el desarrollo de estudios hidrológicos, sea con fines de caracterización o con fines de diseño, se encuentran omisiones, incongruencias e inconsistencias en la información hidrológica base para tales estudios. Eso es atribuible al procedimiento de medición y almacenamiento de la información, que, al ser realizado por personal no necesariamente bien capacitado, presenta por lo general estos problemas como intrínsecos. En efecto, este hecho, sumado a la poca presencia de textos o guías que traten el tema desde un enfoque local, hace aún más complejo el trabajo con información hidrológica, de lo que por sí mismo ya es. En vista de ello, el presente artículo trata de ordenar los conocimientos que se han ido desarrollando en el tratamiento de información hidrológica, procurando llenar un poco este vacío y, por qué no, motivar en algo la discusión e investigación en este tema. A continuación, se listan los problemas más comunes en el tratamiento de información hidrológica. Seguidamente, se desarrollará cada uno de ellos, tratando de mencionar algunas alternativas de solución, que si bien no son las únicas, han dado resultados aceptables en los estudios en que han sido aplicadas. - Presencia de datos atípicos (outliers) - Inconsistencias en la información - Datos faltantes - Poca extensión del registro Debido a lo extenso del tema a tratar, el artículo será presentado en cuatro partes. En esta primera parte, se procurará tratar lo más analíticamente posible el primer caso: la presencia de datos atípicos en las series hidrológicas. 1. Presencia de datos atípicos (outliers) Este es un concepto más estadístico que hidrológico; sin embargo, su aplicación es sumamente práctica en el tratamiento de información hidrológica. Son valores que se alejan significativamente de la tendencia del resto de la información, los cuales, de no ser descubiertos a tiempo, alterarán irremediablemente los resultados del estudio, invalidándolos, especialmente en series de poca cantidad de datos. En la siguiente tabla, se muestra un ejemplo claro de un dato atípico en una serie de precipitación total mensual del mes de enero de una estación pluviométrica cualquiera. Su existencia se puede atribuir a diferentes causas, por ejemplo, un error de escritura en la toma de información en campo o en el proceso de digitalización de esta (por ejemplo, que se haya colocado 77 mm, en vez de 7,7 mm). Vale aclarar que, siendo sensatos, nunca se podrá tener completa seguridad que un valor identificado como un outlier es necesariamente producto de un error, ya que puede deberse a eventos meteorológicos atípicos, pero reales. Teniendo esto en cuenta, se recomienda en una primera instancia considerarlos como datos dudosos, quedando ya en el criterio del evaluador tomar la decisión de eliminarlos o no. Para la identificación de datos dudosos, se recomienda realizar en conjunto una inspección visual de toda la información que se tiene, probablemente ayudándose de unas gráficas, así como el uso de pruebas estadísticas. Las pruebas estadísticas que pueden utilizarse para detectar outliers, servirán principalmente para determinar umbrales superiores e inferiores para cada grupo de registros analizado, de tal manera que los valores que se excedan de los umbrales, sean considerados outliers. A continuación, se muestra una prueba estadística bastante sencilla, que involucra el primer y tercer cuartil (Q1 y Q3) de la muestra. Sea “x” un valor cualquiera de una serie hidrológica, Estas pruebas se aplicarán para cada grupo de datos que deban guardar cierta tendencia. Por ejemplo, en registros de información mensual, en los valores de un mes en particular. Es decir, se tomará cada mes de cada estación como una muestra, a la cual se le realiza una prueba estadística, con el fin de detectar algún outlier. No obstante su detección, no se podrá proceder a su eliminación directa, sino que se deberá analizar caso por caso. Esto último se debe a que podría tratarse efectivamente de un valor fuera del rango, pero que sí responde a un suceso extremo en la meteorología de la zona. Sin embargo, de ser este el caso, las estaciones aledañas deberán también haber registrado un suceso fuera de lo normal. De no ser así, podría ser justificable su eliminación. Para detectar estos casos, se debe preparar una tabla con el resumen de todos los outliers identificados en los registros de cada estación con que se cuenta para el estudio. Posteriormente, se deberá revisar la información de las estaciones aledañas en el mismo periodo de tiempo, y en base a eso, tomar una decisión sobre eliminarlos o no. Luego de eliminados, posteriormente, se procederá a rellenarlos como si nunca se hubiera contado con estos valores. Por ejemplo, si adicionalmente a la estación presentada anteriormente, se cuenta con una estación aledaña a la primera, con la siguiente distribución: En este caso, se puede ver que ambas estaciones presentan un valor excesivamente alto en el mes de enero de 1998, por lo que podría atribuirse a que en este mes se dio un evento meteorológico particular en la zona, que originó esos valores, por lo que sí corresponden a la realidad. Es decir, podrían mantenerse como parte del análisis, ya que representan variaciones propias de la meteorología de la zona.
0 Comentarios
Deja una respuesta. |
Ingeniería de Recursos Hídricos
Categorías
Todo
Archivos |