Errores en la interpretación de datos estadísticos
Aunque pareciera un tema lejos de los SIG la estadística juega un rol muy importante. Muchos de los análisis geográficos se basan en la interpretación de datos estadísticos para dar respuestas a los problemas que aparecen en el día a día. A continuación, he realizado un análisis sobre los principales errores que se pueden dar cuando se trabaja con datos estadísticos, así como también como podemos los podemos evitar. Finalizo con una conclusión en donde expongo sobre la responsabilidad que tenemos como profesionales de presentar estadísticas transparentes y reconocer las limitaciones de nuestros análisis.
Entre los principales errores que se pueden dar en la interpretación de los datos estadísticos están el sesgo, la sobreinterpretación y subinterpretación de los datos, la generalización de los resultados, error del muestreo y la inferencia causal incorrecta, entre otros.
En cuanto al sesgo, el investigador de forma consciente o inconsciente interpreta los datos no como realmente reflejan los resultados, sino que su análisis se inclina por un punto de vista en particular y de su preferencia. Este sesgo también puede darse al momento de seleccionar los datos del muestreo los cuales pueden inclinar el resultado hacia donde el intérprete requiere.
Por otro lado, los datos estadísticos pueden ser sobreinterpretados o subinterpretados y esto puede ser producto de la baja calidad de los datos utilizados. Datos incorrectos pueden ocasionar que el analista o investigador cometa errores en la interpretación del resultado estadístico, como, por ejemplo, una muestra con errores puede producir un resultado que no refleja la realidad de la población de estudio y por lo tanto se puede sobreestimar o subestimar las cifras.
La generalización puede darse cuando la muestra no refleja la realidad poblacional y se generaliza el resultado como el comportamiento de toda la población, lo cual no es siempre correcto. El error se presenta cuando a pesar de que la muestra no está sujeta a las condiciones para reflejar el campo poblacional, por ejemplo, insuficientes datos, el investigador decide tomar esa muestra para llegar a una conclusión la cual puede llevar a la obtención de resultados no relacionados a la realidad.
Otro error común en la interpretación de los datos puede darse por la inferencia causal al deducir que un fenómeno es la causa de otro fenómeno, pero no necesariamente es así pues pueden que existan otras causales que determinen el desarrollo de este fenómeno.
Los errores en el muestreo, puede ser uno de los errores más importantes en la interpretación de los resultados. Una muestra mal tomada puede ocasionar que el análisis y los resultados no sean significativos y no representen la realidad. Un muestreo diseñado con una metodología adecuada permite obtener una muestra representativa de la población de estudio.
Entre las acciones que se deben tomar para minimizar y evitar los errores antes mencionados, es revisar la calidad de los datos y las fuentes porque de esto dependerá la confiabilidad de los resultados. Por lo tanto, el investigador debe asegurarse que la base datos estadísticos sea completa, confiable y verificable. También es importante revisar el tipo de datos que se tiene, ya que los mismos pueden estar sesgados e influir en los resultados y su interpretación. Para evitar la inferencia causal se debería recoger más información en la investigación para ampliar la muestra y determinar las causas reales del fenómeno de estudio.
Finalmente, se debe reconocer que las estadísticas son una forma aproximada de conocer la realidad y evaluarla y son fácilmente manipulables por lo que no serán 100% confiables. Por lo tanto, como profesionales debemos ser éticos y responsables realizando el análisis y la interpretación estadística los más apegado a la realidad. Desde la recolección de los datos, se debe identificar si estos servirán para nuestro fin y no escogerlos para nuestra conveniencia. Las limitaciones pueden darse por la insuficiencia de datos para medir el fenómeno y esto debe ser comunicado a los usuarios. En conclusión, como profesionales y en especial como analistas de información geográfica debemos demostrar que nuestros análisis y resultados han sido realizados de manera imparcial, transparente y reconocer las limitaciones existentes.