Hace un par de años alguien twitteó que Chile era afortunado porque todos los terremotos habían sido de noche, en fin de semana o algo así, entonces no interrumpía mucho la vida cotidiana y era más fácil evacuar y estar a salvo. Aparte de olvidarse del terremoto del 2010 y sus víctimas por el tsunami me pareció que tampoco tenía idea del sesgo de la disponibilidad.

El sesgo o heurística de disponibilidad es aquel que todos sufrimos cuando nos preguntan por ejemplos de algo. Nuestro cerebro NO nos entrega una muestra estadísticamente representativa de la realidad, sino que los ejemplos que más nos han impactado, gustado, o por casualidad nos hemos fijado. Generalmente estos sesgos además se van alimentando así mismos, porque cuando nos llega nueva información y la comparamos con lo que tenemos en la mente, nos decimos “¡todo calza!”. No los sigo aburriendo, si quieren saber más lea wikipedia o, mejor aún, el libro del Nobel de economía Daniel Kahneman, “Thinking, fast and slow”.

Sabiendo que el susodicho estaba sufriendo de ese sesgo, pero sin contar con evidencia histórica para decirle algo con fundamentos, se me ocurrió la “genial” idea de analizar la hora, día de la semana, mes, estación, etc de los terremotos relevantes de los últimos 120 años.

¡Llévame a lo bueno! Si no quieren leer toda la historia, vayan al final a ver los gráficos.

Lo primero era encontrar una buena base de datos y para eso encontré la de la U.S. Geological Survey, o USGS pa' los amigos, que tiene unas APIs magníficas para bajar lo que quieras. Habiendo bajado todos los terremotos de más de 5 grados con sus coordenadas y hora en gmt+0 me puse a analizar superficialmente. A nadie le sorprenderá que la hora de los terremotos distribuye básicamente uniforme durante el día y los días de la semana.

Ejemplo teórico de cómo se ve la distribución de los terremotos sobre la hora del día.

Como ya me había tomado una semana para hacer algo tan básico no le iba a responder el tweet, pero sí desafiarme a mi mismo.

¿Qué pasa con las horas locales, solo analizaste en base a gmt? ¿Qué pasa con la estación del año? Analizaste hasta temblorcitos de 5 grados, ¿qué pasa con los terremotos relevantes que asustan a la gente?

Como saben, cuando me pongo a pensar en algo recibo la misma satisfacción de mi cerebro cómo si de verdad la hiciera, así que todas esas preguntas quedaron sin respuesta (me imaginé respondiéndolas, entonces la respuesta fue irrelevante). Pero, como también saben o debieran saber estamos viviendo una pandemia global que nos tiene a todos más o menos aislados y a algunos con un poco más de tiempo para hacer tonteras.

Así, les presento el análisis y el camino recorrido para llevarlo a cabo.

Camino recorrido

Ajustando los datos

Lo primero a hacer era ajustar la hora del terremoto o temblor a su hora local. La base de USGS viene con ubicación, pero no para todos y en un formato no uniforme. Sí viene con las coordenadas, así que era cosa de encontrar la zona horaria para ellas. La cosa era cómo.

Usando un sitio web especializado, encontré varios hilos en Stack Overflow que hablaban de la misma necesidad y se nombraban varias APIs públicas. Después de un profundo análisis (era la más fácil y más gratis) elegí GeoNames que tiene una API para exactamente lo que quería. Solo había un problema, cómo usar esa API para ajustar los 86.184 terremotos en la base…

Esta vez no cometí errores del pasado, así que programé 4 líneas en php para que hiciera el ajuste por mí. El único tema era mi conexión a internet (un prepago Entel 3g, porque a la antena no le da pa 4g) y la velocidad de la API de GeoNames (además de solo permitir 20.000 consultas diarias). Dejaba el código corriendo mientras trabajaba, pero al dejar el computador inevitablemente tenía que detenerlo o la inestabilidad de la conexión lo mataba. En algún momento saqué la cuenta del tiempo que se iba a demorar y eran 11 días corriendo las 24 horas. Por suerte mejoró y solo fueron unos 5 días, o alrededor de 43 horas si lo hubiera dejado corriendo.

Analizando

Ya tenía los datos ajustados a su zona horaria, ya tenía las coordenadas pa saber si era invierno o verano, ¡podía empezar mi análisis!

Lo primero era ver con respecto a la hora del día, ¿hay alguna tendencia a que sean de noche? ¡NO! Distribuyen bastante uniforme…

“Ya, pero la persona que twiteó hablaba de los terremotos. ¿Qué pasa si sólo miras los terremotos de más de 7 grados?”. Lo que pasa, ¡es que distribuyen igual de uniforme! Ese peak a las 11 no cambia mucho la cosa.

“OK, pero estás mirando 120 años de historia, ¿cómo salen los últimos 40 años, que son la base del argumento del susodicho?” No es tan claro, porque son muy pocos datos, pero a simple vista no hay cosas raras… Bastante uniforme.

En resumen, les puedo contar que no hay ninguna cosa rara con la hora o fecha de los terremotos. Hay una probabilidad estadística totalmente uniforme para la estación del año, la hora del día o el día de la semana para que ocurra un terremoto, relevante (>7 grados) o no.

Hay algunas excepciones, como el hecho de que nunca ha habido un terremoto de más de 8 grados a las 0 ó 2 hora local, pero tampoco ha habido muchos terremotos de más de grado 8 en la historia (son 71 en total). Quizás sea merecedor de ser un Dato Freak.

Ahora, les dejo algunos gráficos pa que esto no sea tan fome (aburrido para los no chileno-parlantes):
Nota: Para las estaciones del año y pensando que la temperatura puede ser un factor relevante, sólo se consideran los terremotos más al sur o norte de los trópicos. Los meses “calientes” para el hemisferio norte son entre Abril y Septiembre, para el sur son entre Octubre y Marzo.
Nota2: Los terremotos de más de 8 tienen saltos “entretenidos” porque son muy pocos y poco representativos, no dejes que tu cerebro te haga creer tonteras.

Conclusiones y futuros desarrollos

En conclusión, no hay evidencia suficiente que indique una correlación entre la hora del día, el día de la semana, el mes del año o la estación y la ocurrencia de un terremoto.

¿Queda alguna pregunta por hacer? ¿Algún gráfico que sea fácil de hacer y pueda subir acá? ¿Algún análisis que falte? Por ejemplo, ¡cómo variaron las temperaturas del día anterior, el día del terremoto y el día siguiente! Mi intuición es que no habrá nada relevante. Puedes recrear los pasos de este post y responder esas preguntas tú mismo.