El instrumento tradicionalmente utilizado para conocer las preferencias electorales y así, en tiempos de campaña, poder predecir con alguna base el ganador electoral son, sin lugar a dudas, las encuestas cara a cara en hogares. Sin embargo, con la popularización y penetración del internet y sus principales plataformas, podemos contar con nuevas fuentes de datos para conocer las preferencias electorales de los votantes. En este sentido, se trata de un importante complemento a las fuentes de datos tradicionales.


Ilustración: Adrián Pérez

Además de configurarse como un espacio de discusión alternativo frente a los medios tradicionales, el internet se ha convertido hoy en día —gracias en buena medida a su historial de interacciones— en una importante fuente de datos para las ciencias sociales. En México, casi el 60% de la población usa internet en 2016 y llega a casi 75% para los grupos de edad de 18 a 44 años. El día de hoy analizamos una fuente de datos que puede ser de gran utilidad para analizar esta elección: el índice de Google Trends. Este índice es complementario a encuestas en hogares porque indica interés sobre los candidatos a elección.

Google, el motor de búsquedas más popular de nuestros días, hace público un índice basado en el número de búsquedas por tema que recibe día con día. Dicho índice va de 0 a 100, en donde 100 corresponde al día y al término con más búsquedas de todo el periodo, y se construye con base en una muestra del total de búsquedas que Google recibió en el lugar determinado. De este modo, aunque no podamos saber con exactitud cuál es el número total de búsquedas que recibe cada término, sí podemos entender cómo es que el interés por dichos temas va evolucionando a través del tiempo.

¿Nos puede ayudar Google para predecir elecciones en el pasado?

Las búsquedas en Google reflejan interés por un candidato, no necesariamente preferencia a favor del mismo. También otro aspecto a considerar es que no toda la población realiza búsquedas en Google. Sin embargo, se esperaría que conforme la penetración de internet es mayor, las búsquedas en Google sean un factor más relacionado con el resultado de la elección, si el interés por candidato no cambia sustancialmente. De esta forma, y con esos inconvenientes en mente, presentamos los resultados del índice para las elecciones anteriores (2006 y 2012) y posteriormente ara la actual.

En 2006, el primer año electoral para el que disponemos del Índice de Google Trends, el comportamiento de éste es sumamente volátil. Sin embargo, los promedios del índice (al lado derecho del nombre de cada candidato) nos muestran algo contundente: Andrés Manuel López Obrador logró acaparar mucho más interés durante prácticamente el primer cuatrimestre de 2006 que el resto de los candidatos, un 62% más que Felipe Calderón Hinojosa.

Estos datos no reflejan las preferencias electorales capturadas por la poll-of-polls retrospectiva hecha por Oraculus: la última observación de abril de 2006 ponía a Felipe Calderón a la cabeza con 35.5% de la intención del voto y a Andrés Manuel López Obrador detrás con el 34.8%. Además, la votación final terminó igual de cerrada: FCH obtuvo el 35.89% de los votos mientras que AMLO el 35.31%. En este sentido, para este año, mayor intensidad de búsquedas no parece reflejar necesariamente mayor afinidad política y no parecen ser un buen indicador de las preferencias electorales del país. Como se mencionó, es posible que la muestra que usa búsquedas en internet es sustancialmente diferente a la población en promedio.

En 2012 podemos observar que el índice de Google Trends se comporta ya con mucho menos volatilidad y, además, presenta un reflejo mucho más claro de las preferencias electorales del momento. En promedio, Enrique Peña Nieto fue buscado 1.6 veces más que Andrés Manuel López Obrador durante el periodo que va del primero de enero de 2012 al 6 de mayo. De acuerdo con la primera observación de encuestas que tiene Oraculus para mayo de 2012, Peña Nieto contaba con el 48.5% de la intención del voto mientras que AMLO con el 23%. El resultado electoral, aunque mucho más apretado, mantuvo esta tendencia: EPN recibió el 38.15% de los votos y AMLO el 31.64%.

En este sentido, el interés demostrado en las búsquedas en Google durante esta campaña sí parecen ser un buen indicador de las preferencias electorales. De hecho, el índice de Google Trends mostró antes que las encuestas una pérdida de interés por la candidatura de Josefina Vázquez Mota: el 13 de febrero AMLO se convirtió en el segundo candidato más buscado en esta plataforma.

El que las búsquedas de Google hayan sido mejores predictores del resultado electoral en 2012 que en 2006 se debe, sin duda, a múltiples razones. Sin embargo, nos detendremos en una que nos parece fundamental: la mayor penetración de Internet en nuestro país. De 2006 a 2012 el número de individuos mayores de edad con acceso a internet creció en un 120%, lo cual significa que el subconjunto de votantes que están potencialmente buscando a los candidatos en Google se parece mucho más (en términos sociodemográficos) a todos los votantes en 2012 que en 2006.

¿Cómo se ven las búsquedas de Google en esta elección?

Este año, las búsquedas en Google de los candidatos presentan dos claros “picos”: el 2 de abril ─que puede ser atribuible al arranque de las campañas─ y el 23 de abril, un día después del primer debate presidencial. Sin embargo, con excepción del 3 de marzo (cuando las acusaciones de lavado de dinero en contra de Ricardo Anaya se encontraban en su apogeo), Andrés Manuel López Obrador se ha mantenido sistemáticamente a la cabeza.

Al igual que en 2012, las tendencias mostradas por Google son consistentes con la poll-of-polls de Oraculus: AMLO ha estado consistentemente encima en ambas fuentes de datos y Ricardo Anaya ha consolidado el segundo lugar. Además, AMLO presenta tanto poco más de dos búsquedas que Anaya como 1.5 mayor intención de voto (de acuerdo con la última estimación de Oraculus para abril). 

¿Cómo hacer este índice más confiable?

Un potencial conflicto de este índice es que captura el total de búsquedas hechas en todo el país, por lo que puede ser fácilmente manipulado por bots o grandes equipos de personas que busquen recurrentemente a un candidato. Por este motivo, decidimos generar una medida propia basada en el índice de Google Trends que sea más difícil de manipular. El procedimiento es el siguiente:

• Tomamos el promedio de búsquedas por semana en cada entidad federativa.
• El índice de Google no permite comparar búsquedas entre entidades. Por tanto, calculamos el cociente de búsquedas de cada candidato con respecto a las búsquedas de José Antonio Meade para obtener las búsquedas relativas con respecto a este candidato en cada entidad (por ejemplo, con Ricardo Anaya calculamos: IGTAnaya/ IGTMeade).
• Para generar el índice nacional promediamos el valor de estos cocientes por estado, ponderándolos por el padrón electoral de cada entidad federativa.

Creemos que nuestro índice tiene, por lo menos, dos importantes ventajas. En primera instancia, es más difícil manipularlo ya que, para inflar artificialmente el valor de un candidato, sería necesario hacer búsquedas en múltiples entidades federativas. Además, al presentar valores de las búsquedas relativas a Meade, podemos comparar de forma mucho más sencilla cómo va evolucionando el interés por cada candidato.

En nuestro índice podemos observar una brecha mucho más acentuada y más clara entre las búsquedas por Andrés Manuel López Obrador y el resto de los candidatos (no se incluye a Jaime Rodríguez por valores bajos en el índice). Además, tal como lo han mostrado las encuestas, nuestro índice muestra que el interés por el candidato de la coalición entre Morena, PES y PT ha venido creciendo de enero a la fecha. Si bien es cierto que ha presentado algunas caídas, ha pasado de ser buscado 2.5 veces más que Meade a ser buscado 6.1 veces más.

Por otro lado, podemos observar también en la gráfica el ascenso de Ricardo Anaya. Si bien es cierto que inició el año siendo menos buscado que José Antonio Meade, cerró la última semana de abril con dos veces más búsquedas que el candidato priista.

Conclusiones

Indudablemente las encuestas están jugando un papel fundamental en esta elección y el valor informativo de las polls-of-polls como Oraculus es enorme para dotarnos de información acerca de las preferencias del electorado. Sin embargo, debido al cuidado metodológico que conllevan y al alto costo de levantarlas, son publicadas con una periodicidad menos frecuente de la que nos gustaría.

Ante el vacío informativo que se genera entre la publicación de una ronda de encuestas y la ronda subsiguiente, creemos que el internet puede proveernos de información oportuna y periódica que, además, estime relativamente bien las preferencias electorales. Concretamente, las búsquedas en Google durante este primer cuatrimestre sí parecen dar luz en torno a la intención del voto de la ciudadanía.

Si bien es cierto que las búsquedas en Google no necesariamente demuestran el apoyo hacia algún candidato, hasta el momento el interés en este motor de búsquedas se comporta de forma muy similar a las preferencias capturadas por las encuestas. Por este motivo, creemos que Google Trends es una fuente de datos fundamental para entender mejor el proceso electoral en el que estamos inmersos.

 

Raymundo Campos es Profesor-Investigador de El Colegio de México y es Doctor en Economía por la Universidad de California, Berkeley.

Sergio López es egresado de las Licenciaturas en Economía y Ciencia Política del ITAM.


Nota: El valor del índice de Google Trends depende de los términos de búsqueda que se ingresen en el motor para calcularlo. Pese a que Google cuenta con una herramienta que aglutina automáticamente todos los términos de búsqueda relacionados con un mismo tema, preferimos tener más control sobre las búsquedas e introducir nosotros mismos los términos. Estas son las búsquedas que utilizamos para cada candidato:

Andrés Manuel López Obrador: amlo + AMLO + "Lopez Obrador" + "López Obrador" + peje

José Antonio Meade Kuribreña: meade + Meade + "Pepe Mid” – “joaquin meade” – “ernesto meade” – “joaquín meade

Ricardo Anaya Cortés: "ricardo anaya" + "Ricardo Anaya" + "Anaya" + "anaya"

Margarita Zavala Gómez: Margarita Zavala + "margarita zavala"

Enrique Peña Nieto: "Enrique Peña Nieto" + "Enrique Peña" + "Peña Nieto" + "EPN" + "epn" + "peña nieto"

Josefina Vázquez Mota: Josefina Vazquez Mota + "Vazquez Mota" + josefina vazquez mota + "vazquez mota"

Gabriel Quadri de la Torre: Gabriel Qadri + gabriel qadri + "quadri" + "Quadri"

Felipe Calderón Hinojosa: "Felipe Calderon" + "felipe calderon" + calderón

Roberto Madrazo Pintado: "Roberto Madrazo" + "roberto madrazo" + madrazo