Todos hemos escuchado acerca del potencial que tienen los datos para cambiar prácticamente cualquier industria. Mckinsey & Company ha calculado que los Datos Abiertos gubernamentales pueden agregar a la economía mundial entre tres y cinco billones de dólares (5,000,000,000,000). No tengo duda de que los datos generados por los gobiernos pueden ser un gran catalizador de la innovación, pero me parece que estamos dejando fuera de la discusión lo que pueden generar aquellos datos que no son gubernamentales.

Los datos que actualmente están dentro del debate son tan solo una fracción de la totalidad de los datos que podríamos tener disponibles. El gobierno no recolecta datos de redes sociales, ni tendrá datos obtenidos de coches autónomos, búsquedas, lectura y aprendizaje en línea, compras, y el sin fin de actividades que se pueden realizar en la red. Se calcula que el volumen de datos generados anualmente a nivel mundial en 2025 ascienda a 163 zettabytes (1 zettabyte = 1,000,000,000,000 gigabytes /1 gigabyte es aproximadamente el peso estándar de una película), y me parece crítico que comencemos a discutir cómo obtendremos valor de estos datos, que no son generados por el gobierno, que son gran parte de la información que generamos.

Imaginemos que los datos abiertos gubernamentales sean el 10% de los datos disponibles a nivel mundial (una estimación conservadora a favor del peso de la información del gobierno); esto querría decir que el potencial económico de que todos pudiéramos acceder a los datos generados en plataformas privadas sería entre 30 y 50 billones de dólares. Para ponerlo en perspectiva, el PIB de México en 2016 fue de alrededor de un billón de dólares, el de Estados Unidos de 18 billones y el del mundo de 75 billones.

El primer debate importante en este tema está relacionado con la propiedad de los datos. ¿De quién son estos datos si se generan gracias a la participación de dos partes: la infraestructura de la plataforma y el usuario? Esta discusión es en sí misma fascinante, pero parece que el debate favorece a los usuarios en diversas legislaciones del mundo: si los datos pueden ser asociados a una persona, pertenecen a esa persona. Entre los motivos de esta tendencia es que a pesar de que la posesión de información no es excluyente entre distintos entes, que alguien posea información sobre ti interfiere con tu esencia, puede ser utilizado en tu contra, y sobretodo no te permite ejercer tu privacidad de forma plena.

Por otro lado, no es evidente que las plataformas digitales permitan a los ciudadanos acceder a sus datos de forma sencilla y sobre todo automática. Algunas plataformas como Facebook y Google permiten a los usuarios descargar sus datos, pero muchas otras no. Sin embargo aquellas que lo hacen no tienen opciones para hacerlo de forma recurrente sin repetir el proceso, y mucho menos para que sean enviadas a un tercero. Desde cierta perspectiva, se han apropiado de facto de estos datos, pues son ellos quienes los comercializan y los ciudadanos parecen estar inmersos en problema de acción colectiva en el que no pueden generar valor a través de su propia información.

¿Cómo puede cambiar esto? En principio no debería de ser muy complicado, ya que las leyes lo prevén. Sin embargo, los gobiernos no han logrado tener un entendimiento profundo de las características técnicas y de usabilidad para que la implementación de esta política sea exitosa. Una propuesta es la siguiente: cualquier encargado (plataforma digital) de datos personales debe de permitir a los usuarios asignar un destino final de sus datos de forma automática. Este destino final puede ser el mismo titular de los datos o cualquier otro tercero. Para que esta transferencia sea automática los servicios digitales deberán de implementar una API (Interfaz de Programación Aplicaciones) similar a la que utilizan para vender nuestros datos. Sin entrar en detalles técnicos, mediante esta API el usuario final podría definir qué datos son transferidos y con qué frecuencia. Incluso podrían enviar estos datos sustituyendo su identidad por un identificador aleatorio. Si algo similar se vuelve realidad, veo dos formas distintas por las que se podría generar valor: interoperabilidad de los datos y generación de una masa crítica que permita analizar los datos sin que su venta funcione como un monopolio.

La portabilidad de datos tiene como consecuencia principal aumentar la competencia económica. Imaginemos que un consumidor quiere dejar de utilizar Google, Facebook, Spotify o cualquier plataforma por cualquier motivo (probablemente porque no le parece que sea el target de publicidad relacionada a la búsqueda que realizó hace 10 minutos y en otro dispositivo). Es claro que en el esquema actual este usuario perdería algunos beneficios que están directamente relacionados con su actividad histórica en estas plataformas; mejor conocido como Switching Costs. Por ejemplo, si un usuario quiere cambiar su servicio de medicina online, el historial generado durante su relación con el proveedor anterior de ese servicio resulta clave para un mejor diagnóstico futuro. ¿No debería de este usuario poder transferir su historial médico a su nuevo médico digital? ¿Este mismo usuario no debería tener la capacidad de transferir automáticamente sus historial médico digital a su compañía de seguro cada cierto tiempo? Este problema es muy similar al que vimos en México hace algunos años con el surgimiento de nuevas compañías telefónicas; dado que existía una gran aversión a cambiarse de compañía telefónica porque no era posible conservar el número telefónico previo el gobierno obligó a las compañías telefónicas a entregar el número telefónico a los usuarios que quisieran cambiar de proveedor (en ese momento fue una política pensada en la desmonopolización de Telcel).

La segunda es la más obvia y probablemente la más difícil de lograr: análisis de información que pueda beneficiar a personas y organizaciones más allá de las empresas digitales cuasi-monopólicas actuales. Los datos de una persona, que es como pueden y deberían de ser accesados por los usuario, no generan valor por sí mismos. Es decir, una observación dentro de miles de millones de usuarios no sirve para realizar ningún análisis estadísticamente significativo. Esto genera un problema de acción colectiva ya que para que estos datos sean valiosos es necesario llegar a una masa crítica. La información centralizada es muy similar a un bien público, pues todos se verían beneficiados de que fuera concentrada, pero ningún individuo tiene los incentivos para hacerlo. Por lo tanto, es necesario que un tercero intervenga como concentrador de esta información.

¿Quién debe ser este tercer jugador que recibe los datos?  Definitivamente no debe de ser el gobierno (por lo menos no el mexicano), ya que no tiene la capacidad técnica ni los incentivos para tratar la información con la seguridad necesaria para evitar violaciones a la privacidad. Su papel, es generar las condiciones necesarias para un mercado de organizaciones dedicadas a centralizar y analizar información de distintas plataformas digitales. En esta regulación es crítico obligar, como se hizo en el caso de la telefonía celular, a todas las plataformas digitales a implementar sistemas de transferencia de datos automáticos.

¿Y tú, qué harías con tus datos?

Emmanuel Gama Ibarra
Consultor en OPI Analytics