Mitos Big Data
Seguimos hablando de Big Data. En numerosas ocasiones leemos que va a cambiar el mundo, y eso es cierto, pero a veces se confunden los deseos con la realidad. A pesar de la enorme versatilidad de las soluciones basadas en datos, también hay creencias o mitos en torno a esta disciplina que se repiten y que carecen de base.
Te comparto algunos mitos del big data más extendidos en los últimos tiempos:
1. Muchos datos = big data. No siempre, puede que estemos recogiendo un volumen enorme de información, pero que no sirva para el problema que queremos resolver porque no es representativa.
Por ejemplo, si tenemos acceso a millones de historias clínicas de determinado país, esos datos no nos permitirán hacer predicciones correctas sobre las posibilidades de un paciente de desarrollar diabetes o melanoma en cualquier otro, aunque el sistema sea muy preciso para la población inicial. Tampoco podemos deducir los gustos musicales de los mayores de 50 años estudiando las listas de reproducción de los estudiantes del secundario.
2. Con big data podemos predecir cualquier fenómeno. Para que esto sea cierto es imprescindible que lo que estemos estudiando no sea completamente aleatorio. No podemos predecir qué número resultará premiado en el sorteo de la lotería de Navidad, aunque sepamos los resultados de los 100 años previos, porque está relacionado con el puro azar.
Por el contrario, sí podemos estimar que el equipo de fútbol A ganará al equipo B siete de cada diez veces que se enfrenten por el análisis de resultados recientes. El deporte no es completamente aleatorio.
3. El big data puede solucionar ‘todos’ los problemas. Según muchos, el big data iba a parar el COVID-19 a principios de la pandemia, pero ¿por qué no fue capaz de impedir su propagación? En las primeras semanas vimos muchos modelos predictivos que estimaban la evolución del número de contagiados o fallecidos, y casi todos fallaron de manera estrepitosa. Esta pandemia no tiene precedentes, afortunadamente no tenemos siglos de experiencia ni datos, y por eso resultaba muy aventurado hacer predicciones.
Por el contrario, todos los años las autoridades sanitarias prevén con gran acierto cuántos contagios va a haber de gripe y en qué semana va a suceder el pico. La clave está en que la gripe es recurrente y tenemos una serie histórica de datos representativa sobre la que basarnos.
Exiten muchísimos más ¿conocés alguno?