Qué significa Big Data y Data Science
Big Data ( o Grandes volúmenes de datos).
El crecimiento de los datos provocados en Internet y otras áreas (Ej. Genómica) hacen necesarias nuevas técnicas para poder acceder y utilizar estos datos.
Al mismo tiempo estos grandes volúmenes de datos ofrecen nuevas posibilidades de conocimiento y nuevos modelos de negocio. En particular, en Internet, este crecimiento comienza con la multiplicación en el número de webs comenzando los buscadores (ej. Google) a buscar nuevas formas de almacenar y acceder a estos grandes volúmenes de datos. Esta tendencia (blogs, redes sociales, IoT …) está provocando la aparición de nuevas herramientas de Big Data y la generalización de su uso.
Data Science (o Ciencia de Datos).
La oportunidad que los datos ofrecen para generar nuevo conocimiento requiere de técnicas sofisticadas de preparación de estos datos (estructuración) y análisis de los mismos. Así en Internet, sistemas de recomendación, traducción automática y otros sistemas de Inteligencia Artificial se basan en técnicas de Data Science.
CASO PRÁCTICO 1. Situaciones de riesgo en menores
Nancy Lublin, empleada de una ONG de ayuda a los jóvenes en EEUU, cuenta que en 2011 recibió una alarma con un texto de una chica que decía: “No para de violarme. Me ha dicho que no se lo diga a nadie. Es mi padre”. Este hecho hizo que Lublin creara la organización Crisis Text Line (CTL).
CTL recibe millones de conversaciones en formato de texto (Big Data), ya que esta es la forma más habitual de expresión de los jóvenes. A partir de este gran volumen de datos (Big Data) en formato de texto, ha desarrollado algoritmos de Inteligencia Artificial (Data Science) que permiten detectar situaciones de riesgo de adolescentes, ponerlas en conocimiento de voluntarios y recomendar acciones que ayuden a minorar este riesgo.
Así por ejemplo, a partir de una conversación de chat de un adolescente, el sistema puede determinar que hay un 99% de probabilidad de un problema de abuso de drogas, alertar a un voluntario para que chatee con esta persona y dar al voluntario pautas a seguir e información de los centros de programas de rehabilitación que hayan cercanos al adolescente en cuestión. Enla imagen, exponemos un ejemplo ficticio de cómo funcionaria el sistema de CTL:
Actualmente, CTL responde a más de 6,5 millones de textos evitando, en promedio, dos intentos de suicidios de jóvenes al día. Además, CTL pone toda estos datos a disposición de otros organismos que puedan ayudar como son la Policía, Servicios Sociales, etc. Ofreciendo además información agregada de sus datos como puede verse en la imagen:
CASO PRÁCTICO 2. Abandono escolar en Andalucía
En Andalucía la tasa de abandono escolar es del 23 %. Se trata de la tasa de abandono más alta de España. La media española es del 19 %. Actualmente, el objetivo de Andalucía es reducirlo al 15 % en cuatro años.
¿Qué puede ofrecer el Big Data y Data Science a este problema?
En particular la analítica predictiva (Data Science) permite predecir con antelación la probabilidad de que un niño abandone sus estudios básicos. Si además se dispone de grandes volúmenes de datos relacionados con la actividad de cada alumno, su situación social-familiar, entre otros datos (Big Data), se ha comprobado que la exactitud de estas predicciones puede ser muy alta. Así ocurre en un estudio de la Universidad de Copenhague, en el que se llega a predecir con un 93 % de exactitud los casos de abandono escolar. Lógicamente, este modelo debe ser complementado con otras acciones como un protocolo de ayudas, subvenciones o acciones concretas para mejorar e incentivar al alumno a finalizar sus estudios académicos.
¿Porqué un sistema de este tipo puede tener éxito en Andalucía?
Un caso de éxito extrapolable a Andalucía es el de las Escuelas Publicas en Tacoma (Washington, EEUU). En estas escuelas la tasa de abandono escolar (Dropout) estaba en el 45 % en el año 2010 –la media nacional en EEUU en aquel año estaba en el 19 %-. Gracias a la aplicación de un modelo predictivo (Data Science) junto a otras acciones complementarias (como se muestra en la imagen inferior) fue posible reducir la tasa dropout al 22% en 2014.
Estos casos prácticos sobre Inclusión Social y Big Data fueron expuestos por Carmen Bernáldez Lara en la Jornada Ciudades Inteligentes, Ciudades Inlcusivas organizado por el Defensor del Pueblo Andaluz el pasado 20 de octubre, 2016 en la Fundación Cajasol en Sevilla.
Fuentes:
0 comentarios