La oportunidad que el Big Data ofrece para poder analizar perfiles y patrones de millones de personas y extraer valor socio-económico presenta también el reto de establecer estándares que permitan realizar los objetivos marcados de manera legítima y responsable. La representatividad, la distribución de los datos, la privacidad y el objeto de análisis tienen que ser evaluados necesariamente por expertos data scientists en cada proyecto de Big Data que tenga como objetivo la creación de negocio y bien social. Si bien es cierto que el potencial del Big Data para generar negocio ha quedado demostrado por diferentes estudio, existen también casos en los que se ha hecho un uso ilegítimo o perjudicial de los datos. En este sentido es fundamental saber dónde y cómo introducir la innovación con Big Data.
Evaluación del Big Data: bien social y negocio responsable
Las evaluaciones son también críticas para asegurar el impacto de innovación con Big Data para alcanzar los Objetivos de Desarrollo Sostenible. También es fundamental identificar en qué áreas se podrá generar empleo en torno al Big Data y cuál es el futuro de esta tecnología en cada sector. Para asegurar el uso correcto de los datos es necesario llevar a cabo ciertas prácticas que han de convertirse en estándar.
A continuación, presentamos 10 recetas para asegurar el éxito de proyectos Big Data:
- Combinar métodos analíticos y de ciencias sociales:
Las metodologías de las ciencias sociales ayudan a definir los parámetros y contextos en los que se usan lo datos para un objeto concreto. El análisis cuantitativo de las propiedades de los datos permiten definir los límites y alcance de la aplicación. Sin embargo, es fundamental, también, la valoración cualitativa de expertos data scientists que hayan trabajado en proyectos concretos de datos y sepan integrar esta información en investigación social o generación de valor socio-económico.
- Evaluar las conexiones entre Big Data y Small Data:
El concepto Small Data engloba las encuestas y datos no conectados que se han usado tradicionalmente en procesos de decisión y evaluación. Es necesario saber qué relación guardan esos datos con indicadores obtenidos mediante el uso de Big Data y Artificial Intelligence. Esos datos pueden servir para validar estudios con Big Data y también ayudar a la interpretación de resultados. Muchas compañías e instituciones tienen gran cantidad de Small Data que debe ser conectada con el Big Data y de esa manera revelar nuevo valor añadido.
- Integrar datos de diversa naturaleza en el análisis de patrones sociales:
Integrar datos es fundamental y parte necesaria de los proyectos de Big Data para poder expandir el alcance de los proyectos y mejorar la interpretación de resultados. Estos datos deben ser integrados con metodologías adecuadas en los modelos de comportamiento humano ya que depende, en gran medida, de factores externos. No integrar datos puede llevarnos a una extrapolación falaz de resultados de Big Data. La integración de esta información abre también la puerta a nuevas colaboraciones entre empresas y sectores.
- Diseñar interfaces y herramientas de visualización:
La representación de indicadores basados en Big Data requiere de herramientas innovadoras de visualización que permitan a los usuarios expertos y no expertos entender lo que los indicadores pueden mostrar. Además, las capacidades cognitivas de los humanos son fundamentales para explotar el potencial que la visualización de datos aporta, tanto para validar como para descubrir nuevos conocimientos.
- Permitir solapamiento y colisión de fuentes de datos y sus usos:
Un paso necesario y no siempre realizado es permitir la redundancia de datos mediante el solapamiento de diferentes fuentes de datos que a veces no son todo lo completas que esperamos. En algunos casos puede haber fuentes de datos que colisionen y es labor de los data scientists determinar la veracidad de los datos para destilar indicadores fiables. El Big Data, además, nos puede dar conocimiento diferente en función del propósito que se intente alcanzar o, por ejemplo, en qué ODSs se enfoque el estudio.
- Definir métricas de calidad:
Las fuentes de Big Data deben ser caracterizadas mediante métricas de calidad que evalúen cuantitativamente a los datos y sus límites de interpretación. Esto es un paso previo a poder diseñar ecosistemas de datos más globales que permitan la compartición de datos y la colaboración entre sectores.
- Enriquecer los ecosistemas de datos:
Una oportunidad adicional del Big Data es crear ecosistemas de datos más grandes y diversos donde pueda crecer exponencialmente el valor de los datos. La Inteligencia Artificial aparece como una herramienta fundamental para incrementar el impacto de ecosistemas de datos.
- Valoraciones de riesgos y privacidad:
Cada proyecto lleva asociado un conjunto de riesgos que debe ser valorado por expertos social data scientists para justificar el uso de Big Data para llegar a los objetivos. Los riesgos siempre deben ser entendidos junto a los beneficios del proyecto y al riesgo de no usar datos en un determinado plazo de tiempo. Junto a los riesgos, la privacidad debe ser valorada también en función de los beneficios, definiendo las medidas oportunas para asegurar su respeto.
- Impacto de proyectos Big Data:
Cada proyecto de Big Data genera un impacto ambiental, social y económico. Es una buena práctica (y cada vez más necesaria) estimar esta huella durante el diseño de proyectos y a lo largo de su ciclo de vida. Un gran impacto beneficioso de Big Data en torno a los ODS puede atraer al sector público y fondos de inversión internacionales.
- Introducir a personas en el diseño de soluciones:
El Big Data y la AI pueden ayudar a resolver problemas, descubrir valor u optimizar variables que se definan en el caso. Sin embargo, cada vez es más necesario introducir el componente humano, como actores y no sólo como usuarios, dentro de los algoritmos y soluciones de innovación con datos. El futuro del Big Data pasa por mejorar la condición de humana y generar nuevos tipos de empleo y actividad.