Ciencia de datos y evaluación: los primeros encuentros de una fructífera y larga relación

Evaluare > Blog > Laboratorio Evaluare > Ciencia de datos y evaluación: los primeros encuentros de una fructífera y larga relación

En los últimos años se ha vuelto más común escuchar en diversos ámbitos el término “ciencia de datos”; presentándose como el nuevo paradigma metodológico capaz de resolver una amplia gama de problemas actuales.

Para todos aquellos lectores que aún no están familiarizados con este término, la ciencia de datos puede definirse como una ciencia cuantitativa relativamente nueva; un híbrido que combina metodologías propias de las ciencias computacionales, estadística y matemática aplicada; que busca transformar todos tipo de datos en información estratégica.

La ciencia de datos, no es exclusiva de una sola disciplina, su activo principal es la información; por lo cual, toda actividad humana que involucre la producción de datos puede servir como terreno fértil para emprender un proyecto de esta naturaleza. Por tanto, no hay que extrañarnos si escuchamos su aplicación en la solución de problemas tan diferentes como la segmentación de mercados, en el emergente e-commerce, hasta producción industrial porcina.

El profesionista encargado de llevar a cabo este tipo de proyectos, es denominado “científico de datos”. Un científico de datos debe tener un perfil versátil y adaptable, con un trasfondo de ciencias exactas aplicadas y conocimientos de programación; pero al mismo tiempo, debe tener la capacidad para expresar sus ideas, adaptar sus métodos a diversos tipos de problemas.

Tal salto puede parecer muy extraño para aquellos profesionistas acostumbrados al paradigma de la especialización y de la adquisición de conocimiento a través de una larga trayectoria de dedicación en el estudio de un solo tema.

Es decir, la ciencia de datos llegó para ser el complemento perfecto de la interdisciplinariedad; y al mismo tiempo, el científico de datos ha llegado a convertirse en el enemigo declarado de la ortodoxia en todas sus facetas, encarnada en el profesionista que basa sus decisiones en la experiencia personal y no en los datos.

Por su parte, la evaluación se ha visto beneficiada en los últimos años por la evolución tecnológica que impacta en la trasparencia y la rendición de cuentas. Concretamente, el aumento de plataformas digitales de gobiernos y el almacenamiento de información que se genera a lo largo de los ciclos de política pública. Todo ello, deja huellas digitales que cada día generan millones de datos asociados a la actividad gubernamental y su relación con los ciudadanos.

Desde luego, hace 10 años nadie pensaba generar y almacenar datos para que diversos equipos de científicos de datos alrededor del mundo emprendieran sus proyectos; tal acontecimiento, se dio de manera fortuita.

Por un lado, se tiene una gran cantidad de información, producto de la rendición de cuentas y de las mejoras continuas en los procesos de transparencia. Por otro lado, los tomadores de decisiones reconocen que hay una realidad compleja de la cual surgen nuevas dudas, y con ello, la exigencia de nuevas formas de acceder a sus respuestas.

Un ejemplo de estos primeros acercamientos en América Latina se encuentra en la aplicación de ciencia de datos en el desarrollo de la Plataforma del Observatorio de Memoria Histórica y Conflicto (OMC), en Colombia (Cruz, 2020). Y también, en las evaluaciones de impacto más actuales, como es el caso de la evaluación al Fondo de Aportaciones para la Infraestructura Social Estatal (FISE) de Puebla realizada en 2019 (Secretaría de Planeación y Finanzas del Gobierno del Estado de Puebla, 2019).

En el primero de estos ejemplos, relativo al caso de Colombia, los funcionarios del OMC se percataron de la necesidad de contar con tecnología de punta para procesar una gran cantidad de bases de datos relevantes para esclarecer las causas del fenómeno del conflicto armado en su país, conocer la verdad y evitar en el futuro, la repetición de la ola de violencia que envolvió a Colombia en las últimas décadas.

El resultado, la implementación de una plataforma de visualización de datos del OMC, la cual permite por primera vez, que el acceso a la información consolidada del conflicto armado esté a disposición para uso y análisis de todos los ciudadanos de Colombia.

De igual manera, la evaluación de impacto al FISE 2019 en Puebla rompe con los cánones de evaluaciones de impacto tradicionales. Usualmente el insumo de una evaluación de impacto se obtiene a través del levantamiento de encuestas “cara a cara” con los beneficiarios de los programas evaluados; para después, localizar el efecto de la intervención a través de un modelo econométrico sencillo.

La ciencia de datos presente en la evaluación al FISE, además de encuestas, elaboró cruces intratemporales con presupuestos de los programas evaluados; información geográfica y económica de la región donde se implementó el programa; así como registros electrónicos de padrones de beneficiarios.

No es de extrañarse que en un futuro inmediato los evaluadores recurran al cruce de datos generados en redes sociales o cualquier otra huella electrónica que pudiera generar el sector social beneficiado con una intervención pública.

Una vez efectuado el proceso de limpieza y procesamiento, un científico de datos que trabaja en una evaluación de impacto puede proceder a buscar el efecto de las intervenciones a través de Machine Learning[1], proponiendo modelos e implementando algoritmos computacionales para brindar nuevas respuestas; procesos que también están presentes en la evaluación FISE Puebla 2019.

Si bien, la evaluación de impacto FISE Puebla 2019 y la plataforma de Observatorio de Memoria Histórica y Conflicto, no fueron concebidas inicialmente como proyectos que inmiscuyeran técnicas de ciencia de datos, la complejidad y necesidad de los problemas que buscaban esclarecer obligó a funcionarios y evaluadores a explorar nuevas alternativas tecnológicas.

A principios de 2020 se esperaba que América Latina y México recorrieran un proceso tecnológico de diez años (González, 2020), el cual generará información pública lo suficientemente basta para la aplicación de ciencia de datos en todo tipo de evaluaciones (más allá de las evaluaciones de impacto).

Pero, el efecto de aceleración tecnológica resultado de las respuestas del mercado laboral y las gestiones de gobierno ante el COVID-19, adelantaron el proceso de desarrollo tecnológico en tan solo tres meses.

En mi opinión como consultor, a finales de 2021, cuando la economía global se recupere del impacto exógeno de la pandemia, nuestro país habrá atravesado un drástico proceso tecnológico que producirá información suficiente para transformar los procesos de evaluación más usuales.

Volviendo al ejemplo de las evaluaciones de impacto, las encuestas “cara a cara” corren el riesgo de volverse obsoletas, y en su lugar, ser sustituidas por un oportuno cruce de variables entre todo tipo de redes sociales y padrones electrónicos de beneficiarios.

Así mismo, las habilidades de los evaluadores también deberán evolucionar, agregando científicos de datos a los equipos de evaluación, o bien, agregando a las destrezas de los evaluadores habilidades computacionales y cuantitativas.

Notas

[1] Una rama de la inteligencia artificial cuyo objetivo es permitirá que las computadoras generen resultados similares al aprendizaje.

Referencias

  • Cruz, G. (2020). GovTech y el futuro del gobierno: el caso de Datasketch en Colombia. Recuperado de: https://scioteca.caf.com/bitstream/handle/123456789/1539/GovTech_y_el_futuro_del_gobierno_el_caso_de_Datasketch_en_Colombia.pdf?sequence=1&isAllowed=y
  • Gonzalez, D. (2020). El covid aceleró la adopción tecnológica proyectada a 10 años en tan solo tres meses. México: inmobiliare.com. Recuperado de: https://inmobiliare.com/el-covid-19-acelero-la-adopcion-tecnologica-proyectada-a-10-anos-en-tan-solo-tres-meses-wef/
  • Secretaría de Planeación y Fianzas del Gobierno del Estado de Puebla. (2019). Evaluación tipo Impacto: Fondo de Aportaciones para la Infraestructura Social Estatal (FISE). Recuperado de: http://www.evaluacion.puebla.gob.mx/pdf/R332019/Informe_FISE.pdf

Sobre el Autor:
Javier Herrera Martínez


Consultor en evaluación de políticas públicas
Especialista en metodologías de impacto

Sobre el Autor:
Javier Herrera Martínez


Consultor en evaluación de políticas públicas

Especialista en metodologías de impacto