Logotipo del INE
Los colores del INE

Noticias del Instituto Nacional de Estadística

Está Vd. en: Revista digital del INE / Institucional

Big Data, el reto de futuro de la estadística oficial

23-10-15

La jornada contó con una nutrida asistencia La jornada del Día Mundial de la Estadística contó con una nutrida asistencia

El pasado 20 de octubre de 2015 el INE celebró el Día Mundial de la Estadística con una jornada que giró en torno al uso del Big Data en la elaboración de estadísticas oficiales y privadas.

El director general de Coordinación Estadística y de Estadísticas Laborales y de Precios del INE, Miguel Ángel De Castro, inauguró la sesión destacando que esta celebración nace de una Declaración de la Asamblea General de Naciones Unidas. Añadió que este año se ha adoptado como lema: "Datos Mejores. Vidas mejores", expresión que refleja el importante papel que juegan las estadísticas en el bienestar de la sociedad.

De Castro recordó que dicha declaración destaca "la función decisiva que desempeña la información estadística oficial de alta calidad para el análisis y la adopción de decisiones normativas bien fundadas en apoyo del desarrollo sostenible". Y apuntó que para que ello surta efecto la actividad estadística debe realizarse en un marco de independencia científica y profesional, rigurosidad e imparcialidad.

“La medición objetiva, imparcial y sólida, metodológicamente hablando, de las condiciones sociales y económicas es la base primera para tomar conciencia de qué aspectos deben mejorarse y en cuánto contribuyen a esa mejora las distintas medidas que se adoptan”, señaló. 

Papel relevante

De Castro pidió a los estadísticos reflexionar sobre su actividad para seguir teniendo un papel relevante en la sociedad, en un entorno en el que cada vez hay más información e indicadores producidos por agentes que no forman parte de la estadística oficial.

En ese sentido, tanto en el Sistema Estadístico Nacional como en el Sistema Estadístico Europeo (SEE) se están desarrollando trabajos para abordar los retos de la estadística.

A nivel nacional, el Plan Estadístico Nacional 2017-2020 incluye líneas estratégicas que permitirán mejorar los aspectos institucionales, los métodos de producción y la difusión de las estadísticas.

En el ámbito europeo se trabaja en el programa Vision 2020, donde se han identificado algunas áreas prioritarias de atención para el desarrollo de la actividad estadística.

Ambos proyectos comparten muchos objetivos de mejora, entre ellos el aprovechamiento de las nuevas fuentes de datos que hoy en día están disponibles: los Big Data. Para De Castro este término, que en muchas ocasiones puede ser considerado como “de moda”, abre numerosas posibilidades, pero aún presenta algunos interrogantes para las estadísticas oficiales.

Big Data en el INE

Los proyectos sobre Big Data en el INE están coordinados por Miguel Ángel Martínez Vidal, director del Departamento de Metodología y Desarrollo de la Producción Estadística.

En su intervención en la jornada, Martínez comentó las numerosas fuentes que existen y las aplicaciones que se extraen de ellas y puso de manifiesto que estos conjuntos de datos son una oportunidad para el INE, ya que mejorarán la eficiencia, reducirán la carga de trabajo a los informantes e incrementarán la calidad de la producción estadística.

Según explicó, el cumplimiento del Código de Buenas Prácticas de las Estadísticas Europeas garantiza la independencia técnica con la que se elaboran los datos que produce el INE. Por ello, “es bueno conservar ese valor para la sociedad” asegurando que la explotación de los Big Data se desarrollará también por parte de la estadística oficial.

Finalmente presentó las estrategias que se están desarrollando para afrontar los retos que supone la utilización de Big Data. En el caso del INE, los proyectos están relacionados con el uso de telefonía móvil para estimar variables de los censos de población y con las estadísticas de turismo y la captura de precios de paquetes turísticos en páginas web para su uso en el cálculo del Índice de Precios al Consumo (IPC).

Nuevas técnicas de análisis

La jornada también contó con la presencia de Juan Antonio Guerrero, Licenciado en Matemáticas –especialidad de Estadística e Investigación Operativa– de la universidad de Sevilla, que ha realizado labores de investigación, ha trabajado en administración sanitaria como bioestadístico y que posee gran experiencia en proyectos del Big Data, especialmente en modelos predictivos.

Guerrero expuso los cambios que han experimentado las técnicas de análisis de la información a lo largo de los últimos años.

Repasó las debilidades y fortalezas de la estadística multivariable paramétrica, así como las diferentes técnicas asociadas a ella (regresión múltiple y logística, análisis discriminante, análisis de componentes principales, análisis factorial o análisis de la varianza) hasta llegar a la aplicación del Big Data en la elaboración de estadísticas.

Guerrero señaló las tres características que definen el concepto del Big Data: mayor volumen, mayor heterogeneidad y generación más rápida de la información.

Además, explicó cómo las técnicas de análisis de esta información se alejan de los métodos tradicionales mencionados anteriormente, aplicándose otros de más reciente diseño como el bootstrapping (o remuestreo con reemplazamiento), las redes neuronales, el support vector machine, el gradient boosting o el random forest, entre otros.

 

NIPO: 065-17-024-7
ISSN: 2255-5625
© INE 2018