Estadísticas

El INE negocia con los híper la cesión de datos para hacer el IPC

Ultima un proyecto para reducir la toma de datos presencial y apostar por la digital

Si el pacto se suscribe en breve, en enero de 2018 podría publicarse el nuevo índice

Una consumidora en el lineal de congelados de una gran superficie.
Una consumidora en el lineal de congelados de una gran superficie.

El Instituto Nacional de Estadística (INE) da un paso más en la modernización y perfeccionamiento de sus estudios y negocia con las cadenas de grandes hipermercados y supermercados un convenio de colaboración por el que las empresas suministrarán a la entidad pública la información de sus bases de datos para elaborar el IPC.

De la misma forma que la digitalización está llegando cada día a más aspectos de la vida personal y económica de la sociedad, ¿por qué no llevar el conocido como big data (recopilación de grandes cantidades de datos y su cuasi inmediato análisis para encontrar información) a la elaboración del popular IPC? El Sistema Estadístico Europeo, capitaneado por Eurostat, hace tiempo que se hizo la misma pregunta y trabaja en coordinación con los distintos países en el desarrollo de proyectos que sirviéndose de las nuevas tecnologías sean capaces de seguir incrementando la calidad de sus estadísticas.

En España, el INE tiene en un estado bastante avanzado su propio proyecto piloto. La Subdirección de Precios y Presupuestos Familiares, que dirige Ignacio González Veiga, está convencida de que la utilización de fuentes de big data en la estadística oficial permitiría reducir los costes de las encuestas, acortar aún más los plazos de publicación y aportar nuevos datos sobre aspectos sociales y económicos aún no estudiados. Así, el INE trabaja en una nueva forma de recopilar los datos que utiliza para elaborar el índice de precios de consumo (IPC). Por el momento, ha iniciado los trabajos con los alimentos envasados.

Hasta ahora, la mayor parte de la información utilizada para el cálculo del IPC se obtiene a través de las visitas que realizan los agentes del INE a los distintos establecimientos. Los comercios son informados la primera vez que acude uno de estos agentes, ya que la ley obliga a pedir permiso a los establecimientos y como su colaboración se prolonga en el tiempo, “muchas veces terminan por no enterarse de que ha acudido el agente, de forma que la carga que les supone nuestra visita es nula”, explica González Veiga. Sin embargo, el INE ha comenzado ya a utilizar en paralelo, también previo acuerdo con el informante, las bases de datos de los grandes supermercados que sustituye la recogida de precios de manera presencial; en el INE lo denominan el scanner data. Se trata de tener acceso a toda la información que los súper registran en la línea de caja de tienda. “Al contar con la información de todos los productos vendidos, todas las marcas y todas las variedades dentro de la misma marca, es una alternativa más eficiente, precisa y completa de medir la inflación”, explica el subdirector de Precios.

En la actualidad, el INE da por concluida la fase de diseño metodológico y ya realiza las primeras pruebas con datos reales, para lo cual es imprescindible que colaboren las grandes empresas de distribución con las que ha entablado negociaciones para tratar de llegar a acuerdos. “Estamos en el momento más difícil, como es el de convencer a las empresas para que nos den información de su negocio. Debemos garantizarles que no les va a suponer ningún coste económico, que la competencia no va a tener acceso a sus cifras y que es positivo para ellas y para todos porque gracias a su colaboración podremos elaborar un IPC mejor”, explica González Veiga.

Desde el INE prefieren no dar el nombre de las empresas con las que mantienen contactos para no perjudicar la negociación, si bien admiten que han entablado conversaciones con todas las grandes cadenas. Además, puntualizan que no se trata de sustituir por completo la toma de precios presencial por la digital, ya que la visita a los establecimientos más pequeños deberá seguir realizándose, así como aquella para recopilar precios de productos que no sean alimentos envasados. Si el acuerdo se cierra en breve, el nuevo IPC empezaría a publicarse en enero de 2018.

 

¿Son los valores unitarios precios?

El primer hándicap al que tuvo que enfrentarse el INE cuando comenzó a depurar la información que contenían los ficheros enviados por los supermercados que se han prestado a una primera colaboración es que en puridad no se trataba de precios de venta al público. Así, frente al precio que recogen los agentes directamente de las etiquetas que muestran los productos en el lineal del comercio, la utilización de las bases de datos cambiaba esta filosofía, ya que exige que para cada código de producto que se utilice su valor unitario (total de ingresos dividido por el total de unidades vendidas), pero no el precio propiamente dicho.

Tal y como explica el subdirector de Precios y Presupuestos Familiares del INE, Ignacio González Veiga, aunque en puridad el valor unitario no es el precio, el agregado da como resultado el precio medio pagado por el consumidor y como el IPC tampoco publica el precio en términos absolutos y sí la tendencia de éste, si sube o baja y en qué medida, “nuestras comprobaciones nos dicen que sí es equivalente al precio y que lo hemos captado bien”. Este estadístico subraya que como en los datos agregados del súper están contenidos todos los productos y las rebajas y promociones que se realizan al mes, “al final la cifra resultante refleja de manera más fiel qué ha hecho el IPC”. González Veiga recuerda que con el trabajo de campo no se pueden tomar muestras de todos los productos, todas las marcas y todas las variantes de una misma marca, con el scanner data, sí.

Del ‘big data’ al ‘webscraping’

Estadística admite que el único escollo que hoy por hoy existe a que pueda elaborarse buena parte del IPC (la alimentación envasada es una de las rúbricas que más pesa en el índice) con las bases de datos de los supermercados es la autorización que deben dar éstos. Pero ¿qué ocurre cuando son las propias compañías quienes en sus páginas web ofrecen toda clase de detalles sobre los precios que cobran por sus productos o servicios? Entonces no se requiere permiso y el INE, como ya hacen algunas empresas privadas, podría obtener de forma masiva esos datos, es una técnica conocida con el anglicismo webscraping. El INE está desarrollando también un proyecto piloto para la obtención de precios de los paquetes turísticos, por un lado, y del alojamiento y el transporte incluido en cada paquete si se adquiriesen de forma independiente. El objetivo es poder descomponer el precio de los paquetes en sus principales componentes: alojamiento y transporte. Un desglose que exige Eurostat para elaborar la Cuenta Satélite del Turismo o la balanza de pagos y que permitiría conocer qué parte del precio del paquete repercute en la economía de origen o destino.

Normas