Objetivos
Qué hacemos
Generamos un dataset potente para poder realizar, en fases posteriores, estudios avanzados sobre los datos. Por ello, en esta primera fase nos centramos en la obtención y generación del almacén de datos, conectándonos a datos publicados por organismos públicos y privados, empleando en algunos casos tecnologías de RPA (Robotic Process Automation) y web scrapping que nos permitan extraer información de casi cualquier documento o web site.
Cómo lo hacemos
Catálogo y clasificación.
La primera fase consiste en el diseño del modelo de datos que contendrá el catálogo de referencias, países y clasificación.
Destaca la importancia de la información de la que se dispondrá, así como el volumen de datos que se podrá extraer.
Extracción.
Diseñamos y desarrollamos los web scraper y procesos robotizados de extracción de precios para cada uno de los orígenes identificados, así como para los portales de salud de cada país.
Implementamos un datawarehouse y modelo de datos para el almacenamiento de todas las series temporales identificadas.
Almacenamiento y visualización.
Adaptamos los datos al modelo mediante procesos ETL, concluyendo el proceso con el almacenamiento en el repositorio de datos implementado.
Desarrollamos y desplegamos los cuadros de mando, informes e indicadores KPI que facilitan la consulta y exploración de la información.
Objetivos
Qué hacemos
Generamos un dataset potente para poder realizar, en fases posteriores, estudios avanzados sobre los datos. Por ello, en esta primera fase nos centramos en la obtención y generación del almacén de datos, conectándonos a datos publicados por organismos públicos y privados, empleando en algunos casos tecnologías de RPA (Robotic Process Automation) y web scrapping que nos permitan extraer información de casi cualquier documento o web site.
Cómo lo hacemos
Catálogo y clasificación.
La primera fase consiste en el diseño del modelo de datos que contendrá el catálogo de referencias, países y clasificación.
Destaca la importancia de la información de la que se dispondrá, así como el volumen de datos que se podrá extraer.
Extracción.
Diseñamos y desarrollamos los web scraper y procesos robotizados de extracción de precios para cada uno de los orígenes identificados, así como para los portales de salud de cada país.
Implementamos un datawarehouse y modelo de datos para el almacenamiento de todas las series temporales identificadas.
Almacenamiento y visualización.
Adaptamos los datos al modelo mediante procesos ETL, concluyendo el proceso con el almacenamiento en el repositorio de datos implementado.
Desarrollamos y desplegamos los cuadros de mando, informes e indicadores KPI que facilitan la consulta y exploración de la información.