Vous êtes iciBusiness Intelligence > L'Extraction et la Transformation des données

L'Extraction et la Transformation des données


controler
L'offre DAMACOSY

La maîtrise du système d'information nécessite la maitrise des flux de données : Le respect des délais, de la qualité des données, ...

Un flux de données ne se limite pas à un transfert de fichiers entre deux applications. L'objectif des outils ETL va être de vous apporter cette maitrise sur l'ensemble des opérations composant un flux de données, ainsi que de superviser l'exécution de l'ensemble des flux.

DAMACOSY vous propose tant une démarche de mise en œuvre de l'ETL qu'une aide au choix de l'outil adapté à vos besoins.

 

L'ETL (Extraction - Transformation - Loading)  intervient à plusieurs niveaux dans un système d'information décisionnel (SID) :

  • il extrait ou reçoit les données des systèmes opérationnels
  • il contrôle et transforme les données pour alimenter l'entrepôt des données (Data Warehouse)
  • il alimente les Data Marts à partir des données du Data Warehouse
  • il permet aussi d'extraire les données du Data Warehouse à destination des systèmes opérationnels : Le DataWarehouse devient le passage obligé des données dont les référentiels, alimentant le reporting et les systèmes opérationnels de données dont la qualité est contrôlée et assurée.

L'acquisition d'ETL ne se limite pas à un projet SID : On le retrouve aussi pour les échanges entre les systèmes opérationnels : La possibilité de traiter des flux en temps réel devient alors une fonctionnalité nécessaire de l'ETL


Les logiciels ETL ne sont plus de simple plateformes de développement de chaînes de traitement qui devaient (il y a encore 5 ans)  être ensuite encapsulées au sein d'ordonannceurs externes

La plupart des solutions ETL actuelles disposent de modules d'ordonnancement et de supervision des traitements, avec des fonctions assurant la traçabilité de l'exécution des traitements et leur reprise (en automatique ou en manuel).

Certains ETL sont des générateurs de codes qui permettent un déploiement facilité des traitements tout en garantissant une supervision centralisée des exécutions.


A coté des solutions propriétaires telles que DataStage (IBM) ou Informatica, sont apparues des solutions open-source dont notamment  Talend qui  est actuellement la solution ETL montante en France (normal, l'éditeur Talend est français ce qui permet un support plus réactif).

Grâce à de nombreux projets décisionnels mettant en œuvre des ETL, nous vous proposons de vous guider dans le choix de la solution la plus adaptée à vos besoins et dans sa mise en œuvre.

 

Étiquettes