Business intelligence 17.00 / 20

Synthèse

Les données du Data Warehouse proviennent de progiciels spécialisés (Best of Breed) ou de
progiciels intégrés (ERP). Les ERP permettent de couvrir plusieurs métiers de l’entreprise
(comptabilité, commercial,…) et les données correspondantes sont présentes dans une même
base de données. En revanche, les Best of Breed sont spécialisés sur un métier mais doivent
échanger des données avec les autres progiciels. Dans le cadre de l’intégration des données, il
est plus simple d’importer l’ensemble des données depuis une même base de données (cas de
l’ERP). Toutefois, cela est rarement le cas et il est donc nécessaire de spécifier plusieurs bases
de données sources.

Les données stockées dans le Data Warehouse sont ensuite utilisées pour diverses
applications. Ce mémoire étant focalisé sur les données, seuls le reporting de la Business
Intelligence et le Data Mining sont concernés. La Business Intelligence permet, entre autres,
de présenter les données de l’entrepôt, de même, la navigation OLAP permet à l’utilisateur de
modifier ses critères de recherche sans avoir de compétences spécifiques. Dans le cadre du
Data Mining, c’est l’application qui se charge d’identifier les relations entre les données afin
de déterminer des tendances : pour un supermarché un exemple de tendance est d’avoir
identifié que les clients achetant de la bière achetaient aussi des couches. Rapprocher ces deux
produits a permis d’augmenter les ventes.

Pour intégrer les données, on peut avoir recours à deux approches différentes : l’approche
médiateur qui permet de mettre en relation des données sources avec les requêtes d’analyse, et
l’approche basée sur le Data Warehouse où les données sont extraites des systèmes sources,
stockées physiquement sur un support puis mises à disposition des requêtes d’analyse
(Business Intelligence et Data Mining). Pour mettre en place une analyse des données, la
structure comportant un entrepôt de données est mieux adaptée car elle permet d’obtenir des
analyses transversales à plusieurs métiers 1 dont on peut suivre l’évolution au cours du temps.
Cette solution permet aussi de préserver les ressources du système source.

1 Un métier regroupe par exemple les informations de la comptabilité et du commercial

7 / 59


Le Data Warehouse entrepose les données issues de l’intégration selon une structure
multidimensionnelle, basée sur une table de faits et des tables de dimension. La table de
dimension contient les données liées à un thème et la table de fait désigne, pour une
combinaison de dimensions, les données chiffrées correspondantes. Certaines dimensions
comme le temps sont obligatoires pour permettre l’analyse. Le Data Mart est une base de
stockage qui diffère du Data Warehouse dans la mesure où les données peuvent y être
dupliquées et que leur objectif est de faciliter l’analyse et non de recenser l’ensemble des
données.

Dès lors, intégrer les données dans le Data Warehouse se résume à prélever des données
hétérogènes et à leur appliquer les modifications nécessaires pour qu’elles puissent être
chargées dans l’entrepôt de données.

Il faut dans le système source identifier les données concernées par l’extraction (toutes les
données ne sont pas nécessaires pour réaliser les analyses en décisionnel). Pour éviter de
consommer les ressources du système source et pour simplifier l’extraction, on modélise les
données que l’on a précédemment sélectionnées. Cela revient à constituer une base de
données supplémentaire qui recense toutes les informations qui devront être présentes dans le
Data Warehouse. Ensuite, on marque les données afin d’identifier celles qui seront concernées
par la prochaine extraction. Différentes techniques de marquage existent, le choix dépend de
la nature ainsi que du contexte des données à marquer2
La phase de transformation permet de nettoyer les données afin de les débarrasser de leurs
doublons, de leurs problèmes de synonymie et de réaliser des jointures ou des répartitions.
Cette phase permettra au Data Warehouse d’avoir une information transformée et de
meilleure qualité par rapport aux données sources. Dans le cas de GEFCO, cette phase permet
de répartir la valeur des amortissements en fonction des unités opérationnelles.
La phase de chargement permet d’envoyer les données transformées vers le Data Warehouse
en mode différé (mode batch). Lors du premier chargement des données, on envoie la totalité
des informations sélectionnées : il s’agit du mode « Full ». Ensuite, il est nécessaire
d’actualiser les données de l’entrepôt : on utilise le mode « Reconstruction» pour remplacer la
totalité des données précédentes par les nouvelles. Cette technique consomme beaucoup de
ressources système, c’est pourquoi on peut intégrer les données en mode « Delta ». Dès lors,

2 W. H. Inmon, Loading data into the Warehouse, 2000, pp.8-17

8 / 59


on ne collecte que les données qui ont été modifiées ou créées depuis la dernière actualisation
de l’entrepôt de données.

Les ETL se rapprochent de plus en plus des EAI (Entreprise Application Integration) et
proposent maintenant d’intégrer les données en temps réel. Ceci est généralement utilisé dans
le cadre du reporting opérationnel où les données manipulées ne sont pas trop agrégées et
limitent par conséquent l’utilisation des systèmes sources. D’autre part, les ETL permettent
actuellement d’alimenter plusieurs sources en même temps, ce qui permet de répondre aux
problématiques d’entreprise en terme par exemple de délocalisation des équipes de travail ou
de logique d’intégration avec les clients ou les fournisseurs. C’est ainsi que GEFCO intègre
certaines données dans les Data Warehouse du groupe PSA.
Cependant, les ETL restent centrées sur la manipulation des données et ne s’occupent pas des
processus. On peut dès lors affirmer que l’ETL et l’EAI sont encore actuellement deux outils
différents.

L’intégration des données selon le processus général, précédemment décrit, diverge de celui
d’un système décisionnel intégré de type SAP BW. Dans ce cas, les bases de données sources
et cibles sont modélisées par des structures virtuelles et confrontées lors du Mapping. Cette
étape permet de « traduire » les données sources en données cibles.
Ce modèle diffère aussi au niveau des processus : sous SAP BW, la phase de chargement est
présente tout au long du processus et la phase de transformation intervient à plusieurs
moments que se soit lors du Mapping (correspondance entre les champs sources et cibles),
lors des règles de transformation (agrégation de plusieurs sources, application d’un algorithme
pour répartir les données,…) et éventuellement au sein des cubes où les données peuvent être
agrégées selon des règles définies pour chaque cas (regroupement des données par jour,…).

9 / 59


10 / 59


Introduction

Actuellement les entreprises doivent faire face à un marché très concurrentiel qui évolue
extrêmement rapidement. Pour acquérir de nouvelles parts de marché, l’entreprise doit mieux
comprendre ses clients et être réactive pour identifier les nouveaux relais de croissance. Dès
lors, l’entreprise doit davantage prendre en compte l’évolution du marché afin d’en détecter
les opportunités et les menaces.
Pour ce faire, l’entreprise a besoin d’outils qui lui permettent de déceler tous ces éléments.
Les outils traditionnels actualisés par les salariés ne sont pas fiables, du fait du manque
d’intégrité des données, des difficultés de consolidation et de l’absence de prévision de
tendances.
Dès lors, l’entreprise se doit d’acquérir un système décisionnel qui puisse répondre à ces
contraintes, c’est le cas des outils de Business Intelligence. Ceci va permettre de collecter les
informations nécessaires à la mise en place de tableaux de bord adaptés au pouvoir de
décision des salariés : opérationnel, décisionnel ou stratégique. L’entreprise pourra, par le
biais du Data Mining, identifier les points communs entre les habitudes de consommation de
ses clients afin d’améliorer sa relation avec ces derniers.
Les applications de Business Intelligence permettent à l’entreprise d’avoir une image parfaite
de son activité et de faciliter la prise de décisions éclairées.
Cependant, la Business Intelligence peut se révéler être un dangereux outil pouvant mener
l’entreprise à sa perte si les informations dont elle dispose ne sont pas correctes ou si elles ne
sont pas mises à jour. Alors l’entreprise prendra des décisions en fonction de données fausses
et la situation pourra se révéler catastrophique.

C’est pourquoi l’intégration des données est capitale dans un projet de Business Intelligence.
En effet, les données jouent un rôle central par rapport à leur analyse et à leur présentation,
beaucoup plus simple à mettre en oeuvre. Selon Ralph Kimball, un spécialiste dans le
domaine, l’intégration des données représente près des trois quart du temps et du budget
accordés pour un projet de ce type. Dès lors, on peut considérer que l’intégration des données
est l’étape critique d’un projet de Business Intelligence.
Les données à intégrer peuvent avoir plusieurs formes : issues d’un système d’information ou
de fichiers plats, on parle alors de données structurées. En revanche, pour celles provenant
d’Internet, elles sont présentées sans réelle logique commune, on parle de données semi ou
non structurées.

262 téléchargements

Noter ce document

17 / 20

Contenu de ce document de Informatique > BDD

Plan :

Sommaire


Synthèse.................................................................................................................... 7


Introduction............................................................................................................. 11


1ère

partie : Etat de l’art........................................................................................... 13


chp 1. En amont du Data Warehouse ................................................................. 13


I. L’ERP...............................................................................................................13


A. Son utilité ................................................................................................... 13


B. Une base de données commune ................................................................. 14


C. Mise en place d’un reporting opérationnel................................................. 14


D. Avantages de ce type de reporting ............................................................. 14


E. Limitesdureportingopérationnel..............................................................15


II. Le Best of Breed............................................................................................... 16


A. Définition ................................................................................................... 16


B. Outils d’EAI ............................................................................................... 17


chp 2. Aval du Data Warehouse – le Décisionnel ............................................... 19


I. OLAP et les tableaux de Bord..........................................................................19


A. Définition ................................................................................................... 19


B. Les travaux des chercheurs ........................................................................ 19


C. Les tableaux de bord .................................................................................. 20


II. Le Balanced Score Card...................................................................................21


III. Le Data Mining ................................................................................................ 22


A. Définition ................................................................................................... 22


B. Distinction entre données et connaissance ................................................. 23


C. ECD et Data Mining................................................................................... 23


D. Opérations techniques de Data Mining ...................................................... 23


chp 3. Faire le lien entre l’amont et l’aval ............................................................ 27


I. Approche virtuelle............................................................................................27


II. Approche matérialisée......................................................................................28


3 / 59


A. Répondre au problème du médiateur ......................................................... 28


B. Les avantages de l’approche matérialisée .................................................. 29


C. Le reporting opérationnel ........................................................................... 29


chp 4. Le Data Warehouse.................................................................................. 31


I. Les définitions..................................................................................................31


II. La modélisation de l’entrepôt de données........................................................31


A. Données thématiques.................................................................................. 33


B. Données intégrées ...................................................................................... 33


C. Données non volatiles ................................................................................ 33


D. Données historisées .................................................................................... 34


III. Structure des données.......................................................................................34


A. Données détaillées......................................................................................34


B. Données agrégées.......................................................................................35


C. Les métadonnées ........................................................................................ 35


D. Données historisées .................................................................................... 36


IV. Les Data Marts ou magasin de données ........................................................... 36


V. Les cubes .......................................................................................................... 37


VI.Les agrégats......................................................................................................38


2eme partie L’intégration des données structurées dans le Data Warehouse . 39

chp 1. Principe général........................................................................................ 39


I. Définition ......................................................................................................... 39


II. Processus .......................................................................................................... 40


A. Extraction ................................................................................................... 40


B. Transformation ........................................................................................... 41


C. Chargement ou rafraîchissement................................................................43


D. Conclusion.................................................................................................. 44


III. Les différentes générations d’ETL...................................................................44


IV. Les différentes approches d’ETL ..................................................................... 45


A. ETL « indépendants » ................................................................................ 45


4 / 59


B. ETLintégrés...............................................................................................46


V. L’ETL est il un EAI ?....................................................................................... 46


chp 2. L’intégration avec SAP BW : l’exemple de GEFCO.................................. 47


I. Fonctionnement général de l’extraction des données sous SAP BW............... 47


A. Data Source ................................................................................................ 47


B. Structure de transfert .................................................................................. 48


C. Table PSA .................................................................................................. 48


D. Cube ou ODS. ............................................................................................ 48


E. Structure de communication....................................................................... 48


F. Mapping ..................................................................................................... 48


II. Lien entre l’extraction sous SAP BW et le modèle ETL ................................. 49


III. Intégration des données dans le cadre du calcul du ROCE.............................. 49


Conclusion.............................................................................................................. 53


Les sources............................................................................................................. 55

262 téléchargements

11 commentaires


Anonyme
Anonyme
Posté le 12 janv. 2016

merci

Anonyme
Anonyme
Posté le 12 janv. 2016

merci

Anonyme
Anonyme
Posté le 28 déc. 2015

cours bref et interressant

Anonyme
Anonyme
Posté le 30 nov. 2015

good job 

 

Anonyme
Anonyme
Posté le 23 déc. 2014

BIEN

Anonyme
Anonyme
Posté le 23 déc. 2014

MERCI BCP

Anonyme
Anonyme
Posté le 13 mars 2013

Un document très intéressant surtout le côté détaillé d'un aspect tout du moins important de l’infrastructure BI. j'apprécie également le caractère détaillé de ce cours qui suit une logique et qui aide à mieux comprendre le domaine du BI.
Merci encore

Anonyme
Anonyme
Posté le 24 févr. 2013

un cours très intéressant et très détaillés. il explique l'informatique décisionnelle, sa relation avec les ERP ses fonctionnalités, les différentes étapes de réalisation , donc c'est un site important et une idée merveilleuse ! j'aime bien ! merci à tous les administrateurs

Anonyme
Anonyme
Posté le 20 févr. 2012

un cours très intéressant et très détaillés. il explique l'informatique décisionnelle, sa relation avec les ERP ses fonctionnalités, les différentes étapes de réalisation. En outre l'informatique décisionnel de nos jours représente la tendance du marché.

Anonyme
Anonyme
Posté le 7 juil. 2011

Très bonne description du Business Intelligence. Les différentes phases sont bien expliquer, ainsi que les outils à mettre en place et les différentes possibilités. Je confirme que Talend est un très bon ETL et il qui a beaucoup d'avenir dans le monde du décisionnelle.

Anonyme
Anonyme
Posté le 23 nov. 2010

Le document n'est pas téléchargé jusque là

Il faut être inscrit pour télécharger un document

Crée un compte gratuit pour télécharger ce document

Je m'inscrisOU

J'ai déjà un compte

Je me connecte