-
Connexion
- Inscription
- 2 222 377 inscrits »
Vous êtes ici : Accueil › Documents › Informatique › BDD › Fouille de données(data mining)
hostmen - Mise à jour : 03/08/2010
52 téléchargement(s)
format .doc
200 Ko
Niveau : Bac+5
Extrait / Introduction
Extrait / Introduction :
L’expression « data mining » serait apparue pour la première fois dans les années 60. Employée par les statisticiens, elle critiquait les pratiques de recherches de corrélations des données sans hypothèse de départ. Terme péjoratif, il était souvent associé à l’expression « data fishing » en opposition aux méthodes scientifiques de la communauté des statisticiens. Obtenant des résultats encourageants et faisant fi des critiques, les chercheurs en base de données ont persisté dans cette voie.
Plan
Plan :
I.Introduction
II.KDD et Fouille de Données
II.1.élection des Données
II.2.Nettoyage des Données
II.3.Enrichissement des Données
II.4.Codage des Données
II.5.Fouille de Données
II.6.Validation
III.Algorithmes de Fouille de Données
III.1.Introduction
III.2.Méthodes non Supervisées
a.Réseau de Neurones
b.Recherche des Plus Proches Voisins
c.Recherche d'Associations
III.3.Méthodes Supervisées
a.Arbre de Décision
b.Algorithme Génétique
c.Réseau Bayésien
IV.Logiciel de Fouille de Données
IV.1.Introduction
IV.2.Critères de Choix d'un Logiciel
IV.3.Exemples de Logiciels (ClassPad)
Exemple de page de Fouille de données(data mining)
Plan du Cours de Fouille de Données
(Data Mining)
Introduction
KDD et Fouille de Données
II.1. Sélection
des Données
II.2. Nettoyage des Données
II.3.
Enrichissement des Données
II.4. Codage des Données
II.5.
Fouille de Données
II.6. Validation
Algorithmes de Fouille de Données
III.1.
Introduction
III.2. Méthodes non Supervisées
Réseau de Neurones
Recherche des Plus Proches Voisins
Recherche d'Associations
III.3. Méthodes Supervisées
Arbre de Décision
Algorithme Génétique
Réseau Bayésien
IV. Logiciel de Fouille de Données
IV.1. Introduction
IV.2. Critères de Choix d'un Logiciel
IV.3. Exemples de Logiciels (ClassPad)
L’expression « data mining » serait apparue pour la première fois dans les années 60. Employée par les statisticiens, elle critiquait les pratiques de recherches de corrélations des données sans hypothèse de départ. Terme péjoratif, il était souvent associé à l’expression « data fishing » en opposition aux méthodes scientifiques de la communauté des statisticiens. Obtenant des résultats encourageants et faisant fi des critiques, les chercheurs en base de données ont persisté dans cette voie.
L’expression « data mining » réapparaît dans les années 80 quand certains chercheurs, notamment Rakesh Agrawal (chef de projet au centre de recherche IBM d'Almaden), commencent à travailler sur de volumineuses bases de données, persuadés de pouvoir valoriser les informations qu’elles contiennent.
L’apparition du microprocesseur et des bases de données ayant rendu accessible l'informatisation aux moyennes, grandes entreprises et administrations, d’importantes bases de données sont générées. Il est intéressant de noter que les bases de données volumineuses des années 80 «pesaient» 1 Mb (millions de bytes) alors qu’aujourd’hui elles font plusieurs terabytes (mille milliards de bytes).
Toujours dans les années 80, Gregory Piatetsky-Shapiro, travaillant pour GTE Laboratories, s’intéresse à l’extraction automatique des données. Il est interpellé par l’étude présentée par Gio Wiederhold à la conférence de Los Angeles en 1987, "Extracting Knowledge From Data". Pour cette étude, Gio Wiederhold a développé un programme nommé Rx Project afin d’analyser la base de données de l’hôpital de Stanford (contenant l’historique de 50 000 patients) recherchant des éventuelles corrélations (effets secondaires) sur les médicaments administrés. Ce fut un succès, Rx a découvert de nombreux effets secondaires totalement inconnus jusqu’alors.
Gregory Piatetsky-Shapiro est alors persuadé que le concept est prometteur et tente d’en convaincre sa direction ... En vain ... En 1989, il décide d’organiser un atelier sur la découverte de connaissance dans les bases de données, espérant stimuler la recherche dans ce domaine et convaincre enfin sa direction. Se pose alors un dilemme, quel nom donner à son atelier ? « Data mining » est toujours considéré comme un terme péjoratif, « Mining » n’est pas suffisamment explicite, « Database mining » est déjà utilisé (déposé par la société HNC Software pour Database Mining Workstation) ... Il choisit alors « Knowledge discovery in Databases » (KDD) qui souligne bien l’aspect découverte et insiste particulièrement sur la découverte de connaissance.
Pour visualiser la suite du document Fouille de données(data mining) vous pouvez :
Le document Fouille de données(data mining) appartient à la rubrique BDD qui elle même appartient à la thématique Informatique.
Ils ont téléchargé aussi
Nouveaux documents BDD