Vous êtes ici : › Fouille de données(data mining)

BDD

Fouille de données(data mining)

hostmen - Mise à jour : 03/08/2010

Lire en ligne
Gratuit

Té:lécharger
Gratuit après inscription

Pas encore d'avis

52 téléchargement(s)

Document doc format .doc
200 Ko

Niveau : Bac+5

Signaler un abus

Extrait / Introduction

Extrait / Introduction :

L’expression « data mining » serait apparue pour la première fois dans les années 60. Employée par les statisticiens, elle critiquait les pratiques de recherches de corrélations des données sans hypothèse de départ. Terme péjoratif, il était souvent associé à l’expression « data fishing » en opposition aux méthodes scientifiques de la communauté des statisticiens. Obtenant des résultats encourageants et faisant fi des critiques, les chercheurs en base de données ont persisté dans cette voie.

Plan

Plan :

I.Introduction
II.KDD et Fouille de Données
II.1.élection des Données
II.2.Nettoyage des Données
II.3.Enrichissement des Données
II.4.Codage des Données
II.5.Fouille de Données
II.6.Validation
III.Algorithmes de Fouille de Données
III.1.Introduction
III.2.Méthodes non Supervisées
a.Réseau de Neurones
b.Recherche des Plus Proches Voisins
c.Recherche d'Associations
III.3.Méthodes Supervisées
a.Arbre de Décision
b.Algorithme Génétique
c.Réseau Bayésien
IV.Logiciel de Fouille de Données
IV.1.Introduction
IV.2.Critères de Choix d'un Logiciel
IV.3.Exemples de Logiciels (ClassPad)

Signaler un abus

Lire en ligne
Gratuit
Té:lécharger
Gratuit après inscription

Exemple de page de Fouille de données(data mining)

Plan du Cours de Fouille de Données

(Data Mining)

  1. Introduction

  2. KDD et Fouille de Données
    II.1. Sélection des Données
    II.2. Nettoyage des Données
    II.3. Enrichissement des Données
    II.4. Codage des Données
    II.5. Fouille de Données
    II.6. Validation

  3. Algorithmes de Fouille de Données
    III.1. Introduction
    III.2. Méthodes non Supervisées

    1. Réseau de Neurones

    2. Recherche des Plus Proches Voisins

    3. Recherche d'Associations

III.3. Méthodes Supervisées

  1. Arbre de Décision

  2. Algorithme Génétique

  3. Réseau Bayésien

IV. Logiciel de Fouille de Données

IV.1. Introduction

IV.2. Critères de Choix d'un Logiciel

IV.3. Exemples de Logiciels (ClassPad)

L’expression « data mining » serait apparue pour la première fois dans les années 60. Employée par les statisticiens, elle critiquait les pratiques de recherches de corrélations des données sans hypothèse de départ. Terme péjoratif, il était souvent associé à l’expression « data fishing » en opposition aux méthodes scientifiques de la communauté des statisticiens. Obtenant des résultats encourageants et faisant fi des critiques, les chercheurs en base de données ont persisté dans cette voie.

L’expression « data mining » réapparaît dans les années 80 quand certains chercheurs, notamment Rakesh Agrawal (chef de projet au centre de recherche IBM d'Almaden), commencent à travailler sur de volumineuses bases de données, persuadés de pouvoir valoriser les informations qu’elles contiennent.

L’apparition du microprocesseur et des bases de données ayant rendu accessible l'informatisation aux moyennes, grandes entreprises et administrations, d’importantes bases de données sont générées. Il est intéressant de noter que les bases de données volumineuses des années 80 «pesaient» 1 Mb (millions de bytes) alors qu’aujourd’hui elles font plusieurs terabytes (mille milliards de bytes).

Toujours dans les années 80, Gregory Piatetsky-Shapiro, travaillant pour GTE Laboratories, s’intéresse à l’extraction automatique des données. Il est interpellé par l’étude présentée par Gio Wiederhold à la conférence de Los Angeles en 1987, "Extracting Knowledge From Data". Pour cette étude, Gio Wiederhold a développé un programme nommé Rx Project afin d’analyser la base de données de l’hôpital de Stanford (contenant l’historique de 50 000 patients) recherchant des éventuelles corrélations (effets secondaires) sur les médicaments administrés. Ce fut un succès, Rx a découvert de nombreux effets secondaires totalement inconnus jusqu’alors.

Gregory Piatetsky-Shapiro est alors persuadé que le concept est prometteur et tente d’en convaincre sa direction ... En vain ... En 1989, il décide d’organiser un atelier sur la découverte de connaissance dans les bases de données, espérant stimuler la recherche dans ce domaine et convaincre enfin sa direction. Se pose alors un dilemme, quel nom donner à son atelier ? « Data mining » est toujours considéré comme un terme péjoratif, « Mining » n’est pas suffisamment explicite, « Database mining » est déjà utilisé (déposé par la société HNC Software pour Database Mining Workstation) ... Il choisit alors « Knowledge discovery in Databases » (KDD) qui souligne bien l’aspect découverte et insiste particulièrement sur la découverte de connaissance.

Pour visualiser la suite du document Fouille de données(data mining) vous pouvez :

Lire en ligne
Gratuit
Té:lécharger
Gratuit après inscription
Donnez votre avis sur Fouille de données(data mining)
Note / 20
Votre avis
 
Valider
Avis sur Fouille de données(data mining)

Le document Fouille de données(data mining) appartient à la rubrique BDD qui elle même appartient à la thématique Informatique.

Tweets Doc-etudiant
Tout chaud sur Doc-etudiant.fr
Superdoc Lettre de motivation net... Il y a 2 jour(s) - Autre
Superdoc Lettre de Motivation Usine Il y a 2 jour(s) - Autre
sofia-hs A quel niveau se fait le... Il y a 1 jour(s) - Question
512 Le tourisme de luxe actu... Il y a 2 jour(s) - Question
+ de Tweet Doc-etudiant.fr

Partenaires - Devenir partenaire - Doc etudiant est une marque déposée - c 2008 2012 - Tous droits réservés - Conditions générales d'utilisation - Crédits
Contact - Signalez-nous un bug - Bac 2012 - Brevet 2012 - Recrutement

Pour donner votre avis sur ce document, vous devez être membre de Doc-étudiant

Si ce n'est pas encore fait ?

Inscrivez-vous !

ou Identifiez-vous :


Mot de passe oublié ?
Besoin d'aide