Rapport de stage technologies xml et automates d'arbres 17.00 / 20

Ce stage se situait a Lille 3 dans le laboratoire GRAPPA. Cette equipe de recherche travaille sur l'extraction d'informations. Nous avons pris part a une partie du projet, en travaillant sur des documents XML, que nous de nirons par la suite. Cette equipe cherche essentiellement des algorithmes dans le domaine des automates, ^o combien utiles pour reconna^tre des motifs dans un document. Notre t^ache etait donc de continuer un projet existant, c'est a dire de travailler sur des documents XML pour reconna^tre un motif donne. Au programme, nous devions nous servir d'un langage de programmation qui nous etait inconnu : CAML, et que nous detaillerons dans la section suivante, mais aussi d'une librairie creee par un etudiant ayant fait un stage avant nous, puis divers objets de travail nous permettant de formaliser des documents XML sous forme d'arbres. M^eme si l'objet de ce stage peut para^tre un peu complexe, il faut bien savoir que nous sommes parti de rien, nous allons donc expliquer dans ce document notre evolution, pour en venir nalement au travail realise concretement.
41 téléchargements

Noter ce document

17 / 20

Contenu de ce document de Informatique > Programmation

Plan :

Table des matieres 1 Introduction 4 1.1 Buts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Premiere approche . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 Resultats et travaux futurs . . . . . . . . . . . . . . . . . . . . . 7 1.4 Webographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2 Buts et approche 10 2.1 Structure des documents XML . . . . . . . . . . . . . . . . . . . 10 2.2 Utilisation des automates d'arbre pour la reconnaissance et les requ^etes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3 Une interface commune pour des parsers di erents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.3.1 CAML et la gestion, installation des packages . . . . . . . 15 2.3.2 Dom Sax . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3.3 PXP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3.4 EXPAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.5 Stepwise . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 3 resultats 22 3.1 La librairie pour les automates XML (derives des automates stepwise) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2 Tests sur la reconnaissance de motifs . . . . . . . . . . . . . . . . 27 3.3 Travaux futurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
41 téléchargements

1 commentaire


Anonyme
Anonyme
Posté le 11 avr. 2011

ce document est excellent et riche d'information
Merci.

Il faut être inscrit pour télécharger un document

Crée un compte gratuit pour télécharger ce document

Je m'inscrisOU

J'ai déjà un compte

Je me connecte