-
Connexion
- Inscription
- 2 222 843 inscrits »
Vous êtes ici : Accueil › Documents › Langue › Langues des signes › Manuel lexique francais
layte71 - Mise à jour : 05/05/2010
4 téléchargement(s)
format .doc
428 Ko
Niveau : Collège
Extrait / Introduction
Extrait / Introduction :
Pendant longtemps, les psycholinguistes ont sélectionné manuellement le matériel verbal dans le Trésor de la Langue Française (Imbs, 1971). Leur travail a été grandement facilité quand Content, Mousty et Radeau (1990) ont mis à leur disposition Brulex, une base de données informatisée regroupant les 35 746 entrées lexicales du Petit Robert et leurs fréquences selon le TLF. Ces fréquences étaient estimées sur un corpus de textes littéraires datant de 1919 à 1964 et comprenant 26 millions de mots. Une limitation notable de Brulex était l’absence des formes fléchies telles que les verbes conjugués ou certaines formes écrites plurielles ou féminines. Cela pose problème par exemple pour toutes les études concernant les formes fléchies en français ou pour estimer des fréquences d’unités telles que les syllabes. NOVLEX, une base de données plus récente (Lambert et Chesnet, 2001), fournit les formes fléchies mais se fonde sur un corpus spécialisé de textes pour enfants de 417 000 mots. C’est pourquoi nous avons entrepris de construire une nouvelle base de données avec des estimations de fréquences plus complètes, plus actuelles, et comprenant les formes fléchies.Plan
Plan :
Introduction rapide pour le nouveau venu 2 1 DESCRIPTION DU CORPUS ORIGINAL 6 2 CALCUL DES FREQUENCES 6 2.1 Fréquences à partir d'un corpus de textes 6 2.2 Fréquences à partir des pages web 7 3 OBTENTION DES AUTRES DESCRIPTEURS 8 3.1 Catégorie grammaticale, genre et nombre 8 3.2 Acquisition de la forme phonologique 9 4 ORGANISATION DE LA BASE 9 4.1 Organisation de la table Graphemes 10 4.2 Organisation de la table Lemmes 17 4.3 Organisation de la table Surface 19 4.4 Organisation du dossier Surface 20 4.4.1 Bigr.txt 20 4.4.2 BigrMoy.txt 20 4.4.3 BigrMots.txt 21 4.4.4 BigrMotsMoy.txt 21 4.4.5 Calculs à partir de la dernière position 21 5 LES AUTRES BASES 22 6 DISPONIBILITE ET SITE WEB 22 7 LICENCE 23 8 LES OUTILS 23 8.1 Les outils "en ligne" 23 8.2 Open Lexique 27 8.3 Les outils "hors ligne" : Undows 28 8.4 Évolutivité 29 9 CONCLUSION 30 Annexe A: Noms des champs 31Exemple de page de Manuel lexique francais

Manuel de Lexique 2
Document version 2.62c
Boris New1, Christophe Pallier2
1Laboratoire de Psychologie expérimentale
UMR 8581 CNRS, Université René Descartes, Paris V
71, avenue Edouard Vaillant, 92774 Boulogne Billancourt Cedex, France
2Laboratoire de Sciences Cognitives et Psycholinguistique,
UMR 8554, CNRS, Ecole des Hautes Etudes en Sciences Sociales (EHESS),
54 Boulevard Raspail,75270 Paris CEDEX 06,
E-mail :new@psycho.univ-paris5.fr
Remerciements: Nous tenons à remercier Pascale Bernard de l'Inalf pour ses précieux renseignements, ainsi que Ray Sydney et l'équipe de FastSearch pour leurs moteurs de recherche Internet, Helmut Schmid pour son excellent lemmatiseur et Sid Kouider pour son aide et son programme permettant le calcul des voisins.
Mots clés : Reconnaissance de mots, Fréquence, Base de donnée
Pour visualiser la suite du document Manuel lexique francais vous pouvez :
Le document Manuel lexique francais appartient à la rubrique Langues des signes qui elle même appartient à la thématique Langue.
Ils ont téléchargé aussi
Nouveaux documents Langues des signes