Titre : |
Vers la réalisation d’un outil de textes mining : Analyse statistique de textes |
Type de document : |
texte imprimé |
Auteurs : |
Oumaima Zertal, Auteur ; Aziza Bouaziz, Auteur ; Khadoudja Ghanem, Directeur de thèse |
Editeur : |
CONSTANTINE [ALGERIE] : Université Frères Mentouri Constantine |
Année de publication : |
2011 |
Importance : |
69 f. |
Format : |
30 cm. |
Note générale : |
Une copie electronique PDF disponible au BUC. |
Langues : |
Français (fre) |
Catégories : |
Informatique
|
Tags : |
text mining, statistique textuelle, mots liés, textes se ressemblants. |
Index. décimale : |
004 Traitement de données. Informatique |
Résumé : |
Dans le cadre de la réalisation d’un outil complet de texte mining, nous présentons Ã
travers ce projet notre contribution dans la mise en œuvre d’un tel système. En effet
un outil de texte mining est composé de trois phases l’une aussi importante que
l’autre : une phase d’Analyse linguistique et syntaxique, une phase d’analyse
statistique et enfin une phase d’Analyse sémantique. Nous nous intéressons dans ce
projet à la phase Analyse statistique.
Une étude de l’état de l’art des méthodes déjà existantes à l’heure actuelle dans le
domaine de l’analyse statistique des textes est effectuée. Différents calculs sur les
mots ainsi que différentes méthodes statistiques sur un ensemble de textes ont été
évalués. Ces dernières ont permis de découvrir l’existence de liens de synonymie de
mots ou liens entre mots. Ceci constitue un pas vers l’indexation de documents
textes. D’un autre côté, l’étude de différents textes a permis de découvrir des liens
entre documents textes ce qui signifie un pas vers la recherche d’informations. Il
existe une large variété de techniques pour les effectuer. Nous avons choisis
l’association entre mots pour la réalisation de synonymes des mots et l’association
entre textes pour la réalisation de ressemblances entre documents.
Nous étudions d’abord pour un texte quelques calculs(les fréquences, les
probabilités, les fréquences absolues,…etc. de chaque mot), et pour plusieurs textes
les fréquences de mots clés pour chaque textes et nous essayons de tirer quelques
conclusions de cette étude. Par la suite nous exploitons ces paramètres pour
l’implémentation de notre statistique textuelle.
Notre implémentation accepte un ou plusieurs textes en entrée, effectue des calculs,
et retourne des histogrammes. Les résultats obtenus sont évalués, commentés et sont
avérés très prometteurs |
Diplome : |
Master 2 |
Permalink : |
https://bu.umc.edu.dz/master/index.php?lvl=notice_display&id=7328 |
Vers la réalisation d’un outil de textes mining : Analyse statistique de textes [texte imprimé] / Oumaima Zertal, Auteur ; Aziza Bouaziz, Auteur ; Khadoudja Ghanem, Directeur de thèse . - CONSTANTINE [ALGERIE] : Université Frères Mentouri Constantine, 2011 . - 69 f. ; 30 cm. Une copie electronique PDF disponible au BUC. Langues : Français ( fre)
Catégories : |
Informatique
|
Tags : |
text mining, statistique textuelle, mots liés, textes se ressemblants. |
Index. décimale : |
004 Traitement de données. Informatique |
Résumé : |
Dans le cadre de la réalisation d’un outil complet de texte mining, nous présentons Ã
travers ce projet notre contribution dans la mise en œuvre d’un tel système. En effet
un outil de texte mining est composé de trois phases l’une aussi importante que
l’autre : une phase d’Analyse linguistique et syntaxique, une phase d’analyse
statistique et enfin une phase d’Analyse sémantique. Nous nous intéressons dans ce
projet à la phase Analyse statistique.
Une étude de l’état de l’art des méthodes déjà existantes à l’heure actuelle dans le
domaine de l’analyse statistique des textes est effectuée. Différents calculs sur les
mots ainsi que différentes méthodes statistiques sur un ensemble de textes ont été
évalués. Ces dernières ont permis de découvrir l’existence de liens de synonymie de
mots ou liens entre mots. Ceci constitue un pas vers l’indexation de documents
textes. D’un autre côté, l’étude de différents textes a permis de découvrir des liens
entre documents textes ce qui signifie un pas vers la recherche d’informations. Il
existe une large variété de techniques pour les effectuer. Nous avons choisis
l’association entre mots pour la réalisation de synonymes des mots et l’association
entre textes pour la réalisation de ressemblances entre documents.
Nous étudions d’abord pour un texte quelques calculs(les fréquences, les
probabilités, les fréquences absolues,…etc. de chaque mot), et pour plusieurs textes
les fréquences de mots clés pour chaque textes et nous essayons de tirer quelques
conclusions de cette étude. Par la suite nous exploitons ces paramètres pour
l’implémentation de notre statistique textuelle.
Notre implémentation accepte un ou plusieurs textes en entrée, effectue des calculs,
et retourne des histogrammes. Les résultats obtenus sont évalués, commentés et sont
avérés très prometteurs |
Diplome : |
Master 2 |
Permalink : |
https://bu.umc.edu.dz/master/index.php?lvl=notice_display&id=7328 |
|