Analyse des résultats pour le chinois

Analyse textometrique du chinois -- Le mot 养老院 est la traduction chinoise de "Maison de retraite". Il est composé de trois caractères : -- 养 (yang) qui veut dire 'nourrir, élever, engendrer', peut aussi se traduire par 'élever des animaux' ou encore 'se soigner'. -- 老 (lao) qui signifie 'vieillesse, âgé, vieux' -- 院 (yuan) qui veut dire … Lire la suite Analyse des résultats pour le chinois

Analyse des résultats pour le français

Nous allons analyser les données pour le français via iTrameur. De même que pour l'anglais, nous allons remplacer les syntagmes associés à "Maison de retraite" par la chaîne de caractères suivante : "maison_de_retraite" Calcul des cooccurrents Nous créons la base dans iTrameur et nous cherchons les cooccurrents de « maison_de_retraite » dans le DUMP. Voici les résultats … Lire la suite Analyse des résultats pour le français

Traitement d’un site web en entier

Dans notre projet nous étions assez frustrés de ne pas travailler directement avec toutes les pages d'un site internet. Nos URLS pointent directement sur l'article en question, alors que nous pensions initialement à traiter un site web entier. Pour palier à cela, nous allons essayer de télécharger entièrement un site d'actualité et de traiter son … Lire la suite Traitement d’un site web en entier

Analyse des résultats pour l’Anglais (4/4) – Nuages de mots

Nous voici enfin arrivés à la partie orientée graphique du projet. Nous allons maintenant utiliser les données pour générer des nuages de mots. Pour ce faire, nous utilisons wordclouds.com, ainsi que les contextes. Voici quelques nuages que nous avons créés :   _____________________________________________________ _____________________________________________________ Notes : AARP : est l'American Association of Retired Persons On … Lire la suite Analyse des résultats pour l’Anglais (4/4) – Nuages de mots

Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents

Nous allons maintenant analyser les données via iTrameur. La première chose que nous allons faire pour les résultats en anglais, est de remplacer tous les syntagmes comme "nursing home", "retirement home" par la chaîne de caractères suivante: "retirement_home". Ce changement nous permet de ne pas avoir de doublons dans les représentations qui vont suivre. Calcul … Lire la suite Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents

Rodage du programme

Vu que les dernières séances étaient orientées vers rodage du programme, nous préférons ne pas écrire de compte rendu formel. Néanmoins, voici les nouveaux changements qui interviennent dans le script. Dans notre programme précédent, quelques glitchs apparaissaient, notamment via la conversion des fichiers en utf-8 et le contexte html. Nous avons décidés pour simplifier les … Lire la suite Rodage du programme