Analyse textometrique du chinois -- Le mot 养老院 est la traduction chinoise de "Maison de retraite". Il est composé de trois caractères : -- 养 (yang) qui veut dire 'nourrir, élever, engendrer', peut aussi se traduire par 'élever des animaux' ou encore 'se soigner'. -- 老 (lao) qui signifie 'vieillesse, âgé, vieux' -- 院 (yuan) qui veut dire … Lire la suite Analyse des résultats pour le chinois
Analyse des résultats pour le français
Nous allons analyser les données pour le français via iTrameur. De même que pour l'anglais, nous allons remplacer les syntagmes associés à "Maison de retraite" par la chaîne de caractères suivante : "maison_de_retraite" Calcul des cooccurrents Nous créons la base dans iTrameur et nous cherchons les cooccurrents de « maison_de_retraite » dans le DUMP. Voici les résultats … Lire la suite Analyse des résultats pour le français
Traitement d’un site web en entier
Dans notre projet nous étions assez frustrés de ne pas travailler directement avec toutes les pages d'un site internet. Nos URLS pointent directement sur l'article en question, alors que nous pensions initialement à traiter un site web entier. Pour palier à cela, nous allons essayer de télécharger entièrement un site d'actualité et de traiter son … Lire la suite Traitement d’un site web en entier
Explication du script principal
Dans cet article, nous allons détailler le script ligne par ligne. Le script complet se trouve en bas de page. Tout d'abord, on indique dans le programme environnement dans lequel nous allons travailler. Comme notre langage est le bash, on indique dans la première ligne : #!/bin/bash Ensuite, on écrit les fonctions. Nous n'en avons … Lire la suite Explication du script principal
Analyse des résultats pour l’Anglais (4/4) – Nuages de mots
Nous voici enfin arrivés à la partie orientée graphique du projet. Nous allons maintenant utiliser les données pour générer des nuages de mots. Pour ce faire, nous utilisons wordclouds.com, ainsi que les contextes. Voici quelques nuages que nous avons créés : _____________________________________________________ _____________________________________________________ Notes : AARP : est l'American Association of Retired Persons On … Lire la suite Analyse des résultats pour l’Anglais (4/4) – Nuages de mots
Analyse des résultats pour l’Anglais (3/4) – Réseau de cooccurrents spécifiques
Pour monter le réseau de cooccurrents spécifiques à notre syntagme, nous avons utilisé iTrameur avec les paramètres suivants : Fréquence min: 10 ; Seuil: 5 ; Co-Freq: 1 ; IndSPmin: 5 On obtient le graph suivant: De même pour le réseau de cooccurrents spécifiques via l'expression régulière :
Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents
Nous allons maintenant analyser les données via iTrameur. La première chose que nous allons faire pour les résultats en anglais, est de remplacer tous les syntagmes comme "nursing home", "retirement home" par la chaîne de caractères suivante: "retirement_home". Ce changement nous permet de ne pas avoir de doublons dans les représentations qui vont suivre. Calcul … Lire la suite Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents
Analyse des résultats pour l’Anglais (1/4)
(le tableau final se trouve en fin de page) Nous avons maintenant récupéré et trié les données de chaque langue et nous approchons de l'analyse de celles-ci. Avant toute chose, concernant les données de l'anglais, on peut remarquer la faible fréquence du motif correspondant à "Maison de retraite" pour une moitié des URLS. Ces 25 … Lire la suite Analyse des résultats pour l’Anglais (1/4)
Rodage du programme
Vu que les dernières séances étaient orientées vers rodage du programme, nous préférons ne pas écrire de compte rendu formel. Néanmoins, voici les nouveaux changements qui interviennent dans le script. Dans notre programme précédent, quelques glitchs apparaissaient, notamment via la conversion des fichiers en utf-8 et le contexte html. Nous avons décidés pour simplifier les … Lire la suite Rodage du programme
Compte rendu de séance 29/12/17
Le but de cette séance est de se familiariser avec deux nouveaux logiciels : Trameur et iTrameur. Mais d’abord quelques mots sur les nuages de mots… Il y a plusieurs sites en ligne qui permettent de faire des nuages de mots. Pour le chinois, on a utilisé : On doit utiliser un logiciel de segmentation … Lire la suite Compte rendu de séance 29/12/17