Analyse des résultats pour le français

Nous allons analyser les données pour le français via iTrameur. De même que pour l'anglais, nous allons remplacer les syntagmes associés à "Maison de retraite" par la chaîne de caractères suivante : "maison_de_retraite" Calcul des cooccurrents Nous créons la base dans iTrameur et nous cherchons les cooccurrents de « maison_de_retraite » dans le DUMP. Voici les résultats … Lire la suite Analyse des résultats pour le français

Traitement d’un site web en entier

Dans notre projet nous étions assez frustrés de ne pas travailler directement avec toutes les pages d'un site internet. Nos URLS pointent directement sur l'article en question, alors que nous pensions initialement à traiter un site web entier. Pour palier à cela, nous allons essayer de télécharger entièrement un site d'actualité et de traiter son … Lire la suite Traitement d’un site web en entier

Analyse des résultats pour l’Anglais (4/4) – Nuages de mots

Nous voici enfin arrivés à la partie orientée graphique du projet. Nous allons maintenant utiliser les données pour générer des nuages de mots. Pour ce faire, nous utilisons wordclouds.com, ainsi que les contextes. Voici quelques nuages que nous avons créés :   _____________________________________________________ _____________________________________________________ Notes : AARP : est l'American Association of Retired Persons On … Lire la suite Analyse des résultats pour l’Anglais (4/4) – Nuages de mots

Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents

Nous allons maintenant analyser les données via iTrameur. La première chose que nous allons faire pour les résultats en anglais, est de remplacer tous les syntagmes comme "nursing home", "retirement home" par la chaîne de caractères suivante: "retirement_home". Ce changement nous permet de ne pas avoir de doublons dans les représentations qui vont suivre. Calcul … Lire la suite Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents

Rodage du programme

Vu que les dernières séances étaient orientées vers rodage du programme, nous préférons ne pas écrire de compte rendu formel. Néanmoins, voici les nouveaux changements qui interviennent dans le script. Dans notre programme précédent, quelques glitchs apparaissaient, notamment via la conversion des fichiers en utf-8 et le contexte html. Nous avons décidés pour simplifier les … Lire la suite Rodage du programme

Optimisation des fonctions, minigrep, fréquence du motif

Amélioration de concatene () Vu que l'on cherche à concaténer tout les DUMPS ensemble, mais aussi les contextes, il convient de modifier la fonction "concatene ( )", vu que celle-ci nommait automatiquement le fichier concaténé TOUS_LES_DUMPS-$var.txt. On procède à une légère modification de la fonction : elle va prendre en plus comme argument le nom que … Lire la suite Optimisation des fonctions, minigrep, fréquence du motif

La maison de retraite vue de France

Le coût En France, comme aux États-Unis, le coût des maisons de retraite peut s'avérer élevé. Pour une maison de retraite non médicalisée, on peut compter entre 900 et 4000 euros par mois, soit entre 11 000 et 45 000 euros par an. Pour les établissements médicalisés (EHPAD Établissement d'hébergement pour personnes âgées dépendantes), il … Lire la suite La maison de retraite vue de France