Nous allons analyser les données pour le français via iTrameur. De même que pour l'anglais, nous allons remplacer les syntagmes associés à "Maison de retraite" par la chaîne de caractères suivante : "maison_de_retraite" Calcul des cooccurrents Nous créons la base dans iTrameur et nous cherchons les cooccurrents de « maison_de_retraite » dans le DUMP. Voici les résultats … Lire la suite Analyse des résultats pour le français
Auteur : glnb
Traitement d’un site web en entier
Dans notre projet nous étions assez frustrés de ne pas travailler directement avec toutes les pages d'un site internet. Nos URLS pointent directement sur l'article en question, alors que nous pensions initialement à traiter un site web entier. Pour palier à cela, nous allons essayer de télécharger entièrement un site d'actualité et de traiter son … Lire la suite Traitement d’un site web en entier
Explication du script principal
Dans cet article, nous allons détailler le script ligne par ligne. Le script complet se trouve en bas de page. Tout d'abord, on indique dans le programme environnement dans lequel nous allons travailler. Comme notre langage est le bash, on indique dans la première ligne : #!/bin/bash Ensuite, on écrit les fonctions. Nous n'en avons … Lire la suite Explication du script principal
Analyse des résultats pour l’Anglais (4/4) – Nuages de mots
Nous voici enfin arrivés à la partie orientée graphique du projet. Nous allons maintenant utiliser les données pour générer des nuages de mots. Pour ce faire, nous utilisons wordclouds.com, ainsi que les contextes. Voici quelques nuages que nous avons créés : _____________________________________________________ _____________________________________________________ Notes : AARP : est l'American Association of Retired Persons On … Lire la suite Analyse des résultats pour l’Anglais (4/4) – Nuages de mots
Analyse des résultats pour l’Anglais (3/4) – Réseau de cooccurrents spécifiques
Pour monter le réseau de cooccurrents spécifiques à notre syntagme, nous avons utilisé iTrameur avec les paramètres suivants : Fréquence min: 10 ; Seuil: 5 ; Co-Freq: 1 ; IndSPmin: 5 On obtient le graph suivant: De même pour le réseau de cooccurrents spécifiques via l'expression régulière :
Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents
Nous allons maintenant analyser les données via iTrameur. La première chose que nous allons faire pour les résultats en anglais, est de remplacer tous les syntagmes comme "nursing home", "retirement home" par la chaîne de caractères suivante: "retirement_home". Ce changement nous permet de ne pas avoir de doublons dans les représentations qui vont suivre. Calcul … Lire la suite Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents
Analyse des résultats pour l’Anglais (1/4)
(le tableau final se trouve en fin de page) Nous avons maintenant récupéré et trié les données de chaque langue et nous approchons de l'analyse de celles-ci. Avant toute chose, concernant les données de l'anglais, on peut remarquer la faible fréquence du motif correspondant à "Maison de retraite" pour une moitié des URLS. Ces 25 … Lire la suite Analyse des résultats pour l’Anglais (1/4)
Rodage du programme
Vu que les dernières séances étaient orientées vers rodage du programme, nous préférons ne pas écrire de compte rendu formel. Néanmoins, voici les nouveaux changements qui interviennent dans le script. Dans notre programme précédent, quelques glitchs apparaissaient, notamment via la conversion des fichiers en utf-8 et le contexte html. Nous avons décidés pour simplifier les … Lire la suite Rodage du programme
Optimisation des fonctions, minigrep, fréquence du motif
Amélioration de concatene () Vu que l'on cherche à concaténer tout les DUMPS ensemble, mais aussi les contextes, il convient de modifier la fonction "concatene ( )", vu que celle-ci nommait automatiquement le fichier concaténé TOUS_LES_DUMPS-$var.txt. On procède à une légère modification de la fonction : elle va prendre en plus comme argument le nom que … Lire la suite Optimisation des fonctions, minigrep, fréquence du motif
La maison de retraite vue de France
Le coût En France, comme aux États-Unis, le coût des maisons de retraite peut s'avérer élevé. Pour une maison de retraite non médicalisée, on peut compter entre 900 et 4000 euros par mois, soit entre 11 000 et 45 000 euros par an. Pour les établissements médicalisés (EHPAD Établissement d'hébergement pour personnes âgées dépendantes), il … Lire la suite La maison de retraite vue de France