Analyse des résultats pour l’Anglais (2/4) – Calcul des cooccurrents

Nous allons maintenant analyser les données via iTrameur.

La première chose que nous allons faire pour les résultats en anglais, est de remplacer tous les syntagmes comme « nursing home », « retirement home » par la chaîne de caractères suivante: « retirement_home ». Ce changement nous permet de ne pas avoir de doublons dans les représentations qui vont suivre.

Calcul des cooccurrents :

Après avoir créé la base, nous cherchons les cooccurrents de « retirement_home » dans le DUMP.

Voici les résultats obtenus pour 10 termes à gauche et à droite :

Cooc FqCooc CoFreq IndSP
Abuse 8 8 13
As 25 12 12
Illinois 12 9 12
Evictions 5 6 11
a 860 66 10
in 604 50 9
residents 114 18 8
Tri 8 6 8
To 41 11 8
Adjusting 5 5 8
Not 17 8 8
Scary 5 5 8
Illegal 5 5 8
require 12 6 7
industry 23 8 7
Columbia 8 5 7
Stop 8 5 7
AARP 16 7 7
County 32 8 6
Sues 5 4 6
American 23 7 6
Feed 10 5 6
Blog 26 7 6
for 414 29 5
owners 15 5 5
abuse 7 4 5

Ce qui donne le graph suivant :

Screenshot-2017-12-27 iTrameur Analyse textométrique des données dans un fichier

Pour 30 termes à gauche et à droite :

Cooc FqCooc CoFreq IndSP
Abuse 8 13 19
Feed 10 13 17
Illinois 12 13 15
American 23 17 13
To 41 22 12
require 12 11 11
As 25 16 11
AARP 16 13 11
elder 11 10 10
Columbia 8 8 9
Evictions 5 7 9
Illegal 5 7 9
Sues 5 7 9
residents 114 33 8
Adjusting 5 6 8
Not 17 11 8
Scary 5 6 8
Thought 5 6 8
abuse 7 7 8
Single 26 14 8
a 860 134 7
Tri 8 7 7
regulations 19 11 7
standards 11 8 7
Koreans 6 6 7
Karl 4 5 7
Merton 4 5 7
Ferron 4 5 7
Stop 8 7 7
55 7 6 6
73 2 4 6
the 1410 198 6
are 199 41 6
fund 13 8 6
Advocates 8 6 6
industry 23 11 6
Her 8 6 6
trends 2 4 6
manpower 2 4 6
statistics 2 4 6
Foundation 22 11 6
Evict 2 4 6
Patients 2 4 6
Ms 10 7 6
275 3 4 5
in 604 94 5
States 7 5 5
up 73 19 5
trust 22 10 5
federal 14 7 5
where 25 10 5
Son 3 4 5
advocates 6 5 5
California 32 11 5
substandard 3 4 5
lived 11 7 5
attorneys 10 6 5
eviction 7 5 5
Sue 6 5 5
arbitration 51 15 5
Blog 26 10 5
Levin 7 5 5
Perconti 7 5 5
neglect 3 4 5

Graph associé :

Screenshot-2017-12-27 iTrameur Analyse textométrique des données dans un fichier 30

On peut voir que les syntagmes associés sont diverses, mais sont assez liés à nos hypothèses, formulées dans un article antérieur.

On remarque que le mot est associé à l’argent : sues, fund, sue, foundation

Mais aussi à la justice et aux lois : regulations, advocates, illegal, evict, sue (poursuivre en justice)

Viennent ensuite divers termes : single, abuse, scary, adjusting… qui proviennent des articles de journaux choisis.

Enfin, notons la présence de mots vides (sans sens sémantique) : to, are, her, Ms, the, in, not, as

Laisser un commentaire