Pablo Picasso.
Une des rares validations scientifiques de l’astrologie non biaisée par des problèmes statistiques ou de cold reading. Compte rendu de la traduction d’un article de la revue de recherche astrologique « Correlation » n°32 par Vincent Godbout (troisième partie).
" Évaluation
des correspondances avec l'Estimateur de Proximité Sémantique
L’Estimateur de Proximité Sémantique (Godbout, 2018) évalue numériquement la similarité sémantique entre deux listes de mots. Dans la Table 3, les mots extraits des biographies sont listés verticalement (à gauche) et les mots basés sur des facteurs astrologiques trouvés par le système expert
sont listés horizontalement (en haut). L'Estimateur analyse et évalue avec des
scores numériques, dans quelle mesure les deux listes expriment la même chose.
Deux listes identiques, par exemple, obtiendraient un score de proximité
sémantique de 100 %.
L'évaluation de ces correspondances
est beaucoup plus difficile pour un humain que l'on ne pourrait le penser.
Entre autres choses, en tant qu'humains, nous luttons contre l'effet Barnum (écouter
des généralités et croire qu’il s’agit de vérités spécifiques) et contre d'autres
biais de confirmation. Spontanément, nous avons tendance à penser :
« Cette description astrologique est-elle une bonne description de Picasso
? » Au lieu de cela, il est plus efficace de nous demander : « Cette
description astrologique est-elle plus proche du caractère de Picasso ou de
Bill Clinton ? » Parce que les humains trouvent très difficile de faire correspondre
la somme des informations, ne serait-ce que pour seulement trois personnes, et
parce que nous avons des biais, c'est une tâche que l'Estimateur de Proximité Sémantique
fait beaucoup mieux que nous.
Reprenons l'exemple de Picasso.
La table 3 présente la grille d'analyse de Picasso. La colonne verticale à
gauche énumère les mots biographiques et la ligne horizontale en haut les mots
astrologiques. Le nombre de mots biographiques correspond au nombre total de
lignes, ici R = 96 (R signifie Rows : lignes). Le nombre de mots
astrologiques correspond au nombre total de colonnes, ici C = 152.
Table 3. Comparaison des deux listes de mots de
Picasso dans la grille d'analyse de l'Estimateur de Proximité Sémantique
Verticalement, Picasso obtient des
mots biographiques comme désir, amour, énergie, passion, etc.
Horizontalement, il obtient les mots astrologiques : amour, sensibilité, sociabilité, beauté, etc. Il s'agit de vérifier dans quelle mesure ces deux
listes complètes ont globalement une signification similaire et d'évaluer
numériquement leur « proximité sémantique ».
Nous vérifions très simplement
s'il y a des mots identiques dans les deux listes. Ces correspondances sont
indiquées par des cellules noires dans la matrice. Par exemple, les mots
suivants : amour, passion, art et beauté,
apparaissent dans les deux listes. Le nombre 1000 dans les cellules noires
distingue ce type de correspondance, que nous appelons « Identité ». Il
existe aussi un autre type de correspondance plus subtil que nous appelons
« Analogie ». Les analogies sont marquées par le chiffre 1 dans les
cellules rouges de la matrice.
Pour évaluer la proximité entre les listes de
mots astrologiques et biographiques, nous devons mesurer deux fréquences relatives.
La fréquence relative de Type 1 est la proportion de mots astrologiques qui
correspondent à des mots biographiques et la fréquence relative de Type 2 est
la proportion de mots biographiques qui correspondent à des mots astrologiques.
Pour les lecteurs familiers avec les statistiques, la méthode d'attribution d'un score numérique final au total de tous ces résultats est inspiré des deux types d'erreurs en statistique - les erreurs de Type 1 et de Type 2. L'erreur de Type 1 survient lorsqu'un mot astrologique n'est pas détecté dans la liste biographique. L'erreur de Type 2 se produit lorsqu'un mot biographique n'est pas détecté dans la liste astrologique.
Pour calculer les fréquences relatives des succès de Type 1 et des succès de Type 2, nous divisons le nombre de correspondances par le nombre total de mots de leurs listes respectives. Les fréquences relatives des succès exprimées en pourcentage garantissent que les scores de proximité sémantique ne sont pas sensibles à la taille des listes de mots. Une personne pourrait utiliser des milliers de mots astrologiques et, ainsi, parvenir à se connecter avec presque tous les mots biographiques (ce qui est similaire à ce que certains astrologues font sans s'en rendre compte). Mais, bien sûr, une telle stratégie de « fishing » générerait des faux positifs car la grande majorité des mots astrologiques n'auraient pas de mots correspondants dans la liste biographique. Mais, si la taille des listes est considérée de manière équitable, la conversion en fréquences relatives limiterait la signification des correspondances correctes en incluant un nombre énorme de mots sans correspondance.
Dans notre expérience, le nombre de mots peut varier quelque peu d'une liste à l'autre. Donc, c’est pourquoi, ce qui compte vraiment, c'est la fréquence relative, c’est-à-dire la proportion de mots qui correspondent de astro à bio (Type 1) et de bio à astro (Type 2).
Pour combiner les scores d'Identité de Type 1 et de Type 2, nous faisons la moyenne de leurs fréquences relatives exprimées en pourcentages. Cette valeur moyenne est une bonne mesure de la correspondance entre les deux listes."
Présentation de l'Estimateur de proximité sémantique sur YouTube par Vincent Godbout (10 minutes).
Le logiciel d'astrologie Mastro, logiciel bilingue français-anglais
Voilà. C'est tout pour le moment. Amitiés à tous.