vendredi 22 janvier 2021

Une des rares validations scientifiques de l’astrologie non biaisée par des problèmes statistiques ou de cold reading. Compte rendu de la traduction d’un article de la revue de recherche astrologique « Correlation » n°32 par Vincent Godbout (troisième partie).

 


Pablo Picasso.


Une des rares validations scientifiques de l’astrologie non biaisée par des problèmes statistiques ou de cold reading. Compte rendu de la traduction d’un article de la revue de recherche astrologique « Correlation » n°32 par Vincent Godbout (troisième partie).

" Évaluation des correspondances avec l'Estimateur de Proximité Sémantique

L’Estimateur de Proximité Sémantique (Godbout, 2018) évalue numériquement la similarité sémantique entre deux listes de mots. Dans la Table 3, les mots extraits des biographies sont listés verticalement (à gauche) et les mots basés sur des facteurs astrologiques trouvés par le système expert sont listés horizontalement (en haut). L'Estimateur analyse et évalue avec des scores numériques, dans quelle mesure les deux listes expriment la même chose. Deux listes identiques, par exemple, obtiendraient un score de proximité sémantique de 100 %.

L'évaluation de ces correspondances est beaucoup plus difficile pour un humain que l'on ne pourrait le penser. Entre autres choses, en tant qu'humains, nous luttons contre l'effet Barnum (écouter des généralités et croire qu’il s’agit de vérités spécifiques) et contre d'autres biais de confirmation. Spontanément, nous avons tendance à penser : « Cette description astrologique est-elle une bonne description de Picasso ? » Au lieu de cela, il est plus efficace de nous demander : « Cette description astrologique est-elle plus proche du caractère de Picasso ou de Bill Clinton ? » Parce que les humains trouvent très difficile de faire correspondre la somme des informations, ne serait-ce que pour seulement trois personnes, et parce que nous avons des biais, c'est une tâche que l'Estimateur de Proximité Sémantique fait beaucoup mieux que nous.

Reprenons l'exemple de Picasso. La table 3 présente la grille d'analyse de Picasso. La colonne verticale à gauche énumère les mots biographiques et la ligne horizontale en haut les mots astrologiques. Le nombre de mots biographiques correspond au nombre total de lignes, ici R = 96 (R signifie Rows : lignes). Le nombre de mots astrologiques correspond au nombre total de colonnes, ici C = 152.

 

Table 3. Comparaison des deux listes de mots de Picasso dans la grille d'analyse de l'Estimateur de Proximité Sémantique




Verticalement, Picasso obtient des mots biographiques comme désir, amour, énergie, passion, etc. Horizontalement, il obtient les mots astrologiques : amour, sensibilité, sociabilité, beauté, etc. Il s'agit de vérifier dans quelle mesure ces deux listes complètes ont globalement une signification similaire et d'évaluer numériquement leur « proximité sémantique ».

Nous vérifions très simplement s'il y a des mots identiques dans les deux listes. Ces correspondances sont indiquées par des cellules noires dans la matrice. Par exemple, les mots suivants : amour, passion, art et beauté, apparaissent dans les deux listes. Le nombre 1000 dans les cellules noires distingue ce type de correspondance, que nous appelons « Identité ». Il existe aussi un autre type de correspondance plus subtil que nous appelons « Analogie ». Les analogies sont marquées par le chiffre 1 dans les cellules rouges de la matrice.

Pour évaluer la proximité entre les listes de mots astrologiques et biographiques, nous devons mesurer deux fréquences relatives. La fréquence relative de Type 1 est la proportion de mots astrologiques qui correspondent à des mots biographiques et la fréquence relative de Type 2 est la proportion de mots biographiques qui correspondent à des mots astrologiques.

Pour les lecteurs familiers avec les statistiques, la méthode d'attribution d'un score numérique final au total de tous ces résultats est inspiré des deux types d'erreurs en statistique - les erreurs de Type 1 et de Type 2. L'erreur de Type 1 survient lorsqu'un mot astrologique n'est pas détecté dans la liste biographique. L'erreur de Type 2 se produit lorsqu'un mot biographique n'est pas détecté dans la liste astrologique. 

Pour calculer les fréquences relatives des succès de Type 1 et des succès de Type 2, nous divisons le nombre de correspondances par le nombre total de mots de leurs listes respectives. Les fréquences relatives des succès exprimées en pourcentage garantissent que les scores de proximité sémantique ne sont pas sensibles à la taille des listes de mots. Une personne pourrait utiliser des milliers de mots astrologiques et, ainsi, parvenir à se connecter avec presque tous les mots biographiques (ce qui est similaire à ce que certains astrologues font sans s'en rendre compte). Mais, bien sûr, une telle stratégie de « fishing » générerait des faux positifs car la grande majorité des mots astrologiques n'auraient pas de mots correspondants dans la liste biographique. Mais, si la taille des listes est considérée de manière équitable, la conversion en fréquences relatives limiterait la signification des correspondances correctes en incluant un nombre énorme de mots sans correspondance. 

Dans notre expérience, le nombre de mots peut varier quelque peu d'une liste à l'autre. Donc, c’est pourquoi, ce qui compte vraiment, c'est la fréquence relative, c’est-à-dire la proportion de mots qui correspondent de astro à bio (Type 1) et de bio à astro (Type 2). 

Pour combiner les scores d'Identité de Type 1 et de Type 2, nous faisons la moyenne de leurs fréquences relatives exprimées en pourcentages. Cette valeur moyenne est une bonne mesure de la correspondance entre les deux listes."

Présentation de l'Estimateur de proximité sémantique sur YouTube par Vincent Godbout (10 minutes).

Le logiciel d'astrologie Mastro, logiciel bilingue français-anglais


Voilà. C'est tout pour le moment. Amitiés à tous.