Comment fonctionne notre classification par Intelligence Artificielle.

Nous recevons beaucoup de questions sur le fonctionnement de notre classification par IA, nous avons donc décidé de faire 2 dessins pour expliquer son fonctionnement.

1. La taxonomie.
Les Médias de l’intérieur.
Incluant expertise et sensibilité.

Un média a des sources qui publient chacune de nouveaux articles. De chaque nouvel article, nous ne gardons que des mots utiles (pas de « stop words » comme « le, est, mais… ») que nous appelons « abstract ».

Chaque mot de ce nouvel abstract est comparé à plusieurs centaines de datasets de mots (bags of words). Chaque classification de notre taxonomie a son propre dataset.

Chaque million d’abstracts représente 75,000,000,000 d’operations.

Cette méthode est proche du modèle tribal. Chaque tribu utilise un dialecte fait de mots qui signent ce dialecte. Quand on reconnaît un dialecte, on reconnaît une tribu, ici appelé classification. En fonction du nombre et du poids des mots, nous sommes en mesure d’évaluer le niveau d’expertise dans la classification. Cela nous donne une note pour l’article.

En jouant avec la longueur de la période passée, on peut aussi mesurer la sensibilité des sources à l’actualité. La compilation des sources nous renseigne sur la situation des médias.

Conclusion : Nous avons une taxonomie universelle, toujours mise à jour et pouvant être filtrée par niveau d’expertise et sur 3 périodes de temps pour détecter la sensibilité au travers du temps (et la formation de tendances, mais nous vous en dirons plus très bientôt)

2. Les Perceptions.
Les Média de l’extérieur.
Comment un média est-il perçu.

Les « fake news », la « Junk science » et d’autres appréciations toxiques sont tangibles. Rarement, cela peut-il être intangible, parce qu’il s’agit d’appréciations. Ce qui est une « fake news » pour certains ne l’est pas pour d’autres. C’est pourquoi nous traitons ces appréciations comme « spotted as », ou « perçues sur internet comme ».

Tout comme la taxonomie, on parle ici d’appréciation, mais, alors que la taxonomie concerne l’éditeur lui-même, nous l’appelons le « Publisher Inside », la perception est le « Publisher Outside », ou comment l’éditeur est perçu pour ces termes sur le web.

Pour ce faire, nous collectons la perception de l’éditeur sur Internet, en excluant strictement toute propriété de l’éditeur lui-même.

Cela nous donne des pages et des mots que nous associons aux datasets de chaque Perceptions (un pour les « fausses nouvelles », un pour la « science poubelle » et ainsi de suite) d’une manière similaire à celle expliquée ci-dessus.

Nous avons alors un score qui, lorsqu’il est supérieur à un seuil, fait que la publication est « perçue comme une fake news » par exemple.

Conclusion : Nous évaluons comment une publication est perçue, par Machine Learning, car aucune personne ou aucun groupe ne peut le décréter.

Des questions ? Tirez !

Partagez sur:

Publié par

Freddy Mini

CEO & co-fondateur