La Classification opérée par IA de TrustedOut.

Collecte de données et classification du contenu.

Notre base de données de profils médias a 2 fonctions distinctes. Collecte de données intangibles, comme le revenu, la propriété, les années en ligne…) et classification du contenu pour notre taxonomie et comment les sites sont « repérés comme » (comme « fausses nouvelles », « junk science »…) La collecte de données est un exercice multi-reférences, de vérification croisée et de veille d’évolution quand…

La classification du contenu est entièrement basée sur le Machine Learning.

Et sur « sacs des mots » (bags of words). Pour chaque travail de classification, nous construisons des ensembles de données (datasets) composés de mots sur lesquels la fréquence d’occurrence est utilisée pour former un classificateur.

Classification de la Taxonomie.

Comme dans le graphique ci-dessus, chaque article est comparé à nos jeux de données de taxonomie afin que nous puissions classer chaque article. Cela nous donne une image claire d’un flux, et donc de l’ensemble du média, ce qui, bien sûr, représente beaucoup d’opérations : 75 000 par article. Oui, 75 milliards d’ops par million d’articles par jour.

Fun facts sur notre taxonomie (à aujourd’hui !)

ADN de taxonomie.

Ce qui suit est la visualisation de l’ADN de la section Tech du New York Times.

Personnalisation de la sensibilité et de la profondeur de la taxonomie.

Les ensembles de données (datasets) utilisés pour classer les articles peuvent utiliser un buffer de temps personnalisé pour ces ensembles de données et ainsi, gérer la sensibilité aux nouvelles quotidiennes de la taxonomie. De plus, les limites plancher peuvent également être personnalisées pour sélectionner une profondeur d’expertise, de « dédié » à « couvert » ou même « toutes les instances ». La combinaison des deux et le facteur « toujours à jour » font de notre taxonomie un outil parfaitement adapté au travail que l’analyste souhaite effectuer. Raison pour laquelle nous utilisons « Corpus Intelligence » comme tagline.

Enterprise Mapping.

Nous pouvons également relier notre taxonomie à la taxonomie de l’entreprise de nos clients, de sorte que la Corpus Intelligence peut utiliser l’environnement professionnel du client, (Nous allons couvrir cela dans un poste dédié plus tard. Si vous ne pouvez pas attendre, demandez à l’aide du formulaire ci-dessous)

Classification des « Repéré comme » (Spotted as).

Le point d’être géré par Intelligence Artificielle est que nous n’avons ni émotion, ni opinion. Tout est fait pour que nos clients puissent définir ce dont ils ont vraiment besoin et ce en quoi ils ont confiance pour le contenu.

TrustedOut ne note ni ne juge rien ni personne. De plus, des notions comme « fausses nouvelles » (fake news) ne sont pas aussi claires qu’on pourrait le croire. Le rapport « Médias, confiance et démocratie » le dit parfaitement dans son introduction : « L’inquiétude au sujet des « fausses nouvelles » est grande, mais nous ne pouvons pas nous mettre d’accord sur ce que cela signifie. »

Une image vivante de la façon dont un média est « repéré comme ».

Comme TrustedOut présente les médias et leurs valeurs de marque, nous avons mis au point une façon sophistiquée de classifier la façon dont un média est  » repéré  » ou perçu. En d’autres termes, nous ne notons ni ne jugeons, nous vous disons si un média est « repéré » comme étant une publication de fausses nouvelles, par exemple, et la façon dont un média est « repéré » varie avec le temps. Certains s’aggravent, d’autres ne sont que la reprise de ceux qui avaient été fermés précédemment, d’autres encore sont, bien sûr, corrigés et améliorés. C’est pourquoi il est obligatoire de maintenir une classification toujours à jour. Et par conséquent, ayez votre Corpus de documents toujours à jour.

Fonctionne avec tous les termes. Mauvais ou bons.

« Fausses nouvelles » est toujours la première chose qui me vient à l’esprit, puis tous les termes toxiques ou suspects comme « Extreme bias », « Junk Science »… mais elle peut aussi fonctionner parfaitement pour des termes neutres ou positifs, comme « Visionnaire », « Optimiste »…. Cela vous ouvre les portes de la personnalisation à l’échelle de l’entreprise.

Des questions? Dites-nous!

Partagez sur:

Publié par

Freddy Mini

CEO & co-fondateur