Data-Science

Reconnaitre le sexisme sur les réseaux sociaux

by Camille 7 février 2023

« Sexist speech recognition » est un projet de Natural Language Processing (NLP) qui a été réalisé dans le cadre de ma formation en Data-Science dispensée par l’organisme de formation Le Wagon. En équipe, nous avons entraîné un modèle de Deep-Learning à la reconnaissance de messages sexistes sur le réseau social Reddit. Nous avons présenté ce projet face à un public non-initié lors d’un démo day qui était également retransmis en live sur Twitch.

Les objectifs de ce projet étaient :

• Créer une base consolidée (données labellisées par des chercheurs)
pour entraîner le modèle à la reconnaissance de messages sexistes.

• Créer une base d’analyse en vue de la démonstration des capacités
du modèle “en conditions réelles”. Utilisation de l’API Reddit pour
récupérer des posts, commentaires…

• Créer un modèle de Deep-Learning capable de détecter
un message sexiste en utilisant le principe du transfert learning.

• Présenter les capacités et les limites de ce modèle à l’aide
d’une démonstration ludique lors du démo day.

Extrait de la présentation. Slide expliquant le fonctionnement théorique du modèle utilisé pour la détection de messages sexistes.

Camille Pettineo

Camille Pettineo

Reconnaitre le sexisme sur les réseaux sociaux

Les objectifs de ce projet étaient :