Reconnaitre le sexisme sur les réseaux sociaux
« Sexist speech recognition » est un projet de Natural Language Processing (NLP) qui a été réalisé dans le cadre de ma formation en Data-Science dispensée par l’organisme de formation Le Wagon. En équipe, nous avons entraîné un modèle de Deep-Learning à la reconnaissance de messages sexistes sur le réseau social Reddit. Nous avons présenté ce projet face à un public non-initié lors d’un démo day qui était également retransmis en live sur Twitch.
Les objectifs de ce projet étaient :
• Créer une base consolidée (données labellisées par des chercheurs)
pour entraîner le modèle à la reconnaissance de messages sexistes.
• Créer une base d’analyse en vue de la démonstration des capacités
du modèle “en conditions réelles”. Utilisation de l’API Reddit pour
récupérer des posts, commentaires…
• Créer un modèle de Deep-Learning capable de détecter
un message sexiste en utilisant le principe du transfert learning.
• Présenter les capacités et les limites de ce modèle à l’aide
d’une démonstration ludique lors du démo day.
Extrait de la présentation. Slide expliquant le fonctionnement théorique du modèle utilisé pour la détection de messages sexistes.