Arthur Jacobs, professeur à l’université de Berlin, a récemment développé SentiArt, une nouvelle technique d’apprentissage automatique permettant d’analyser les sentiments des œuvres littérairs, ainsi que des figures à la fois fictives et réelles. Jacobs a suivi une formation en neurolinguistique, une branche de la linguistique qui explore les mécanismes neuronaux associés à l’acquisition, à la compréhension et à l’expression du langage.
Dans ses travaux précédents, il a souvent étudié la manière dont les outils d’apprentissage automatique pourraient être utilisés pour analyser et mieux comprendre le langage humain. Il s’intéresse particulièrement à ce qu’il appelle la poétique computationnelle, un domaine d’étude axé sur l’utilisation d’outils de calcul permettant de comprendre le contenu littéraire.
Mettre en pratique les idées
Dans sa nouvelle étude, Jacobs a essayé de mettre en pratique certaines des idées présentées dans ses travaux précédents en développant un outil d’analyse du sentiment dans les textes littéraires. La technique proposée, appelée SentiArt, utilise des modèles d’espace vectoriel et des listes d’étiquettes validées empiriquement et guidées par des théories permettant de calculer la valence des mots dans un texte.
Voici une vidéo en anglais expliquant le processus :
Les modèles d’espace vectoriel sont des représentations de documents texte sous forme de vecteurs d’identifiants, souvent utilisés pour filtrer, récupérer ou organiser des informations.
Un outil très simple
SentiArt est un outil très simple que toute personne peut utiliser pour comparer les mots contenus dans le texte. Son étude porte principalement sur l’anglais et l’allemand, mais il est aussi possible de l’utiliser en malais, en dialecte chinois ou en farsi.
Jacobs a souligné que SentiArt est assez facile à utiliser, ajoutant qu’il a pu l’enseigner à 30 étudiants en littérature allemande. Dans ses travaux récents, il a testé la précision de l’outil à l’aide des données recueillies lors d’une étude neurocognitive, puis l’a utilisé pour calculer des profils émotionnels et de personnalité pour certains des personnages principaux d’Harry Potter.