Perdus dans la Traduction : Comment la Modération de Contenu Laisse les Locuteurs Tamouls en Ligne à l'Abandon | TechPolicy.Press
Les plateformes technologiques modèrent le contenu dans de nombreuses langues, mais elles manquent souvent de ressources pour les langues autres que l'anglais et d'autres langues majeures. Ce problème affecte de manière disproportionnée les utilisateurs des pays du Sud, comme le démontre une étude récente sur le tamoul, une langue parlée par plus de 80 millions de personnes. Tech Policy Press explore comment le statut de "langue à faible ressource" du tamoul entrave la modération en ligne et affecte la liberté d'expression.
Le tamoul, bien que largement parlé en Asie du Sud et dans les communautés de la diaspora, souffre d'un manque de données de qualité pour développer des systèmes automatisés robustes. Cette limitation technique est aggravée par son histoire politique complexe, notamment en Sri Lanka où des décennies de guerre civile ont restreint son expression. En Inde, les locuteurs tamouls résistent aux politiques linguistiques favorisant l'hindi et l'anglais, perçues comme une menace pour leur identité culturelle.
Une enquête menée auprès de 147 utilisateurs fréquents des réseaux sociaux en Inde et au Sri Lanka, complétée par 17 entretiens qualitatifs, révèle des stratégies pour contourner la modération. Les utilisateurs mélangent souvent le tamoul avec l'anglais ou utilisent des caractères latins pour faciliter la publication. Certains recourent à l'"algospeak" (mots codés) ou floutent des symboles sensibles pour éviter les censures.
Les grandes entreprises technologiques adoptent généralement une approche "globale" de modération, souvent insensible aux nuances linguistiques. Le contenu est traduit automatiquement en anglais, ce qui entraîne des erreurs, surtout pour des langues comme le tamoul. En revanche, certaines entreprises indiennes privilégient une modération localisée, ajustant leurs politiques et formant des modérateurs compétents en tamoul. Cependant, cette approche est coûteuse et rarement mise en œuvre.
La majorité des répondants estiment que leurs opinions politiques sont censurées via des politiques de modération trop larges. Certains soupçonnent un "shadowbanning" (limitation invisible de leur portée) lorsqu'ils utilisent des symboles ou mots politiquement sensibles. Les plateformes, sous pression gouvernementale, appliquent des définitions vagues de "contenu nuisible", souvent motivées politiquement.
Dans un contexte de tensions entre l'Inde et le Pakistan, où la désinformation en ligne prolifère, la modération équitable devient cruciale. Aliya Bhatia, co-auteure du rapport, souligne l'importance de soutenir les équipes internes chargées des politiques linguistiques et de collaborer avec des organisations locales pour combler le manque de ressources.
Le rapport met en garde contre l'utilisation excessive d'outils automatisés pour les langues à faible ressource comme le tamoul. Bhatia insiste sur la nécessité de consulter des experts avant de déployer ces technologies, afin d'éviter de porter atteinte à la liberté d'expression. En conclusion, une approche collaborative et localisée est essentielle pour une modération plus juste et efficace.