搜索

滑铁卢大学研究人员开发出检测社交媒体上仇恨言论的新方法

1504

主题

0

回帖

4905

积分

版主

积分
4905
发表于 2024-5-31 12:00:29|来自:加拿大 | 显示全部楼层 |阅读模式


滑铁卢大学表示,该校的一组研究人员已经开发了一个程序,可以检测社交媒体平台上的仇恨言论。

学校表示,多模态讨论变压器 (mDT) 目前的准确率达到 88%,它将让那些负责标记仇恨言论的人的生活变得更轻松。

“我们真的希望这项技术能够帮助降低人类手动筛选仇恨言论的情感成本,”滑铁卢计算机科学博士生、该研究的第一作者利亚姆·赫伯特说。

“我们相信,通过在人工智能应用中采取以社区为中心的方法,我们可以帮助为所有人创建更安全的在线空间。”

               
                          
               
                学校表示,mDT 可以理解文本和图像之间的关系,同时还可以推理围绕评论的更大上下文。

                                                                         
                       
                       
                       
                                       
                        该程序还减少了误报的数量,因为它可以推断出因包含文化敏感语言而被错误标记为仇恨言论的评论。

学校表示,理解使得 mDT 比以前无法理解语言的一些细微差别的模型更加准确。

“理解仇恨言论时,语境非常重要,”赫伯特解释道。

       
        “例如,评论‘太恶心了!’本身可能是无害的,但如果它是针对一张菠萝披萨与来自边缘群体的人的照片,那么它的含义就会发生巨大变化。

       
        “理解这种区别对人类来说很容易,但训练模型来理解讨论中的上下文联系,包括考虑其中的图像和其他多媒体元素,是一个非常困难的问题。”

赫伯特和他的团队训练了他们的模型,该模型看起来使用了一个由孤立的仇恨言论以及评论上下文组成的数据集。

学校表示,他们在培训中使用了 8,266 个 Reddit 讨论以及来自 850 个社区的 18,359 条标记评论。

“每天有超过 30 亿人使用社交媒体,”赫伯特说。 “这些社交媒体平台的影响力达到了前所未有的水平。非常需要大规模检测仇恨言论,以建立每个人都受到尊重和安全的空间。”

来源链接:
https://globalnews.ca/news/10534999/uwaterloo-researchers-develop-new-method-to-detect-hate-speech-on-social-media/

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精选推荐

联系客服 关注微信 返回顶部 返回列表