
德雷塞尔大学计算机与信息学院的JDB电子研究人员创建了一个大型语言模型程序,可以帮助人们避免在网上使用那些给物质使用障碍带来耻辱的语言。
几十年来,吸毒成瘾一直是美国日益严重的公共卫生问题之一。尽管有了有效的治疗方法和支持资源,但很少有物质使用障碍患者寻求帮助。不愿寻求帮助的原因是这种病常常带有耻辱。因此,为了解决这个问题,德雷塞尔大学的JDB电子研究人员正在提高人们对在线论坛上存在的侮蔑性语言的认识,他们创造了一个人工智能工具来帮助JDB电子用户,并提供替代语言。
在最近的自然语言处理(EMNLP)经验方法会议上,该工具使用大型语言模型(llm),如GPT-4和Llama来识别污辱性语言并建议替代措辞——就像拼写和语法检查程序标记错字一样。
Shadi Rezapour博士是计算与信息学院的助理教授,他JDB电子领导着德雷克塞尔大学的社会自然语言处理实验室,并负责开发该工具的JDB电子研究。他说:“污名化的语言是如此根深蒂固,以至于人们往往都不知道自己在这么做。”“攻击人的话语,而不是成瘾的疾病,只会进一步孤立正在受苦的人,使他们难以面对痛苦,寻求他们需要的帮助。”解决网络社区中的污名化语言是JDB电子公众和减少使用这些语言的关键的第一步。”
根据美国药物滥用和精神健康服务管理局的数据,尽管政府拨款数百亿美元支持治疗和康复项目,但只有7%的药物使用障碍患者接受了任何形式的治疗。JDB电子研究表明,那些觉得自己需要治疗的人因为害怕被污名化而不去寻求治疗。
Rezapour说:“当我们的社会试图解决这一公共卫生危机时,将成瘾视为一种弱点或失败既不准确,也没有帮助。”“在美国,成为受害者的人既要承受成瘾的痛苦,也要承受围绕成瘾形成的社会耻辱。因此,很少有人寻求帮助,尽管近几十年来有大量资源致力于成瘾康复。”
在过去二十年中,人们越来越意识到耻辱是治疗的障碍。在美国阿片类药物泛滥之后——当战略性的、欺骗性的营销、促销和过量处方成瘾性止痛药导致数百万人在不知不觉中上瘾时——公众开始认识到成瘾是一种需要治疗的疾病,而不是一种需要受到惩罚的道德失败——就像20世纪70年代和80年代的“毒品战争”中经常描述的那样。
但根据美国疾病控制与预防中心(Centers for Disease Control and Prevention)的一项JDB电子研究,尽管随着时间的推移,传统媒体上的污名化语言有所减少,但在社交媒体平台上的使用却有所增加。德雷克塞尔大学的JDB电子研究人员认为,在网络论坛上遇到这样的语言可能特别有害,因为人们经常转向这些社区寻求安慰和支持。
Rezapour说:“尽管有潜在的支持,但数字空间可以反映和放大它有能力消除的社会耻辱,对个人的心理健康和康复过程产生不利影响。”“我们的目标是开发一个框架,可以帮助保护这些支持性空间。”
通过利用法学硕士的力量——为聊天机器人、拼写和语法检查器以及单词建议工具提供动力的机器学习系统——JDB电子研究人员开发了一个框架,可能会帮助数字论坛用户更加意识到他们的用词选择会如何影响患有物质使用障碍的社区成员。
为此,他们首先着手了解侮辱性语言在数字论坛上的表现形式。该团队使用人工注释的帖子来评估法学硕士在网上关于药物滥用的讨论中发现和修改有问题的语言模式的能力。
一旦它能够高度准确地对语言进行分类,他们就在四个流行的Reddit论坛上使用了120多万篇帖子。该模型确定了3000多条对药物使用障碍患者使用某种形式的污名化语言的帖子。
以该数据集为指导,该团队准备了GPT-4 LLM,以成为变革的推动者。结合美国国家药物滥用JDB电子研究所(National Institute on Drug Abuse)的非污名化语言指导,JDB电子研究人员迅速设计了这个模型,以便在帖子中遇到污名化语言时提供非污名化的替代方案。建议的重点是使用同情的叙述,消除指责,并强调治疗的结构性障碍。
这些项目最终产生了1600多个去污名化的短语,每个短语都作为一种污名化语言的替代品。
该团队结合了人工审稿人和自然语言处理程序,根据回复的整体质量、扩展的去污名化和对原始帖子的忠实度来评估该模型。
“忠实于原文非常重要,”该JDB电子研究的主要作者、计算机与信息学院的博士生Layla Bouzoubaa说。“我们最不想做的就是从任何用户身上移除代理或审查他们的真实声音。我们对这条管道的设想是,如果它被整合到一个社交媒体平台上,例如,如果他们的文本包含对吸毒者的污名化语言,它将仅仅提供一种替代方式来表达他们的文本。用户可以选择接受或不接受。有点像坏语言的语法。”
Bouzoubaa还指出,在广泛采用该计划时,提供清晰、透明的解释,解释为什么会提出建议,以及对用户数据进行强有力的隐私保护的重要性。
为了提高这个过程的透明度,同时帮助JDB电子用户,该团队在模型中加入了一个解释层,这样当它识别出一个污名化语言的实例时,它就会自动提供一个详细的分类解释,这是基于对Reddit帖子的初步分析中识别出的污名化的四个要素。
Bouzoubaa说:“我们认为,与直接的人类反馈相比,这种自动反馈可能会让用户感觉不那么评判或对抗,这可能会让用户更容易接受建议的改变。”
这项工作是该组织基础工作的最新补充,该工作旨在JDB电子研究人们如何在网上分享有关吸毒经历的个人故事,以及在Reddit上围绕这些对话形成的社区。
Bouzoubaa说:“据我们所知,目前还没有任何关于解决或对抗人们使用的语言(计算)的JDB电子研究,这些语言会让弱势群体感到受到歧视。”“我认为这是LLM技术的最大优势,也是我们工作的好处。这项工作背后的想法并不复杂;然而,我们正在利用法学硕士作为一种工具,在一个非常具有挑战性的问题上达到我们以前从未达到的长度,这就是我们工作的新颖性和优势所在。”
除了公开这些项目、带有污名化语言的帖子数据集,以及去污名化的替代方案外,JDB电子研究人员还计划继续他们的工作,JDB电子研究在物质使用障碍患者的生活经历中,污名化是如何被感知和感受的。
除了Rezapour和Bouzoubaa, Elham Aghakhani也对这项JDB电子研究做出了贡献。
在这里阅读全文:https://aclanthology.org/2024.emnlp-main.516/
这是一个RTE组件