主页 > Q真生活 >AI可以帮助躁郁、被霸凌的人吗? >
AI可以帮助躁郁、被霸凌的人吗?

2020-06-06


AI可以帮助躁郁、被霸凌的人吗?
A young woman with nervous breakdown expressions on background.
大数据情绪分析

在 2017 台湾人工智慧年会演讲中,清华大学资工系的陈宜欣副教授,分享团队以机器学习分析社群发文情绪的经验。希望有助侦测网路发文者的心理状态,或协助医师理解病人无法清楚陈述的情绪。

「我没事」到底是什幺情绪

情绪,是许多疾病和社会问题的表徵。例如有躁郁倾向的人们,说话用词有很大的情绪起伏;又如网路霸凌,会反映于社群留言的用字情绪。若能及早侦测到这些情绪,就有机会及时避免憾事发生,而这个任务可透过人工智慧协助。

例如,朋友在 Facebook 发文「我没事」,究竟代表心平气和的「我没事」,还是绝望至极的「我没事」;还有当乡民留言「看吧!」,想表达的是讚赏意味的「看吧!」,或是嘲讽语气的「看吧!」?

如同《来自星星的傻瓜》电影主角所言,人类的语言非常难理解,在不同情境脉络有不同意思,甚至会隐藏真实情感说谎。这些都增加人工智慧从语意分析情绪的难度。

清华大学资工系的陈宜欣副教授,是三个小孩的妈妈。她发现从小孩学习如何说话表达情绪的过程,可以梳理出一条路径训练机器学习。虽然小孩说话常常毫无逻辑,但许多小细节累积起来,就能让大人判断小孩的情绪。

例如当小孩对妈妈说「妳总是叫我收玩具」,其中用了「总是」这个词,可以判断小孩不太高兴。或是小孩说「我永远不能电视看了」,乍听满头问号,但用了「永远不能」这组词,可以判断其中的负面情绪。

网路爬文 借用群众智慧

陈宜欣团队运用网路爬虫技术,将社群网站公开发文,跟情绪有关的内容都蒐集建立至「情绪资料库」。或许有些人会认为:「这不就是一堆人在发废文?」,但以群众外包的角度,这些社群发言集结起来,就是群众智慧,可做为训练机器学习的资料。

AI可以帮助躁郁、被霸凌的人吗?
「情绪,是社群网站上的一种特性,也是可供机器学习的资料」陈宜欣强调。 照片来源│2017 台湾人工智慧年会 X 台湾资料科学年会

团队将社群发文者原先在发文加上的情绪 Hashtag作为参考答案 ,但一开始先把这些「答案」遮起来,训练机器透过演算法学习发文中「出现哪些字」代表「什幺样的情绪」,最后再与原本的答案对照,一次次地优化机器判断情绪的準确率。

「用大数据做情绪分析有个重点,就是删资料不要心痛!」陈宜欣笑中有股失败无数次的坚毅,「太多 Hashtag 的发文、重複发文、太短没有情绪特徵的发文……等等,都要从训练资料中拿掉」。

团队也参考新闻标题,找出哪些字是较中性的「非情绪资料」,并从机器学习的训练资料中排除、优化準确率。值得注意的是,选举时期的新闻标题不能参考,因为用字遣词太过激昂。

找出情绪用词的逻辑

经过机器学习分析,陈宜欣团队发现一些跨语系的情绪逻辑。例如 “finally *** my” 这组字词多表达快乐,而中文「我终于***」也多用来传达正面的消息。又如 “my *** always” 这组字词多含有生气意味,就像小朋友说「爸爸/妈妈总是***」藉以表达不快。

中文赘字的处理,也是情绪分析很有趣的一环。「学生建议这很重要,一定要列入分析!」陈宜欣说。

例如:「喔,我来做」其实是不太想做,「喔喔,我来做」较为中性,「喔喔喔,我来做」带有积极感。凡是超过三个以上的赘字,可视同为三个赘字。这个规则用在「哈」、「哈哈」、「哈哈哈」、「哈哈哈哈」也有同工之妙。

然而陈宜欣团队发现,社群平台上「开心」的发文特别多,不能否认社群平台很多人发文以炫耀为主、或是报喜不报忧。

例如,团队看过一则发文是「那些外国动物不应该被出口」,其实这句暗地里带有种族歧视。其中一种解决方案是运用 Hatebase 仇恨发言资料库,并藉由机器学习比对非仇恨的文字资料,找出这类「暗语」的关联性 、以及相似性 。

许多人会在憾事发生后,回过头从当事者社群发文的字里行间寻找迹象,但未来能否更早侦测?当局者迷,旁观者清。让人工智慧成为一名不带情绪的旁观者,分析社群大数据找出被情绪纠葛的人们,甚至是预防犯罪、侦测自杀倾向,在来不及之前。



上一篇:
下一篇:


相关文章
今日焦点
一周热榜