7.4 主要的情感词典资源
在前面章节的叙述中,已经穿插介绍了一些公开的情感词典。这里我们整理如下,方便参考。
中文领域有如下几个情感词典(见表7.5)。
表7.5 中文公共情感词典及其词语条目数
此外,还有北京大学研发的情绪词典(Xu,et al.2010),包括喜悦情绪的词条91个,愤怒的词条112个,悲哀的词条89个,恐惧的词条103个,以及惊讶情绪的词条92个。虽然数量较少,但这种情绪划分方式比褒贬情感更细致,对一些针对细粒度的情绪分析很有帮助。
英文领域的情感词典还包括如下几项:
· SentiWordNet。基于WordNet网络计算得到的情感词典,优势在于同一词语的不同释义可能得到不同的情感得分;
· LIWC(Linguistic Inquiry and Word Count)。这是由美国德州大学奥斯汀分校、新西兰奥克兰大学的几位研究者开发的一套软件,也包含多语言的情感词典。对词语的区分很细,包括心理特性(情感词、认知词等)、个人化(工作、休闲等)等不同维度的标注。但使用需要收费;
· ANEW(Affective norms for English words)(Bradley&Lang 1999)。千余个英语单词的归一化情感,按照效价、唤醒度、优势度这三个维度进行评价;
· MPQA(Multi-Perspective Question Answering)。由美国匹兹堡大学研发的若干情感语料(英文),对情感词标记了词性、情感倾向、情感强度等信息。
随着时代的发展、语境的变迁,词典收录词条的情感倾向也可能发生变化。因此在实际应用中还需要结合现实背景和应用需求,来选择合适的词典。