中文情感分析
什么是情感分析
即分析主体对某一客体的主观喜恶和评价
由两个方面来衡量
情感倾向方向
情感倾向度
情感分析的方法主要分为两类
基于情感词典的方法
需要用到标注好的情感词典
基于机器学习的方法
需要大量的人工标注的语料作为训练集,提取文本特征,构建分类器,进行情感的分类。
分析粒度可以是词语、句子、段落或篇章
段落篇章级
如电影评论的分析
需要构建电影行业自己的情感词典,这样效果会比通用情感词典更好;
也可以通过人工标注大量电影评论来构建分类器
也可以通过聚合篇章中所有的句子的情感倾向来计算得出
句子级
大多通过计算句子里包含的所有情感词的值来得到
中文情感分析的一些难点
句子是由词语根据一定规则构成的,应该把词语的依存关系纳入到情感的计算过程中去
不同的依存关系,进行情感计算是不一样的
学习资料:
《中文自然语言处理入门实战》