竞赛 > 创意应用类 > 基于视角的领域情感分析
基于视角的领域情感分析

基于视角的领域情感分析

420 支队伍
100% 完成

决赛

2016-12-17 21:00:00
2016-12-23 14:00:00

竞赛背景

随着网络舆情分析在产品中重要性的增加,对数据情感判断的需求以及对文本中带视角的判断的需求也越来越高。文档类型多种多样,文章中描述的情感也具有多样性,站在不同的视角,文章展现的情感倾向也不相同。同时,来源于互联网上的UGC(用户产生内容)文章也随着用户语言习惯的不同而多种多样,给情感分析带来了一定的挑战。本题目立意于基于视角的领域情感分析,希望能够吸引对具体算法和技术感兴趣的参赛者,在全国范围内发现和培养大数据及自然语言处理领域的人才。

竞赛简介

情感分析是网络舆情分析中必不可少的技术,基于视角的领域情感分析更是情感分析应用于特定领域的关键技术。在对句子进行情感分析时,站在不同的视角,同一个句子的情感倾向判断结果将有所差别。本赛题意在情感分析任务中,站在数据使用者的角度进行特定的情感分析,使数据分析的结果更具可用性。本赛题可以细分为“视角抽取”与“基于视角的情感分析”两部分。下文首先介绍“视角”的定义,而后对“视角抽取”与“基于视角的情感分析”任务进行详细介绍:

视角定义:在情感分析这一任务中,对于同一个文档或句子,不同的数据使用者去分析,将会有不同的情感倾向。同时,从文中不同内容去分析,也有可能会得到不一样的情感。

例如:

在“A车在第三季度一举超过B车成为销量冠军”这样一句话中,如果分析者站在A车的角度去考虑,这句话就是正面的,但是如果分析者在B车的角度,则丢失了销量冠军这样一则消息是负面的。而在本句话中,“A车”和“B车”则是两个不同的情感视角。

视角泛指某一类的思考角度,可以理解为数据使用者角度,亦可以理解为文本中某些方面,在本赛题中,为了简化《基于视角的领域情感分析》这一任务,我们将视角进行具体化——特指文本中出现的汽车品牌词语(如:“上汽大众”、“美国通用”、“速派”、“POLO”等)。

视角抽取:又称为“视角识别”。顾名思义,这一任务意在从文本中抽取(识别)出可以描述视角的词语。由于在本次任务中,视角特指汽车品牌词,故这一步的任务需要参赛队伍抽取(识别)出文本中的汽车品牌词(或别名)。

例如:

1.  “考虑到终端市场的情况,我们本次选取了全新迈腾全系的次顶配车型和帕萨特2.0T排量的顶配车型来进行对比”一句话中,参赛队伍应抽取出“迈腾”和“帕萨特”两个视角。

2.  “最终我们放弃了迈腾,把小帕开回了家!”一句中,参赛队伍应抽取出“迈腾”和“小帕”两个视角。在这里“小帕”是“帕萨特”的别名。

在本次评测中,我们将给出一个汽车品牌词语集合来供参赛队伍参考。这个品牌词集合包含了测试语料中出现的大部分汽车品牌词及少部分未出现的汽车品牌词。为了验证参赛队伍“视角抽取”方法的鲁棒性,会有评测语料中的部分汽车品牌词并未出现在这一集合中的现象。

        基于视角的情感分析:给定一个句子,如果该句子中包含“视角”词语,则应针对这一视角进行情感分析;如果句子中包含多个“视角”词语,则应对不同的视角进行单独的情感分析;如果句子中不包含视角,则不做情感判别处理。

竞赛交流

进入微社区
加入QQ群:103253667

竞赛奖励

类型:自定义

奖励:

奖金:

      一等奖:4万元/  1

      二等奖:1万元/  1

培训:进入复赛的队伍将获得国双提供的在线技术培训

岗位:决赛队伍将直接得到国双实习Offer,实习表现优异可转正

创业:对于有意向创业的团队,国双可提供创业孵化机会 

作品提交

初赛期间线上提交结果,采用线上A/B榜评分

复赛期间线上提交结果,采用线上A/B榜评分; 并在复赛截止前线上提交方案说明文档,由本赛题评审专家结合线上成绩与方案说明文档评选出5支优胜队参与决赛现场答辩!

线上结果文件格式以及方案说明文档要求,参见“提交要求”;

登录参赛