转载

专攻中文文本情感解析,语忆科技想帮企业读懂消费者“心声”

专攻中文文本情感解析,语忆科技想帮企业读懂消费者“心声”

《我们的生活》好看吗?苹果8好用吗?推特治国的川普到底受不受美国民众欢迎?

要回答这些问题,最好的工具是情感分析(sentiment analysis)——这是一种快速从海量带有情感色彩的主观性文本进行分析处理、从而归纳推理出关键信息的手段。

市面上首款中文文本情感解析引擎Kismet ,来自成立于2016年9月的杭州语忆科技有限公司。当下市面上的技术仅能对文本进行情感的正负极判断(积极/消极),而基于公司自主研发的深度学习算法,Kismet可以在很短时间内分析出其中的细节情绪,并挖掘到引起情绪变化的关键词。比如说,告诉你苹果8的产品评论中焦虑情绪居多,引起焦虑的关键词是“价格”。

情感经济(emotion economy)或许是个新词,但消费者情绪的商业价值并不是一个新概念——营销学的核心,就是 创造环境来调动消费者的情绪、从而影响其行为 。Kismet最直接的应用,就是商业分析咨询服务:帮助企业分析消费者对产品的情绪表达,挖掘出产品属性及其对应的用户情感反馈,从而提供完善产品或提高服务体验的建议。事实上,文本挖掘和舆情监控——通过收集互联网的各类文本信息,帮助企业进行竞争分析、公关、用户调研等——已经是大数据公司一项相对成熟的业务。Kismet的定位是服务于企业客户,为他们提供情感维度的API服务和分析报告;但在这个巨大的B端市场成熟之前,或许服务于这些企业的大数据公司,会是Kismet现阶段的主要客户。

Wikibon报告显示,全球大数据市场在以31%的复合年均增长率迅速扩张,2017年市场规模超过470亿美金。易观智库预测中国大数据市场在2017年将达到170亿人民币的规模,其中84.3亿来自IT企业的大数据应用及大数据平台业务市场——这84.3亿营收对应的大数据服务公司,就是Kismet作为中文文本情绪解析引擎、直接服务的市场。如果公司有足够强大的海外拓展能力,那么470亿美金中的73.8亿美金的大数据应用分析公司营收中,Kismet也能分一杯羹。

专攻中文文本情感解析,语忆科技想帮企业读懂消费者“心声”

按照市场研究公司Wikibon的预测,2017年大数据分析公司的总营收是73.8亿美金 - Big Data Application (Analytic and Transactional) Revenue

文本的情感分析,主要分为三个步骤。第一步是分词,即分拆句子中的单词,这项技术已经非常成熟;第二步是整体语义判断及情感正负面判断,这项技术相对成熟,中文文本分析市场上的 腾讯文智 和 玻森咨询 都做得不错;第三步是情绪解析,包括分析情绪的多个维度和情感浓度等,这项技术目前在萌芽阶段,中文市场上尚无公司提供相应服务;文本分析明星、IBM Watson核心技术来源之一 AlchemyAPI ,也只是提供了一个 能够识别五种情绪的情感分析API 。这有可能是因为市面上的情感分析引擎大多依赖于LIWC(Linguistic Inquiry and Word Count)等较为成熟的大型开源情感词库,通过抽取特征或规则进行文本属性识别,因此对词库的质量依赖度很高,且受到应用场景和语言的极大限制。

Kismet的初创团队成员袁晋告诉36氪,基于自主研发的深度学习算法(深度情感记忆神经网络模型结合半监督式机器学习算法,已申请专利),Kismet可以抓取互联网上消费者对产品的评论文本,自动标注学习。这种算法使引擎能够不限语境和语言地识别6种正面情绪、6种负面情绪和6种中立情绪,以及按照客户的需求挖掘其他特殊情绪。经测试,情绪洞察的准确度一般在85%左右,在情感浓度较低的场景(如新闻)会略低一些。

专攻中文文本情感解析,语忆科技想帮企业读懂消费者“心声”

Kismet(最上)和市面上两个开源API对同一段中文文本的情感分析对比

基于文本的情感分析,是一个非常细分的市场——如果仅作为大数据服务公司的上游,市场总体规模在千万至亿级(其服务的公司总营收为十亿级)。作为赛道上的领跑者,Kismet目前已经与三所高校、两家大数据服务公司和一家高端酒店开展合作,并计划在今年6月上线数据可视化SaaS平台服务、以发展大数据服务公司之外的B端企业客户。在此之外,Kismet希望通过抓取海量非结构化数据,实时洞察消费者情绪状态、进行精准的广告投放,并追踪用户的情感变化、评估广告投放效果。这项精准营销服务的商业价值更高,预计明年上线。

在提供咨询服务之外,Kismet也可以作为情感解析技术被集成到企业产品中——随着智能硬件和服务机器人的发展和普及,Kismet作为技术成熟的文本情绪识别引擎,可以被作为模块集成,让智能机器对直接输入或语音转化的文本进行情感分析。这种情感认知能力,赋能于服务机器人、使之可以根据人的情感做出情感上的反馈,无论是对商用场景中的客服、礼宾、送餐机器人,还是个人/家用场景中的陪伴、教育、娱乐机器人,都是至关重要的。

机器识别人类情感的核心,是通过捕捉各类情感线索并加以分析 。作为情感认知模块,Kismet的竞争对手是使用非文本线索进行情感认知的解决方案提供商。非文本形式的情感线索,主要包括面部表情、声学特征和体征数据。在数字影像中捕捉到人的面部表情,从而分析解读情绪与意图的图像识别,是已经相当成熟的技术,被广泛地用于日用消费品的视频广告分析和优化、驾驶员走神及困倦状态的监测和干预等。去年被苹果收购的Emotient、被GAIA收购的Sension还有完成了1400万美元D轮融资的Affectiva等公司开发的都是图像识别。使用声音样本中的声学特征(如音量大小、音调高低、说话速度、语气变化等)来识别说话者的真实情绪的语音识别,和收集用户体验内容/服务时的体征特性(如心率、皮电等)的体征识别,目前主要应用于多模态拟合的情感识别,技术较成熟的公司有竹间智能、EmoKit等。这些基于不同参数(动作表情编码、语音数据、体征数据、非结构化文本)认知人类情感的技术,其实很像基于不同工作原理的传感器:它们各自受限于某些场景中的应用,因此拥有功能上的互补;比起单一选择,融合使用或许才是(成本允许下的)最佳方案。

专攻中文文本情感解析,语忆科技想帮企业读懂消费者“心声”

给你个表情,自己体会。

Kismet的技术团队来自Oracle、SAP、中兴、滴滴和特斯拉,市场团队来自华为,运营和财务总监来自毕马威。近期开始寻求融资用于团队扩建,融资额在350万到500万之间。

原文  http://36kr.com/p/5063529.html
正文到此结束
Loading...