您当前的位置:科技中国网要闻正文

为何NLP领域难以出现独角兽

放大字体  缩小字体 2019-08-20 09:23:53  阅读:6780 作者:责任编辑NO。魏云龙0298

比尔·盖茨曾说过,「言语了解是人工智能皇冠上的明珠」。自然言语处理的前进将会推进人工智能全体开展。NLP 的前史简直跟核算机和人工智能的前史相同长。自核算机诞生,就开端有了对人工智能的研讨,而人工智能范畴最早的研讨便是机器翻译以及自然言语了解。

跟着大数据和技能设备的完善,人工智能技能在近年来迎来了井喷式的开展。在工业方面,不少专心于核算机视觉的公司也获得了长足开展。其间比较具有代表性的是估值现已超越 20 亿美元的商汤科技,在阅历了数轮大额融资之后,其隐约有从独角兽变成巨子的趋势。

不过,人工智能另一个相关范畴自然言语处理好像没有到达这种高度。在技能方面,这一范畴的技能准确率远远没有到达核算机视觉和语音辨认的水平,技能产品也由于较高的错误率,短少实践价值。那么 NLP 技能到底有哪些难点呢?

什么是 NLP?

在人工智能呈现之前,核算机只能处理结构化的数据,就比方咱们平常用的表格里的数据,可是网络中大部分的数据都对错结构化的,比方咱们看到的文章、图片、视频等等。在这些数据中,文本数据又往往是最多的,为了能够剖析和运用这些文本信息,咱们就需求运用 NLP 技能,让机器了解这些文本信息,并加以运用。

人类能够经过言语来交流,而为了让核算机之间相互交流,人们让一切核算机都恪守一些规矩,核算机的这些规矩便是核算机之间的言语。自然言语处理(NLP)便是在机器言语和人类言语之间交流的桥梁,以完成人机交流的意图。

NLP 的两个部分:NLU 和 NLG

NLU 现在运用的范畴首要会集在机器翻译、机器客服、智能音箱等范畴,但由于需求许多的数据练习和 NLU 自身存在的一些言语语义上的难点,其实机器还不对错常智能。

自然言语生成(NLG)是 NLP 的重要组成部分,NLU 担任了解内容,NLG 担任生成内容。他的首要意图是下降人类和机器之间的交流距离,将非言语格局的数据转换成人类能够了解的言语格局。

自然言语生成 – NLG 有 2 种方法:

text – to – text:文本到言语的生成

data – to – text :数据到言语的生成

NLP 的难点

关于机器来说,难点首要分为 5 类问题:

言语的多样性,咱们日常所用的言语是没有规则的,不同的组合能够表达出许多的意义。

言语的歧义性,假如不联络上下文,短少环境的束缚,言语有很大的歧义性

言语是一个敞开调集,咱们能够恣意的发明创造一些新的表达方法。

言语需求常识依靠,需求联络到实践常识。

言语的上下文

运用场景杂乱,很难呈现“独角兽”

总的来说,NLP 技能范畴之所以没有呈现如核算机视觉范畴那些独角兽公司,是由于自然言语处理的技能难度太大,和运用场景太杂乱。一个公司的建立开展都是由需求驱动的,自然言语运用首要是机器翻译,尽管机器翻译的需求长期存在,但机器翻译的水平一向未获得突破性的开展,即便到今日,机器也很难翻译有布景的杂乱语句。

别的,自然言语处理的运用太依靠于UI了。图像辨认根本不需求 UI,直接在体系内部集成一些技能就行。一些公司做翻译软件,假如UI做得不可,用户体会不可,人们就不会乐意运用。

技能工业化最重要的是商业形式,也便是怎样让技能赚钱。图像辨认公司的赚钱形式现已建立了,但翻译付费就难多了。所以自然言语是从研讨到技能到落地到商业化,面对一系列的应战。现在的现状是,自然言语处理技能更多的是作为公司内部技能,比方内部的商业情报或人机接口功用。

NLP 技能开展,未来可期

从本年的 ACL 大会能够看出 NLP 技能的火爆。会议共收到了 2900 余篇提交的论文,投稿规划相较于 2018 年增长了 75%!自然言语处理范畴实在是炙手可热,学术界和工业界的热心都创下了前史新高。

从商业层面来讲也出现出了微软小冰、小米小爱等比较老练的机器人产品,信任在未来的不久 NLP 技能必定会给咱们带来更多的惊喜。

大咖现场共享 NLP 技能干货

王斌博士,是小米人工智能试验室主任,NLP 首席科学家。我国中文信息学会理事,核算言语学、信息检索、社会媒体处理、言语与常识核算等专委会委员及《中文信息学报》编委,我国核算机学会中文信息处理专业委员会委员。

参加小米之前,他在中科院核算所、信工所从事自然言语处理和信息检索相关的科研工作。在AICon 全球人工智能与机器学习大会现场,他将会带来 NLP 技能方面的相关讲演,各位感兴趣的小伙伴欢迎来现场听他共享。

AICon 全球人工智能与机器学习技能大会,将于 11 月 21-22 日在北京世界会议中心举办。颜水成、贾扬清、崔宝秋等 AI 技能大咖到时也会来现场,跟咱们聊一聊本年在 AI 商业化场景落地的大布景下,又出现出了哪些新技能。本次大会咱们设立了机器学习、核算机视觉、NLP、AI芯片、查找引荐、工业互联网、硅谷 AI 技能实践等 13+ 技能专场,细分到 AI 技能的各个范畴,为咱们全方位的展现 AI 技能在国内现在开展的现状。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!