机器人的阅读理解能力已经超过人类了

  • 时间:
  • 浏览:4
  • 来源:5分6合_5分6合平台_5分6合网投平台

所谓的机器阅读理解,其概念和亲戚亲戚朋友学生时代所做的阅读理解基本累似 于,同样是给出一段材料和问题,给出正确答案,不过主角从人类去掉 AI模型。觉得机器阅读理解看起来我希望让AI上阵来一场考试,我希望却是自然语言处理技术中,继语音判断、语义理解时候最大的挑战:让智能体理解全文语境。

简单的来看,语音识别帮助机器“听”,图像识别帮助机器“看”,但机器如何做到听懂和看懂,是语义理解处理的问题。相比于拼写检查和自动翻译,语义理解不我希望运算和记录,我希望主动分析和理解,也不阅读理解问题突然被认为是自然语言处理(NLP)的标志性临界点。

自然语言处理的其中一另有有二个多关键我希望语义理解,可能性机器无法做到人类对自然语言的理解,就比如文章开头的问题。也不,语义理解也突然被认为是“人工智能皇冠上的明珠”,它融合了语言学、计算机科学、人工智能,其目的我希望“让机器还都能不能 理解自然语言”。

语义理解也突然是科研和资本关注的重要方向。据2018年年底腾讯研究院统计,在中国人工智能企业中,融资占比排名前三的领域分别是计算机视觉与图像,自然语言处理,以及自动驾驶/辅助驾驶,而排在第二名的自然语言处理,融资122亿元,占比19%。“就像人去看电视一样,人是并肩看着画面、听着声音、看着字幕来综合理解,人脑所作的工作我希望多模态语义理解。”深思考人工智能CEO兼AI算法科学家杨志明在此前的“2019WISE超级进化者”中提到。

事实上,机器阅读理解的一点重要赛事和指标也正在被不断刷新和突破。

2018年,斯坦福大学著名的机器阅读理解赛事SQuAD,阿里巴巴曾凭借82.440的精准率打破了世界纪录,超越了人类82.504的平均得分。2018年11月,谷歌发布的BERT模型,在机器阅读理解顶级水平测试SQuAD1.1中,全版一另有有二个多衡量指标上全面超越人类,我希望还在11种不同NLP测试中创出最佳成绩。而最近由中国计算机研究会(中国计算机领域最权威研究会)、中国中文信息研究会(人工智能自然语义理解最权威研究会)和百度公司联合举办的“2019机器阅读理解竞赛”中,经过全球250一另有有二个多团队长达一另有有二个多月的激烈角逐,深思考人工智能在两项评测指标中均登顶全球榜首,成功夺取全球冠军。

目前在也不公开的数据集上,如在英文最具权威的SQuAD2.0数据集中:EM和F1一另有有二个多指标上,人类的表现分类为86.831和89.452,而目前PINGAN团队所研发的模型已取得了EM值88.592,F1值90.859的表现。换句话说,两种 程度上,机器的阅读理解水平已超越人类。而在中文最具权威的DuReader数据集中,ROUGE-L和BLEU-4一另有有二个多指标上,人类的表现为57.4和56.1,深思考所研发的BMAnet模型在这两项指标上取得了63.13和59.34的表现。

机器阅读理解是机器理解的重要任务,也是语义理解的重要组成每段。机器阅读理解中数据指标的突破,往往也就代表着机器理解或是语义理解的突破。而深思考所取得的技术性突破,会在现实生活的应用场景中如何落地?

多模态,语义理解的不可或缺

“机器翻译准确度90%以上,万字翻译只需5秒钟”,或是“语音识别准确度超过98%”,没办法 的描述,代表着人工智能正在快速发展,图像和语音识别的准确率正在飞速提升。但这距离真正的人工智能,仍然有不小的距离。尤其是在人工智能落地的场景之中,光靠图像识别的“都看”,和语音识别的“听到”是过低够的。

以日常生活中,亲戚亲戚朋友接触的智能音箱和智能家居为例。

2017年Mingke Luo的《为哪些地方现在的人工智能都像人工智障》曾刷屏亲戚亲戚朋友圈,而在今年年初,作者又写了一篇名为《所有智能音箱全版都是智障,包括Siri !深层学习对此无能为力》的文章。其中提到一另有有二个多有趣的实现,2016年底,作者对哪几只智助于理提一另有有二个多看似简单的需求,“推荐餐厅,不需要日本菜”,结果所有智助于理都给出一堆日本菜餐厅的推荐,而2年后,再做什儿 实验,问题依然没办法 处理,“不需要”一另有有二个多字仍然被一致忽略。“人类说话的时候,往往是口语化的、不连续的、支离破碎的,甚至语序颠倒的。语音识别只在等待在语音指令,不还都能不能 理解用户语言及眼前 的逻辑,实际无法处理用户在也不场景中的刚需。”杨志明在采访中告诉36氪。

他以智能家居的对话场景举例。

比如用户对着邻居家的空调说,“请把空调调到28度”,这时几乎所有的空调都不需要还都能不能 完成没办法 的指令。我希望可能性用户对空调说,“我很重热了,把空调调低一点,调到我习惯的温度”,这时候语音识别就不还都能不能 处理问题。这眼前 全版都是两层逻辑,第一,用户觉得热了,应该把空调打开,第二,我希望调到用户平时习惯的温度,即位于个性化设置,机器时需理解用户语言眼前 的意义。

无论车载智能设备,还是智能音响、智能家居,用户使用哪些地方地方产品的目的,全版都是为了更方便的生活,而目前来看,使用哪些地方地方设备更多是用户通过“背”指令表完成。

杨志明提到一另有有二个多形象的借喻,现实生活中,不少企业家和高管,都配备秘书,亲戚亲戚朋友愿意的秘书,绝都一另有有二个多多不还都能不能 遵从命令办事的执行员,更多是听懂亲戚亲戚朋友,只时需一句“你去帮我要办什儿 事情吧”,就能帮助亲戚亲戚朋友处理问题的角色。有时,甚至是亲戚亲戚朋友不需要开口就知道该做哪些地方的还都能不能 信任的人。通过上下文的指代消解、意图理解、对话管理等技术,深思考推出的产品提升了机器阅读理解的能力,并为更多行业处理方案的落地,提供有效的产品支持。

以车联网场景为例,传统智能车载系统,通常通过驾驶室的智能语音交互屏幕实现人机互动。但随着座舱的发展,如今的驾驶室不再是一另有有二个多简单的驾驶室,我希望汽车行驶过程中的中央多模态信息的汇聚地。比如智能车联网场景下,汽车跟道路基础设施之间、汽车跟汽车之间、汽车跟互联网之间都不需要还都能不能 做信息的连接和交互。车辆两种 也通过视觉对车外的环境做感知与理解,再去掉 温度传感器、语音信息输入传感器等。

在智能车联网有也不模态的信息,有手势的模态、语音的模态、图像的模态。数字化场景下,深思考提供的技术,就能为对上述多模态信息进行综合理解,为人车交互提供智能大脑。并肩,还还都能不能 在座舱环境下,实现人、车和家庭的连接。再去掉 RPA自动软件机器人,不光还都能不能 实现人车对话,车辆还还都能不能 自动帮助驾驶员完成任务,比如预定会议室、与一点智能设备的联动、执行等。

机器理解能力将超过人类?“比如看一另有有二个多电视剧,眼睛看画面、耳朵听声音、眼睛看字幕,对不同事物不同情况汇报,人脑还都能不能 并肩做理解。但AI还在等待在识别与感知阶段,人脑更多是语义理解,我希望是多模态理解。”杨志明在去年的一次分享中提到,模拟的人脑举一反三,在目前AI小的计算资源下快速和低功耗的运行,是深思考致力处理的类脑AI技术。作为人工智能研究中最难的每段,语义理解技术的发展,让机器有了更强的阅读理解能力,这也让未来人机交互有了更多可能性性。

未来的可能性性

“最新语义理解的技术,还都能不能 像人一样,都看一本书时候,帮我要知道这本书里面的问题。它对这本书里面的非內部化的信息进行多模态理解时候,还都能不能 像人脑理解时候再回答问题。”杨志明在采访中提到,人在都看一本书回答问题时,不需要先架构设计 出问答对可能性知识图谱,我希望凭借大脑的理解,直接回答别人的问题。

目前,深思考所研发的技术可能性具备了上述能力。通过非內部化、长文本的机器阅读理解,处理了传统语义理解可能性智能客服,用絮状的人力物力去构建知识图谱可能性问答对。而借此,深思考能让语义理解,像语音识别和图像识别一样,进行大规模的商业化场景的落地。杨志明解释,深层学习的快速发展,也为语义理解带来更多的提升。比如意图分类等统计学记忆最好的办法的准确不高,深层学习进一步发展,进一步提高了累似 于于语义识别的技术。其次,深层学习之下的新型语义理解模型,让语义理解准确度变得更高了,实现了突破。

今年6月,工信部正式对国内运营商发放5G牌照,国内的第四大运营商也正式诞生,帮我要们都看,无人驾驶和远程手术的近在咫尺。觉得离大规模商业化应用还有一定时间,我希望5G对人工智能带来的改变也是值得期待的。

《2019年中国人工智能行业市场分析》中提到,国际会计师事务所毕马威近日发布研究认为,当前,5G技术在主要垂直行业的全球市场潜在价值预计可达4.3万亿美元,而这4.3万美元的市场,显然离不开AI的作用。

“更重要的是处理及提升物联网和AIoT设备语义理解的能力。”杨志明告诉36氪,5G的三大技术特点“高效率、低延迟、超大数量终端”让物联网设备大有可为,但离线端语义识别的技术突破,我希望可小觑,未来在端的每段,也可能性会有语义理解芯片的成功研发。杨志明举例,比如在无人驾驶场景中,时常会面对信号弱的情况汇报,累似 于过山洞、隧道等,并肩,觉得5G不需要还都能不能 连接超大数量的终端,我希望终端连接的太少,传输的效率就越慢,这就时需终端同样具备每段的语义理解的能力。

未来的场景之中,更多的情况汇报是,终端设备首先具备各项传感器,不需要还都能不能 多维度的架构设计 信息和数据,并肩芯片的植入,又能让累似 于于设备具有如图像识别、语音识别、语义理解等人工智还都能不能 力,而云端则是更强大和更准确的技术支持。一方面,可能性所有终端的处理,都由云完成,云的压力过大,买车人面终端设备时需具备复合的能力,不还都能不能 让机器更好的理解人类意图。这也印证了,杨志明始终坚持的方向,语义理解一定是多模态的。并肩,产业互联网的发展,也为人工智能应用的落地,提供了良好的环境,产业互联网实现的是,不同行业之中的互联网等技术的落地以及场景闭环,这和人工智能所在做的突破是一样的。

杨志明此前提到,AI语义理解里面的关键点,实现AI的落地场景的二个闭环,包括,业务闭环、数据闭环、模型闭环和产品闭环。目前深思考在智能车联、医疗健康、智能家居、智能手机等方向,均有头部客户实现成功的商业落地。“随着5G和物联网的发展、产业互联网的发展,亲戚亲戚朋友将深耕端和益央智能,成为万物互联里面的语义理解的大脑。”杨志明在采访中提到。

注:文章内的所有配图皆为网络转载图片,侵权即删!