滚动新闻 | RSS订阅 | 网站地图 |
你好,游客 登录 注册 搜索

AI可以识别图像,但它能理解标题吗?

发布时间:2018-09-11 15:48:23  来源:IT之家   采编:黄静  背景:

  2012年,人工智能研究人员发现,通过向一个名为ImageNet的数据库提供数以百万计的标签图像,计算机识别图像的能力会有很大的提高。这使得计算机视觉进入了一个激动人心的阶段,因为很明显,使用ImageNet训练的模型可以帮助解决各种图像识别问题。六年后,这种进步为自动驾驶汽车在城市街道上导航铺平了道路,并且使得Facebook用户可以在照片中对人物进行智能标记。

  然而,在人工智能研究的其他领域,比如理解语言方面,类似的模型则被证明是难以实现的。但是,来自fast.ai、OpenAI和艾伦研究所(Allen Institute)的最新研究表明,这是一个潜在的突破点,有更强大的语言模型可以帮助研究人员解决一系列尚未解决的问题。其中一种新模型背后的研发人员塞巴斯蒂安·鲁德(Sebastian Ruder)称其为该领域的“ImageNet时刻”。

  这些改进可能是戏剧性的。到目前为止,被最广泛测试的语言模型是ELMo(Embeddings from Language Models)。今年春天,当艾伦研究所发布ELMo的时候,以往的各种挑战迅速被颠覆了,比如在阅读理解方面,人工智能回答了关于一段文章的SAT式的问题并进行了情绪性分析。在一个进步往往是渐进的领域,ELMo的加入使得结果的正确率提高了25%。今年6月,这项进步在一次大型会议上获得了最佳论文奖。

  加州大学伯克利分校的计算机科学教授丹·克莱因(Dan Klein)是早期采用者之一。他和一名学生正在研究一个“选区解析器”,这是一种基本的工具,它涉及到对句子的语法结构进行映射。ELMo的加入使得克莱因突然拥有了世界上最好的系统,最精确的同时拥有惊人的宽限度。他说:“如果你几年前问我,是否有可能性达到这么高的水平,我并不能确定。”

  像ELMo这样的模型,解决了一个使用语言的语言学家的核心问题:缺乏标签的数据。为了训练一个神经网络能够做决定,许多语言问题都需要人工来精心标记数据。但是,制作这些数据需要时间和金钱,甚至很多信息也无法捕捉到我们说话和写作中不可预测的方式。对于除英语以外的语言,研究人员通常没有足够的标记数据来完成基本的任务。

  “我们永远无法获得足够的标签数据,”艾伦研究所ELMo项目团队领导者的研究人员马修·彼得斯(Matthew Peters)说。“我们真的需要开发出一种模型,它可以处理杂乱的、没有标签的数据,并且从中学习到尽可能多的信息。”

  幸运的是,多亏了互联网,研究人员得以从维基百科、书籍和社交媒体等来源获得了大量的杂乱数据。我们的策略是将这些词输入到一个神经网络中,并允许它自己识别模式,即所谓的“无监督”方法。我们希望这些模式能够捕捉到语言的一些基本方面——一种单词的含义,或者是语法的基本轮廓。与使用ImageNet训练的模型一样,这样的语言模型可以被精确地调整以掌握更具体的任务——比如总结一篇科学文章,将电子邮件归类为垃圾邮件,甚至为一个简短的故事生成一个令人满意的结尾。

  这种直觉基础并不新鲜。近年来,研究人员利用一种叫做“文字嵌入(word embeddings)”的技术来深入研究无标签的数据,这一技术可以根据它们在大量文本中出现的方式来映射单词之间的关系。新模式的目标定位到更深层,捕捉从文字到更高层次的语言概念的信息。鲁德已经写过关于这些更深层次的模型对各种语言问题而言的巨大潜力,希望新模型能成为简单的“单词嵌入”的替代品。

  例如,ELMo通过整合更多的上下文,以句子的规模来看待语言,而不是词汇,从而改进了单词的嵌入。这种额外的上下文使模型能够很好地解析“May”作为“五月”和动词之间的区别,也意味着它学习了语法。ELMo通过理解单词的子单元,如前缀和后缀,来获得额外的提升。像彼得斯的团队所做的那样,为神经网络提供十亿个单词,而这种方法是非常有效的。

  目前还不清楚的是,在分析所有这些词的过程中,这个模型到底学到了什么。由于深度神经网络的工作方式不透明,所以要回答这个问题十分棘手。研究人员仍然对图像识别系统工作如此出色的原因有一个模糊的理解。在10月份的一次会议上,彼得斯采用了一种经验主义的方法,在不同的软件设计和不同的语言任务中试验了ELMo。彼得斯说:“我们发现这些模型学习了语言的基本属性。”但他警告说,其他研究人员将需要测试ELMo,以确定该模型在不同任务中的稳健程度,以及它可能包含的隐藏意外情况。

  一种风险是:用于训练它们的数据出现了编码偏差,因而医生被贴上男性的标签,而护士则是女性,就像之前的文字嵌入一样。克莱因说,虽然通过点击ELMo和其他模型产生的最初结果令人兴奋,但目前还不清楚这些结果可以被推进到什么程度,也许是通过使用更多的数据来训练模型,或者增加一些限制,迫使神经网络更有效地学习。从长远来看,的要让人工智能像我们这样流畅地阅读和交谈,可能需要一种全新的方法。


本文来源:IT之家

本文评论
人工智能还能怎么玩?谷歌反手就是一个红狮子雕塑
这两天,伦敦设计展开始了,与往年不同,今年来了一个不速之客。
日期:09-19
用AI创造AI R2.ai领跑人工智能开发与应用
2018年9月,历经三年的潜心设计、研发与检验,总部位于硅谷并在上海与杭州设有分支机构的人工智能公司R2.ai, Inc.正式发布其系列AI解决方案的第一款产品 ...
日期:09-18
身份识别技术,只是智慧城市的第一步
(原标题:剖开身份识别 这只是智慧城市的第一步)
日期:09-18
2299元 小米生态链推情感机器人 高度还原人类动作
目前,市场上教育陪伴型的机器人众多,但是却没有一家机器人在应用上、心理上、功能上、以及表现力上,具备机器人该有的表现。归根结底,是因为目前市场...
日期:09-17
AI检测生物钟:未来可对自己生物钟了如指掌
(原标题:AI检测生物钟 精准医疗或成最大“受惠者”)
日期:09-17
用机器人当服务员的酒店,你想去住吗?
随着科技的发展
  越来越多的职业正在被智能替代
  举几个栗子
  你现在还坐过人工售票的公交车吗?
  去肯德基麦当劳还要排...
日期:09-14
AI可以识别图像,但它能理解标题吗?
2012年,人工智能研究人员发现,通过向一个名为ImageNet的数据库提供数以百万计的标签图像,计算机识别图像的能力会有很大的提高。这使得计算机视觉进入...
日期:09-11
AI智能互联的未来世界还远吗?
(原标题:都用上AI智能手机了,还觉得AI时代远吗?)
日期:09-11
制造人工智能需要“人工心灵”还是“人工大脑”
(原标题:人工智能究竟是要造就心灵还是造就大脑,这分歧直到如今仍然存在)
日期:09-11
人工智能将作为人类智慧的一部分?
人工智能可以作为人类智慧的一部分,是为人类服务的。因此人工智能的研究也就要力求在某一方面超越人。但是,如果人工智能的研制在一个方面超越了人类,...
日期:09-10
「Amadeus Code」用 AI 为音乐创作者提供创作灵感
每个人或多或少都会经历过以下这一场景:走在路上,脑海中涌现出一段旋律,顺势你就把它哼了出来 。而现在,有一款 App 可以帮你把音乐灵感谱成一首完整...
日期:09-08
偏见只存在于人类世界?NO!机器人也有偏见
(原标题:原来人工智能机器人和人类一样可以产生偏见)
日期:09-08
不要害怕 即使人工智能时代到来 也不会是一个黯淡的世界
人工智能(AI)不会消除对人类工作者的需求,并创造一个由邪恶机器运行的反乌托邦环境。相反,该技术将有助于人类思维多样化,并加强人与自动化系统之间的...
日期:09-08
国双勇夺“中国法研杯”司法人工智能挑战赛冠军
日前,为了促进法律智能相关技术的发展,在最高人民法院信息中心、共青团中央青年发展部的指导下,中国司法大数据研究院、中国中文信息学会、中电科系统...
日期:09-07
电话推销中,你分辨得出来是人工还是机器人吗?
在这个信息爆炸的时代,我们所有的信息都可以通过数据来体现。任何东西都可以被量化,客观的去分析,从而做出自认为是正确的判断。
日期:09-07
在未来,人工智能或许会对你身体姿势的秘密了如指掌
相信很多人都有这样一个经历,走在路上前面有个人看背影挺熟悉,于是赶忙跑过去拍人家肩膀。结果一回头,大写的尴尬。
日期:09-07
关于人工智能您知道多少?
人工智能是一个舶来语,英文为Artificial Intelligence,缩写为AI。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一...
日期:09-07
第一批脱发的90后,离被人工智能解救还有多远?
据说现在的90后,要么在脱发,要么快要开始脱发。2017年9月,阿里健康联合阿里数据,对外发布了《拯救脱发趣味白皮书》。数据显示,在购买植发护发的消费...
日期:09-06
人工智能时代来临后我们或许再也不用在意售货员的眼神了
近些年随着科技的快速发展,人工智能的概念逐渐清晰。特别是作为OTT行业的重要组成部分,格外被行业所关注。那么人工智能为何必须发展?
日期:09-05
从摩尔定律到人工智能,指数定律释放人类潜能
你学过指数吗?恐怕没几个人会对这个问题说 “No”。那么,你对指数式发展有什么样的认识?这个问题回答起来也许就没那么容易了。然而,指数式发...
日期:09-05