滚动新闻 | RSS订阅 | 网站地图 |
你好,游客 登录 注册 搜索

AI可以识别图像,但它能理解标题吗?

发布时间:2018-09-11 15:48:23  来源:IT之家   采编:黄静  背景:

  2012年,人工智能研究人员发现,通过向一个名为ImageNet的数据库提供数以百万计的标签图像,计算机识别图像的能力会有很大的提高。这使得计算机视觉进入了一个激动人心的阶段,因为很明显,使用ImageNet训练的模型可以帮助解决各种图像识别问题。六年后,这种进步为自动驾驶汽车在城市街道上导航铺平了道路,并且使得Facebook用户可以在照片中对人物进行智能标记。

  然而,在人工智能研究的其他领域,比如理解语言方面,类似的模型则被证明是难以实现的。但是,来自fast.ai、OpenAI和艾伦研究所(Allen Institute)的最新研究表明,这是一个潜在的突破点,有更强大的语言模型可以帮助研究人员解决一系列尚未解决的问题。其中一种新模型背后的研发人员塞巴斯蒂安·鲁德(Sebastian Ruder)称其为该领域的“ImageNet时刻”。

  这些改进可能是戏剧性的。到目前为止,被最广泛测试的语言模型是ELMo(Embeddings from Language Models)。今年春天,当艾伦研究所发布ELMo的时候,以往的各种挑战迅速被颠覆了,比如在阅读理解方面,人工智能回答了关于一段文章的SAT式的问题并进行了情绪性分析。在一个进步往往是渐进的领域,ELMo的加入使得结果的正确率提高了25%。今年6月,这项进步在一次大型会议上获得了最佳论文奖。

  加州大学伯克利分校的计算机科学教授丹·克莱因(Dan Klein)是早期采用者之一。他和一名学生正在研究一个“选区解析器”,这是一种基本的工具,它涉及到对句子的语法结构进行映射。ELMo的加入使得克莱因突然拥有了世界上最好的系统,最精确的同时拥有惊人的宽限度。他说:“如果你几年前问我,是否有可能性达到这么高的水平,我并不能确定。”

  像ELMo这样的模型,解决了一个使用语言的语言学家的核心问题:缺乏标签的数据。为了训练一个神经网络能够做决定,许多语言问题都需要人工来精心标记数据。但是,制作这些数据需要时间和金钱,甚至很多信息也无法捕捉到我们说话和写作中不可预测的方式。对于除英语以外的语言,研究人员通常没有足够的标记数据来完成基本的任务。

  “我们永远无法获得足够的标签数据,”艾伦研究所ELMo项目团队领导者的研究人员马修·彼得斯(Matthew Peters)说。“我们真的需要开发出一种模型,它可以处理杂乱的、没有标签的数据,并且从中学习到尽可能多的信息。”

  幸运的是,多亏了互联网,研究人员得以从维基百科、书籍和社交媒体等来源获得了大量的杂乱数据。我们的策略是将这些词输入到一个神经网络中,并允许它自己识别模式,即所谓的“无监督”方法。我们希望这些模式能够捕捉到语言的一些基本方面——一种单词的含义,或者是语法的基本轮廓。与使用ImageNet训练的模型一样,这样的语言模型可以被精确地调整以掌握更具体的任务——比如总结一篇科学文章,将电子邮件归类为垃圾邮件,甚至为一个简短的故事生成一个令人满意的结尾。

  这种直觉基础并不新鲜。近年来,研究人员利用一种叫做“文字嵌入(word embeddings)”的技术来深入研究无标签的数据,这一技术可以根据它们在大量文本中出现的方式来映射单词之间的关系。新模式的目标定位到更深层,捕捉从文字到更高层次的语言概念的信息。鲁德已经写过关于这些更深层次的模型对各种语言问题而言的巨大潜力,希望新模型能成为简单的“单词嵌入”的替代品。

  例如,ELMo通过整合更多的上下文,以句子的规模来看待语言,而不是词汇,从而改进了单词的嵌入。这种额外的上下文使模型能够很好地解析“May”作为“五月”和动词之间的区别,也意味着它学习了语法。ELMo通过理解单词的子单元,如前缀和后缀,来获得额外的提升。像彼得斯的团队所做的那样,为神经网络提供十亿个单词,而这种方法是非常有效的。

  目前还不清楚的是,在分析所有这些词的过程中,这个模型到底学到了什么。由于深度神经网络的工作方式不透明,所以要回答这个问题十分棘手。研究人员仍然对图像识别系统工作如此出色的原因有一个模糊的理解。在10月份的一次会议上,彼得斯采用了一种经验主义的方法,在不同的软件设计和不同的语言任务中试验了ELMo。彼得斯说:“我们发现这些模型学习了语言的基本属性。”但他警告说,其他研究人员将需要测试ELMo,以确定该模型在不同任务中的稳健程度,以及它可能包含的隐藏意外情况。

  一种风险是:用于训练它们的数据出现了编码偏差,因而医生被贴上男性的标签,而护士则是女性,就像之前的文字嵌入一样。克莱因说,虽然通过点击ELMo和其他模型产生的最初结果令人兴奋,但目前还不清楚这些结果可以被推进到什么程度,也许是通过使用更多的数据来训练模型,或者增加一些限制,迫使神经网络更有效地学习。从长远来看,的要让人工智能像我们这样流畅地阅读和交谈,可能需要一种全新的方法。


本文来源:IT之家

本文评论
军事体育NBA财经文化科技游戏数码美图健康时尚搞笑GIF图电台旅游房产家居金融 剁手指南 | 双十一值得买的数码产品都在这里了
又到了一年双十一,你的钱包准备好了吗?极客之选为大家准备了这份推荐购买清单。
日期:11-11
智能穿戴新技术  带来“心”健康!
你的心脏好还好吗?
  在高速运转的工作和生活中,心脏负荷越来越大,人们总在忙着满足外界的各种需求,却经常忘记停下脚步,关注自己那拳头大小的...
日期:10-31
2018世界VR产业大会:未来VR全景才是行业趋势
马云说:在你要创业之前,你必须要记住一点:你想成为什么样的人,你将会过着什么样的生活,决定权在于你自己,你没什么可抱怨的,也没什么值得赞颂的。...
日期:10-20
特斯拉AI芯片性能揭晓 最高提升20倍!
特斯拉CEO马斯克近日在推特上表示,六个月后,一种改进自动驾驶功能的新型AI芯片将用于特斯拉所有的电动汽车之中,该芯片能够大幅提升特斯拉汽车的自动驾...
日期:10-18
继机器人Atlas后机器狗Spot来袭:舞姿妖娆
(原标题:波士顿动力叒来秀:机器狗玩“抖音”,步伐风骚,姿态妖娆)
日期:10-17
机器人能统治世界吗?人工智能非万能的神
(原标题:机器人能统治世界吗?社会需有情感的人类,人工智能恐怕无法胜任)
日期:10-09
AI 画的画要上佳士得拍卖了,起拍价1万欧元!
7月,雾蒙蒙的伦敦,距泰晤士河不远处的一座近200年历史的古建筑里,人头攒动。
日期:09-30
AI翻译“很好很强大”  但替代人工远远不够
(原标题:AI翻译替代人工,难!同传译员:饭碗稳得很)
日期:09-30
在未来 高级机器人有可能涌现出自我意识吗?
(原标题:高智能机器人是否有思维?)
  网上有一个段子,说在苏联时期,曾经有机器人选手与人类进行博弈。但不知怎的,当时的机器人在下国际象棋...
日期:09-30
这个自动复原机器人毁了我玩魔方最后的乐趣
如果要找一个和极客气质最搭配的玩具,那最佳选择恐怕非魔方莫属。
日期:09-29
机器人皮:披上它,能让你身边随便什么东西秒变机器人
(原标题:玩偶秒变机器人:机器人皮了解一下?)
 还记得我们曾经介绍过的智能标签吗?在智能家居还未彻底颠覆人们生活的过渡阶段,如何既不置换既有...
日期:09-26
NTT将发售“阿童木”家用机器人:能陪聊、支持人脸识别
据NTT DoCoMo官网消息,以《铁臂阿童木》主角为原型的家用机器人“阿童木(ATOM)”,将于10月1日在日本全国的家电量贩店等发售。
日期:09-25
音乐家:谁能解我情衷?AI说我能
人的耳朵能够轻松分辨出歌曲的各种情绪,未来,机器也能如此。为了让机器人也能听懂人类创作的歌曲,法国在线音乐网站Deezer的研究人员开发了一种人工智...
日期:09-25
AI时代    我们会不会变成“透明人”?
(原标题:AI时代,人们还有隐私可以保护吗?)
  当AI越来越懂人类时,大家担心,自己会不会变成“透明人”?AI能为人类创建一个安全可信...
日期:09-25
传译员揭发科大讯飞AI同传翻译造假:官方回应
众所周知,在不同语言的翻译中,同声传译是最难的,机器很难做到。如今随着AI的兴起,人工智能真的能做到的同声传译了吗?
日期:09-21
AI未来将让飞机像鸟一样用气流飞行,节省能源
9月21日消息,来自国外媒体The Verge的报道称,科学家的新研究成果使用机器学习来教无人机利用热量在天空中飞行。
日期:09-21
阿里巴巴机器人亮相,自动经营无人水吧科技感十足!
相信有关注人工智能产品的用户一定对“天猫精灵”这四个字不陌生,天猫精灵是阿里巴巴人工智能实验室在2017年发布的AI智能产品,随后发布的天...
日期:09-21
机器人立功:考古学家发现3000年前地下隧道
根据外媒Archaeology News 的报道,在秘鲁的查文德万塔尔遗址,考古学家利用机器人深入狭长通道,发现了拥有 3000 年历史的地下隧道,考古学家表示这是近...
日期:09-20
云栖大会:阿里巴巴发布天猫精灵太空蛋/太空梭
9月20日消息 在2018杭州云栖大会上,阿里巴巴天猫精灵发布了太空蛋和太空梭两款产品,用于未来酒店和医院等设施。
日期:09-20
人工智能还能怎么玩?谷歌反手就是一个红狮子雕塑
这两天,伦敦设计展开始了,与往年不同,今年来了一个不速之客。
日期:09-19