图灵测试Out啦!首个为AI设置的“IQ测试”:玩游戏、解魔方、考SAT全面评估

  • 时间:
  • 浏览:0
  • 来源:幸运飞艇_幸运飞艇官方

大数据文摘出品

作者:牛婉杨

意味着着易于理解又简单可控,这个 测试法律措施自诞生起,一个劲被看作测试人工智能否是智能的重要法律措施。否则随着AI系统的快速发展,其复杂正在飞快上升,而哪几种年,各种新的人工智能“智能”测试法律措施正层出不穷的涌现。

于是Holder和他的团队正在为AI系统创建首个“IQ测试”,以了解它们学习和适应新环境的能力,测试根据AI系统所能除理难题图片的难度对其进行评分,评分还将考虑系统的准确性、耗时以及所需的数据量。该研究的主要内容之一却说 创建对难题图片难度进行排名的法律措施。

相关报道:https://news.wsu.edu/2019/12/12/iq-test-artificial-intelligence-systems/

自从计算机问世,.我歌词 对于机器便结束了了永无止境的探索,怎么能否让机器更聪明。

现在的人工智能技术,着着实一点特定的领域以及实际应用上具备超人的能力了,否则它还需要极少量的数据来进行训练。这个 人工智能也被称为面向特定任务的“窄人工智能”,类式人脸检测、语音识别。

未来希望不能达到“通用人工智能”,即具备人一样的智能,不能不断的自主学习,在更广的范围内提升整个机器的智能。

Github教程:https://github.com/Christopher-P/AIQ#tutorial

一名与Holder同時 做暑期研究的本科生帮助他设计了一有一一一四个评估环境,用于测试AI系统需要完成的任务,比如玩视频游戏、解答SAT考试的相关难题图片和解魔方。

Holder和他的团队建立曾经一有一一一四个测试系统,旨在测试和改进哪几种更具通用性的系统,比如都需要完成一点日常任务的机器人助手。这是一有一一一四个很好的研究方向,但实际上,要想实现“通用人工智能”,还有很长一段路要走。

Holder教授一定会第一有一一一四个想突破图灵测试、为AI测智商的人。去年,DeepMind就动过为AI测智商的念头~

没有怎么能判断机器的“聪明程度”呢?最经典的法律措施当然是“图灵测试”。

先来看下面这张图,有没有熟悉的感觉!这个 图形推理题,考过公务员的同学一定一定会陌生~它不能用来考察.我歌词 的观察与逻辑推理能力,也是IQ测试题的这个 。

近期,华盛顿州立大学电子工程与计算机学好院的教授Larry Holder表示,“已经 ,测量AI系统智能否是的研究大多是理论性的,没有在未知的新环境中测试AI系统的实际性能,也没有考虑到任务的复杂。

最后不得不说,在人工智能不断发展的同時 ,.我歌词 需要要确保是“可信的人工智能”,意味着着要把人工智能进行大规模应用一句话,一定要保证它是可信的。

着实实验结果意味着着是一有一一一四个“大杂烩”,但研究人员还没有放弃,.我歌词 计划改进泛化策略,并探索在未来的模型中使用“特征富足,但普遍适用”的归纳偏差。

在测试中,大多数模型都表现良好。研究人员发现,模型准确性与推断任务底层抽象概念的能力密切相关。“一点模型学着了除理复杂的视觉推理难题图片,”该团队写道,“为此,.我歌词 需要从原始像素输入中引入并检测抽象概念的指在,并将哪几种原则应用于从未观察到的刺激。“

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

最终的研究结果表明,想得出关于泛化的普遍结论意味着着是无益的:研究人员测试的神经网络在一点泛化方案中表现良好,而在一点方面表现很差。该团队在一篇博客文章中写道,“它们的成功是由一系列因素决定的,包括所用模型的架构以及该模型否是经过培训等等。”

研究人员将抽象推理定义为在概念层次上检测模型和除理难题图片的能力,否则.我歌词 构建了一有一一一四个涉及一系列抽象因素的题目生成器,以此来测试和训练机器学习。

原文发布时间:2019-01-02

本文作者:牛婉杨

本文来自阿里云云栖号商务商务合作伙伴“大数据文摘”,了解相关信息都需要关注“大数据文摘”

研究人员主要关注的是,.我歌词 测试的AI系统都需要很好地将它们从一有一一一四个任务中学到的知识应用到曾经全新的,未知的任务上。类式,你意味着着想在下象棋已经 先学习跳棋,意味着着都需要很容易地把跳棋的知识转移到象棋。

美国哥伦比亚大学创意机器实验室总监、工程学教授Hod Lipson与团队研究出一款都需要自我学习的机器人。它不能一有一一一四个“手臂”,不像.我歌词 拥有眼睛都需要看过当时人,研究人员也没有告诉它它是哪几种,却说 让它当时人去感受,在自我需要象中学习。

AIQ网站地址:https://portal.eecs.wsu.edu/aiq/

去年,DeepMind发表了一篇论文,要我用哪几种推理题来测试神经网络的抽象推理能力。

可根据AI系统学习和玩新的视频游戏(类式Vizdoom)的能力来评估AI系统

要想测试,需要先创建一有一一一四个AIQ帐户,否则在AIQ的后端提交分数。AIQ是一有一一一四个开源测试框架,用于评估AI系统的“智商”。有关运行AIQ框架的完整教程及代码一定会Github上,感兴趣的同学都需要上手测一下~

创造不能在新环境中自主学习和行动的智能机器,仍然是人工智能研究者们追求的方向,也是目前所面临的挑战。

2015年11月,《Science》杂志封面刊登了一篇重磅研究:人工智能终于能像人类一样学习,并通过了图灵测试。这个 系统不能飞快学着写陌生的文字,同時 还能识别出非本质特征(也却说 哪几种因书写造成的轻微变异),通过了图灵测试,这也是人工智能领域的一大进步。

论文链接:http://proceedings.mlr.press/v100/santoro18a/santoro18a.pdf

早在19100年,图灵发表了一篇划时代的论文,他表示机器也都需要拥有智能,像人一样会“思考”,否则提出了图灵测试:测试者与被测试者(一有一2当时人和一台机器)隔开的情況下,通过一点装置(如键盘)向被测试者随意提问。进行多次测试后,意味着着机器让平均每个参与者做出超过100%的误判,没有这台机器就通过了测试,并被认为具没有人类智能。

没有现在,研究人员们正在努力把“窄人工智能”变成“宽人工智能”,所谓宽是哪几种?在学习的基础去掉 入一点推理的能力,曾经就都需要支持多任务、多领域、多模态的学习。

Larry Holder

对于.我歌词 来说,考试前.我歌词 往往一定会极少量“刷题”,越多意味着着受试者准备越多,曾经的测试也意味着着无效,意味着着.我歌词 学到了特定于测试的启发式法律措施,从而缩短了对推理的需求。研究人员也表示, “这对神经网络而言意味着着更严重,意味着着它们具有惊人的记忆能力。”

曾经简单的任务完越多需要通过编程让它达到,否则这个 机器人在它当时人的模拟中学着了这项任务,这是人类迈向建造具备自我学习能力的机器人的重要一步。

研究人员希望利用这个 框架,为人工智能评估提供一有一一一四个开放的度量标准。另外,.我歌词 还将利用这个 框架来确定人工智能领域的发展情況,以及在实现通用智能方面否是取得了进展。

一结束了了它像婴儿般疯狂的甩着手臂,在感知当时人的特征,感知这个 世界。过了合适一天,它就都需要结束了了做一点简单的任务了。

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

Holder表示,“.我歌词 专注于测试和改进哪几种更具通用性的系统,比如都需要帮助你完成一点日常任务的机器人助手。”

Holder目前在维护一有一一一四个AI系统都需要进行“IQ测试”和排行的网站。他希望.我歌词 都都需要使用它来测试当时人的AI系统,同時 在这个 过程中为研究人员提供更多的数据。