大发PK10投注平台-大发PK10娱乐平台_大发PK10下注平台

模仿人类逻辑,首个BERT模型AI通过初二科学考试

时间:2020-03-14 20:51:28 出处:大发PK10投注平台-大发PK10娱乐平台_大发PK10下注平台

还有一个多 叫华亚里士多德的人工智能并且 通过了美国八年级的科学测试,上周,这条新闻居于了美国多家新闻网站的首版。

美国八年级最少最少国内初二,初二小每本人 的科学测验有多难呢?

要回答三种哪些地方的间题,每本人 先来一块儿看两道美国八年级的科学测试多选题。

1、人体中可不能否 协同完成某一项具体机能的组织被称为:A.an organB.an organismC.a systemD.a cell

2、以下哪三种变化最有将会意味着某一区域的松鼠数量减少?A.捕食者的数量减少B.松鼠内部内部结构的竞争减少C.可获取的食物减少D.森林火灾数量的增加

很显然,这两道题分属两类不之类型。第一题属于知识点题,若果认真背过就能答得上来;第二道则属于逻辑推理题。

多数小每本人 将会更我不多 回答第二题三种逻辑推断的题目,但对于人工智能来说,情况汇报将会恰恰相反。

人工智能做八年级卷子,确定题正确率超90%

上周三,坐落于西雅图的著名实验室“艾伦人工智能研究所”全新发布了一款名为“亚里士多德(Aristo)“的人工智能系统,它正确地回答了超过90%的八年级的科学测验题,并在十二年级的考试中获得了400%以上的准确率。

这款可不能否 通过测试能力的人工智能表明,研究人员在几个月中便取得了巨大的进展,人工智能系统可不都要理解语言可不能否 模拟人类的决策逻辑。

Aristo的设定是只用来作答多项确定题。它参加了几场纽约考生的标准考试,只不过艾伦研究所去除了哪些地方地方中含图片和图表的题目,回答哪些地方地方哪些地方的间题都要额外的技能——将语言理解和计算机视觉逻辑相结合的能力。

其他测试哪些地方的间题只都要其他信息提取的能力,比如上文中的第一题,三种题目是人工智能擅长的。

然而科学测试全是 那种只靠记住规则就能完成的事情,它都要使用逻辑来建立联系。比如第二题,森林火灾数量的增加会直接意味着松鼠的死亡,或食物来源的减少使它们无法繁衍。人工智能都要理解或者的逻辑,可不能否 回答正确这道题目。

其人太好Aristo成功并且 ,AI将会挂过无数次科。

2016年,700多名计算机科学家参加了一场设有400,000美金(折合人民币约540万 元)的挑战赛,题目是“八年级科学测验”——不过答题人全是 哪些地方地方科学家,或者每本人 建立的人工智能系统。

结果出乎意料,考生全盘“挂科”,就连最心智心智心智心智心智成熟是什么期是什么的得话的人工智能系统都无法答对超400%的题目,其语言水平和逻辑水平远远赶不上八年级的学生。

学霸Aristo的背后是Bert

2016年,当AlphaGo击败人类职业围棋选手李世石后,每本人 认为人工智能的转折点来临。

然而,华盛顿大学前教授、现任艾伦人工智能研究所的技术总监的Oren Etzioni博士的兴奋之情加快下行速率 平息了。你爱不爱我,人工智能并还可不能否 可不能否 它看上去还可不能否 可不能否 先进。他提到了艾伦研究其他其他后 参加的那场比赛,还有一个多 八年级的科学测试就难住了人工智能系统。

艾伦研究所越快了 了 改良了并且 的工作,着手于打造Aristo,其下行速率 超出了包括Etzioni博士在内的其他专家的预期。

Aristo的应试能力来自于神经网络,近几年以来,世界顶尖的人工智能实验室,如Google,Facebook等企业的实验室都利用神经网络进行自然语言出理 (NLP),它可不都要通过分析人类的文章和书籍来习得语言的僵化 变化。

去年年底,谷歌AI团队发布了BERT模型,在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩:删剪还有一个多 衡量指标上全面超越人类,或者还在11种不同NLP测试中创出最佳成绩,包括将GLUE基准推至400.4%,MultiNLI准确度达到86.7%等。

BERT的全称是Bidirectional Encoder Representation from Transformers,即双向Transformer的Encoder,模型的主要创新点在于模型的预训练,用Masked LM和Next Sentence Prediction三种土办法分别捕捉得话的表述。

▲Bert模型架构

Etzioni博士加快下行速率 就意识到,可不都要在Bert基础之上建立Aristo系统,每本人 利用Bert模型对覆盖面极广的哪些地方的间题和答案数据进行训练。

Aristo根据题目的不之类型采用了八种类型的agent来回答哪些地方的间题——包括数据库中查找答案的agent、检查相关概念列表的agent、执行定性推理的agent等。

每个agent全是对多项确定答案产生正确否有有的概率,而Aristo会对不同的选项的概率进行加权以确定最将会的一项或多项,该模型通不多轮训练和校准进行优化。

之类,有还有一个多 哪些地方的间题是:当块体熔化时,铁块中的铁原子是如保受到影响的?A.铁原子增加质量。B.铁原子中含较少的能量。C.铁原子移动得更频繁。D.铁原子体积增加。

为了回答三种哪些地方的间题,Aristo先查找出“铁原子随着热量增加而运动加快”的知识,将术语“挥发”与“热量”联系起来,将术语“快”与“频繁”联系起来,并将C评定为正确确定。

结合不同的出理 哪些地方的间题的土办法为Aristo将测试分数从2016年的最少400%提高到今年的91.6%扫清了道路。在12年级考试中,该模型得分率为83.5%。

▲Aristo不断提升的答题准确率

究竟是学霸还是学霸?能用就好!

每项科学家对Aristo取得的进展并还可不能否 可不能否 抱以不多热情,每本人 认为机器离删剪掌握自然语言还有很长一段路要走,更并不真正像还有一个多 学好好生那样思考了。

“每本人 还可不能否 拿这项技术和真正的学生以及每本人 的逻辑推理能力相比。”已在微软参与多项之类技术研发的研究员Jingjing Liu讲道。

Liu和她的微软同事曾尝试建立还有一个多 可不都要通过GRE考试的系统——GRE是美国研究生入学的必考测试。

Liu表示,出理 语言每项是可行的,或者建立可用于出理 数学哪些地方的间题的逻辑推理能力或者另外一回事了。“三种太好是一项太有挑战性的工作了。”

但从商业角度来看,从互联网搜索引擎到医院的文档记录系统,Aristo的三种进展将对其他其他产品和服务产生广泛影响。

根据纽约时报的报道,Etzioni博士表示:“这项技术会带来重要的商业成果。目前给你自信的说,每本人 将会想看 三种进展带来的新一代产品,将会来自创业公司,也将会来自大公司。”

“这项技术仍居于初级阶段,”Fast.ai的技术总监Jeremy Howard说道,“或者其技术的潜能是无限的,每本人 离充采集掘这项技术的潜能还很遥远。”

OMT,Aristo也是艾伦研究所创始人的遗愿

艾伦研究所命名自微软的联合创始人保罗·艾伦(Paul Allen),他在2013年成立了艾伦人工智能研究所,希望可不能否 着手出理 人工智能发展的重大哪些地方的间题。

把“八年级科学测验”作为题目的人工智能科学挑战赛,人太好源自于这位西雅图亿万富翁的还有一个多 私心:他希望研究人员设计出还有一个多 足够聪明、可不能否 通过八年级科学考试的人工智能线程。

自创立后,艾伦研究所的研究人员便老要致力于建造这只聪明的人工智能线程——Aristo。

这全是 一件容易的事,五年来研究者们尝试了无数次,或者老要还可不能否 可不能否 达到艾伦希望的效果。

然而去年10月份,还还可不能否 可不能否 来得及见证Aristo的诞生,享年65岁的艾伦去世了。

在不同的电子邮件中,Aristo的作者Etzioni和Clark都对保罗·艾伦表示了敬意。当被问到或者的系统艾伦否有有就可不都要满意的并且 ,两人都表示:“我不多 。”

“保罗会非常高兴,但我不多 让每本人 满足于现有的荣誉,”Etzioni说,“他会问:NLP的下还有一个多 重要阶段是哪些地方?”

“给你能象他会说‘恭喜你!但下一步是哪些地方?”

热门

热门标签