新闻动态

NEWS TENDENCY

【浦东康信】视角-当人工智能拥有好奇心,结果可能…

发布时间:2017-10-25 作者:康信小额贷款 1143次浏览

好奇心,是人和人工智能最显著的差异之一。从我们睁开双眼看这个世界开始,我们就在努力的了解着周围的一切,我们了解世界的方式很多样;一开始是试图把所有东西放进嘴巴里,到后来我们走遍了这世界的每一个角落。

 

 

这是生命中最美妙的东西,在满足好奇心的过程中,我们获得了快乐。人类了解一切,不是为了完成某一个目标,而仅仅是一种来自本能的冲动。

 

电影画面

 

可人工智能所做的,只有根据既定目标进行学习、搜索和计算。扫地机器人会探索周围环境,可这不是因为好奇,而是为了建立房间中的SLAM以完成工作。这也是强人工智能不会出现的证据之一:人类自己都没弄明白“意识”为何会存在,更没法将“本能”加在人工智能头上。

 

不过在现有技术下,我们能否让人工智能做出类似好奇的行为呢?比如给予无意义的探索行为一些奖励,或者是把探索行为和完成工作相结合进行评分。

 

答案是可以。

 

好奇心帮助人工智能成为更棒的水管工

 

还记得我们第一次玩超级玛丽的时候吗?或许我们中很多人玩的都是小霸王学习机里的超级玛丽式英语学习软件。不管是什么,进入游戏的第一时间,我们通常都是试一试手柄上的每一个按键是做什么的,然后跳来跳去,尝试触碰游戏里的每一个小方块。这就是好奇心最基本的表现。

 

那么人工智能在玩超级玛丽时是怎样的呢?通常情况下是应用了增强学习算法,用正负反馈机制帮助人工智能快速通关。踩死一只乌龟,获得正向反馈,掉入悬崖,获得反向反馈。问题时,只要能够继续过关,人工智能很难学会新的动作,这也就造成了遇到新的关卡时,人工智能常常需要耗费很大力气才能通过。

 

超级玛丽

 

在一篇关于人工智能好奇心的论文中提到,人工智能利用传统的增强学习方法训练,在超级玛丽的游戏过程中,人工智能卡在了游戏的30%处,因为人工智能需要越过一个坑,而想要越过那个坑,需要15到20个特定顺序的按键操作。由于在坠落进坑里时已经获得了反向反馈,人工智能常常在坑的位置止步不前。

 

上述论文的作者,来自UC Berkeley的研究团队提出了一种新的思路,为人工智能加入了内部好奇心构型。以自监督的方式,预测自身行动会造成何种结果,并将这种算法称作自监督预测算法

 

当外部反馈减少时,内部好奇心构型会激励人工智能通过探索环境去检验自我对于行动的预测。结果是,采取内部好奇心构型的人工智能不会盲目重复那些有正向反馈的动作,而是开始了解游戏环境,把握整体游戏进程。最终战胜了那个坑。

 

好奇心不仅会害死猫,还会让人工智能得多动症

 

当人类表现出过度好奇时,会有怎样的结果?最常见的,注意力无法集中,常常将手头的工作半途而废。同样,人工智能拥有好奇心后也会有同样的表现。搭载TEXPLORE-VANIR算法的机器人在一项给门开锁的任务上表现较差,就是常常因为好奇而去探索环境,导致任务完成的延迟。甚至有学者称,这是人工智能的“多动症”。

 

这样看来,如何平衡内部和外部的反馈将是如何让人工智能好奇心发挥作用的最大问题。

 

但我们相信,不管以何种形式,未来的人工智能一定会出现类似好奇心的机制,在更了解这个世界的前提下,更好的服务人类。

 

来源:虎嗅网



30秒免费快速申请

我们会在一个工作日内与您联系,为您提供专业、便捷的贷款服务

关注我们的公众号