在B.F.斯金纳的经典动物学习实验中,一只鸽子在笼子里走动,可能会走到某个特定地方,而那个地方可能是带电的。它受到电击,会很快学会不再去那里。或者,鸽子啄到一个小按钮后会得到食物奖励。我们把(小汽车)放在一个箱子里,箱子四面都有颜色。
当它朝向正确方向时我们会奖励它。我们要问的是,能否让这类机器人做出基于强化的行为。Barenholtz说,我们从来不会告诉它这是正确的事情。我们只是让它去探索。目前,机器人得到的奖赏是获知自己是正确的。Barenholtz表示,这也是研究团队想要优化的一个方面。
这就引出了一个非常有趣的心理学问题:奖励的本质是什么。我们的头脑里没有分数。我们有内啡肽和血清素,还有称之为奖励的东西。他说。在实验中,机器人学会了面向正确的墙壁。对此,研究者表示,这表明它们有能力在现实世界中解决这类问题。
另一方面,反复试验表明,执行如此简单的任务,对机器人来说也并不容易。有人说,这不可能是大脑,大脑太复杂了。对此,Barenholtz的回答是,让我们看看它能走多远。让机器人实验取代某些动物研究,这是我们的一个动力。