中国体视学与图像分析
    主页 > 综合新闻 >

用仿生眼引爆机器人寒武纪

“机器视觉一旦普及,就会产生大量的机器人和人工智能设备的爆发。这和寒武纪生命大爆发是一样的。我们认为,现在,就是机器人的寒武纪时代。”

张晓林

中国科学院上海微系统与信息技术研究所研究员

大家好,我是张晓林。我主要研究仿生视觉。在我的研究生涯中,有一半时间在研究机器人,另外一半时间在研究医疗中的神经学,特别是视觉方面的神经学。我们将机器人和视觉神经学结合在一起,就变成了仿生眼。今天我分享的主题是《赋机器人予视觉》,其中还会讲到一个子课题——视觉是大脑形成的关键。

我们首先来讲视觉。在五亿多年前的寒武纪时代,一个小虫的脑袋上长了一个感光细胞,感光细胞慢慢变成了眼睛,对光产生了反应。换言之,视觉的诞生导致了寒武纪生命大爆发,一时间地球上出现了大量新生命。

因为有了视觉,大脑才能不断地发展。通常我们会讲,有了眼睛就会有好的大脑,有了好的大脑就会有更好的眼睛。所以,眼睛和智慧是相辅相成的。视觉处理几乎需要用到人类的整个大脑,大脑近乎所有的部分都与视觉有关。

接下来,我们看一下自然界中顶级的四种眼睛,分别是蜘蛛眼、复眼、鹰眼和人眼。在生物进化的时侯,生物的功能常常会在大概几百万年内突然达到顶级,在这之后暂时不会发生变化。因为生物的进化过程很快,我们很难找到进化途中的生物,只能找到最佳状态时的生物。

蜘蛛眼(左上)、复眼(右上)、鹰眼(左下)和人眼(右下)

为什么这四种眼睛是集中了四种顶级配置的眼睛呢?

比如,蜘蛛有8只眼睛,前后各有4只,它能够看见360度的景象。这种眼睛代表了蜘蛛的智能,它已经无法再往上发展了。

其次,所有的昆虫都在使用复眼。昆虫在使用复眼的时候,比较容易理解和处理收到的信息。所以,像昆虫这种大脑比较单纯的动物就喜欢使用复眼。复眼在小型的昆虫上是视觉效果最好。特别是蜻蜓,它有25000多只小眼。虽然复眼的使用效果很好,但复眼也只能发展到昆虫阶段。

经过不断地进化,高等动物,特别是脊椎动物,使用的是配置更高的眼睛。在会飞行的动物的眼睛中,鹰眼是最高级的眼睛。鹰眼的特点就是看得远,它能够在千米高空看到地面的蛇和老鼠等。

而我们人类可以通过眼睛暗送秋波,以目传情,因为人的大脑最聪明。眼睛可以做很多事情,或者可以发现很多细节的东西。

思想晚餐

已完成:20%?//////////

双眼可动为什么这么重要

我们主要研究人的眼睛,已经研究了20多年,人眼的数据比较充足,对人眼的研究也比较多。所以我们做仿生眼也是从人眼开始研究,但人眼也是最难研究的。

仿生人眼是机器视觉的极致

高等动物的视觉有两个特点。首先,高等动物都拥有双眼。大家可以看到几乎所有的高等动物,即脊椎动物的眼睛都是两只,看不到第三只眼,二郎神这种生物其实是不存在的。其次,这两只眼睛都是可以动的,没有高等动物的眼睛是不动的。

为什么会有这种情况呢?这是因为双眼能形成立体视觉,左右两只眼睛通过三角算法就可以测距离。而如果要看得远、看得广,双眼就必须可以动。

看得远、看得广是双眼可动的第一个特点。比如,如果大家要用同样能力的相机看远处,就必须用望远镜头。望远镜头的摄像角比较窄,必须要移动才能看到各个地方。

双眼可动的第二个特点,就是要看得清、跟得上。如果下图中的这条大鱼要抓小红鱼,它的眼睛就要紧跟着小红鱼,保证视线在小红鱼身上不动。这样大鱼的双眼获取的图像就会很清楚,不会模糊。同时,大鱼要时刻跟踪小红鱼,因为不知道这条小鱼要往哪儿跑。如果一旦让它离开视线,看不见它,它可能会突然咬大鱼一口,所以大鱼的视线要一直跟着它。这就是视觉的一个必然。

既要看得广又要看得远,既要看得清又要跟得上

现在我们做的绝大部分的人工机器视觉都是固定的,比如多目、单目。我们研究制作的仿生眼的主要特点就是可动。

接下来,双眼可动的第三个特点就是三个自由度。三个自由度就是眼睛不仅会左右上下地旋转,还会绕视线旋转,这是必须的。而其他绝大部分的可动相机都是左右上下地转。