你的双眼,你了解吗?

在自然界中,同样的景物,在不同的动物眼里却是有所差异的的。某些哺乳动物如牛、马、羊等,它们的两眼长在头的两侧,因此两眼的视野完全不重叠,左眼和右眼各自感受不同侧面的光刺激,这些动物仅有单眼视觉(monocular vision)。人和灵长类动物的双眼都在头部的前方,两眼的鼻侧视野相互重叠,因此落在此范围内的任何物体都能同时被两眼所见,两眼同时看某一物体时产生的视觉称为双眼视觉(binocular vision)。双眼看物体时,主观上可产生被视物体的厚度以及空间的深度或距离等感觉。当两只眼睛分别形成的物体被转化成神经信号传输到大脑以后,大脑就会对它们进行综合加工处理,两个物体相同的地方合二为一,不同的地方就代表物体不同维度上的特征。这样一来,两个物体就合成为一个具有很强立体感的物体了。因此双眼视觉也称为立体视觉(stereopsis)。

立体视觉

立体视觉

3D摄像头是什么炫酷的装备?

我们通常接触的普通摄像头只是二维的,没有深度的,也就是每一个景象都是平面的连续播放。这样的摄像头是无法人们提供身临其境的感受的!而3D摄像头在二维图像的基础上增加了对拍摄对象的深度测量,即三维的位置及尺寸信息,从而形成三维图像,其“看到”的景象和眼睛所看到的景深是类似的。

业界认为2D向3D摄像头的转变将成为继黑白到彩色、低分辨率到高分辨率、静态图像到动态影像后的第四次革命。如果说触摸屏实现了交互方式从一维到平面,那么3D摄像头将让交互方式从平面变成立体。3D摄像头为许多“痛点型应用场景”打开了局面,当前科技界炙手可热的领域如人机交互、人脸识别、AR/VR、辅助驾驶等等,都离不开3D摄像头,3D摄像头是未来人工智能“开眼看世界”的提供者!

人脸识别以前主要应用在门禁考勤系统、防盗门等,后续电子护照及身份证也大量采用该项技术。公安、司法和刑侦利用人脸识别系统和网络,在全国范围内搜捕逃犯。在金融业务上,电子商务、智慧银行采用人脸识别,也成了企业增强市场竞争力的手段。人脸识别在消费市场的机会越来越多,比如移动端的身份认证、支付交易确认、权限登录,手机自拍的快速对焦、自拍美颜等……人脸识别带来的便利性将带来人类生活消费方式的变革!

2015年马云在德国汉诺威消费电子、信息及通信博览会上“刷脸”

2015年马云在德国汉诺威消费电子、信息及通信博览会上“刷脸”

图像采集则是人脸识别的入口,摄像头采集的图像信息质量直接决定了最终判断的准确性。但是,目前所有的人脸识别摄像头采集的都是二维图像/视频信息,缺失了深度的图像使得各种欺骗人脸识别应用的合成图像或视频有了可趁之机:PS换脸、屏幕翻拍、戴面具、建模驱动等。而如果利用3D摄像头实现三维人脸活体识别,那么不管合成的图像或视频多么逼真,它只能在屏幕上呈现二维图像,注定是无法通过三维人脸活体检测的!

摄像头是人脸识别系统的入口

摄像头是人脸识别系统的入口

手势识别的应用场景非常广泛,无论是消费级市场的游戏、娱乐,还是汽车市场等,都需要丰富的手部动作来参与。这块的市场爆发力将非常强大!目前的二维手势识别只能做到一些比较简单的操作,比如控制视频播放开始和暂停、浏览照片等。但是对于更加复杂的体育类游戏或者AR/VR来说,二维手势识别还不够完美。未来集成3D摄像头的智能硬件将极大地促进三维手势识别的普及和应用,这也将带来比触摸屏交互更加接近人类方式的交互式体验。

手势识别应用

手势识别应用

在汽车辅助驾驶系统,3D摄像头的引入更是赋予了汽车的“第六感”。3D摄像头可以时刻追踪司机的眼皮动作,当检测驾驶员有困倦或注意力不集中式能立即做出响应甚至气动紧急制动系统。配合雷达,还可以提供精准的路面状况信息,避免车祸的发生。

 3D摄像头呈现的三维路面图像

3D摄像头呈现的三维路面图像

在消费电子领域,3D摄像头也即将引爆市场。2016年,全球首款搭载Tango技术的智能手机:联想和谷歌凭借PMD独家3D技术重新定义了移动设备的新类别。而智能手机的“风向标”苹果公司中将在新一代iPhone 8中将配置3D摄像头的传言已经闹得纷纷扬扬。

 联想PHAB2 Pro手机搭载Tango AR技术,具备3D测绘功能

联想PHAB2 Pro手机搭载Tango AR技术,具备3D测绘功能

3D摄像头——国外争相布局的产业

近几年,国外的巨头公司都在3D摄像头产业链上布局:意法半导体、滨松、欧司朗、艾迈斯、博通等元器件及模组生产厂商,苹果、微软、英特尔、三星、谷歌、索尼等综合系统方案商,都在抢食这块“肥肉”。

微软是最早涉足3D视觉的公司之一,在2010年与PrimeSense合作,推出了XBOX360体感周边外设——Kinect1代。颠覆了游戏的单一操作,使人机互动的理念彻底地展现出来。在Kinect上市后的头60天内,微软总计卖出了800万台,成功拿下了“吉尼斯世界纪录中销售速度最快消费者设备”的头衔。2012年微软先后收购了ToF(飞行时间光)相机公司canesta和3dv,自行开发了Kinect2代,采用ToF原理,在精度、分辨率和响应时间都有很大的提升。2015年,微软研究院的发明Handpose,,目的是让计算机精确地识别手势动作,并应用在2016年问世的AR头戴式显示器HoloLense。

微软Kinect 1代

微软Kinect 1代

谷歌,作为人工智能的专家之一,早已敏锐地嗅到了3D视觉市场的机会。其明星项目Project Tango在2016年成功植入联想手机PHAB2 Pro,提前在移动端运动追踪、深度感知和区域学习方面实现布局。2015年的谷歌开发者大会上提出了的60GHz毫米波手势识别技术Project Soli更是让人耳目一新,采用的60GHz毫米波弥补了红外光无法穿过被遮挡物的缺点。

Tango采集三维信息输出“点云”数据

Tango采集三维信息输出“点云”数据

2013年11月,苹果收购以色列3D传感器生产商PrimeSense,便暴露了其将3D体感控制器小型化并配置在PC、电视并最终到智能手机等消费电子产品的野心。乐观估计,苹果公司十周年推出的iPhone 8有望见证这一黑科技。

2016年苹果发布的3D手势识别专利示意图

2016年苹果发布的3D手势识别专利示意图

而微软在2012年也开始涉及实感技术,2015年推出全新的RealSense。作为一款智能3D摄像头,主要有三部分组成:(1)传统的2D摄像头;(2)近红外图像传感器;(3)红外激光发射器。英特尔RealSense 3D摄像头有两种类型:一种是用于远距离、精度稍低的后置3D摄像头;另一种是用于近距离、精度较高的前置3D摄像头。目前,RealSense 3D 摄像头已经集成到戴尔、联想、华硕、惠普、宏碁等厂商的产品。

RealSense 3D摄像头组成——远距离使用(左图)&近距离使用(右图)

RealSense 3D摄像头组成——远距离使用(左图)&近距离使用(右图)

中国——3D摄像头产业链雏形已形成

麦姆斯咨询整理出中国3D视觉产业链,整个产业链生态圈已初步形成。

麦姆斯咨询用一张图展示中国3D视觉产业链

麦姆斯咨询用一张图展示中国3D视觉产业链

在核心元器件领域:红外LED设计企业有三安光电、乾照光电,晶圆制造商有三安光电,封装测试有聚飞光电、联创光电;VCSEL(垂直腔面发射激光器,Vertical Cavity Surface Emitting Laser)提供商有华芯半导体、光迅科技、昂纳科技集团;MEMS微镜提供商有微奥科技、励德微系统、创微电子;图像传感器设计企业有北京君正(收购豪威科技)、思比科、格科微、比亚迪微电子,芯片制造商有中芯国际,封装测试商有晶方科技和华天科技;滤光片和镜头提供商有水晶光电、舜宇光学、联创电子和歌尔股份;图像处理芯片提供商有北京君正、全志科技和瑞芯微。

在摄像头模组领域:欧菲光、舜宇光学、丘钛科技、歌尔股份(但是近期歌尔股份退出了摄像头模组领域的竞争)。

在应用方案领域按原理可分为三类:结构光法提供商(图漾科技、奥比中光和华捷艾米),飞行时间法提供商(海康威视、舜宇光学和乐行天下),多目(双目)立体视觉法提供商(图漾科技、纵目科技、凌云光技术、西纬科技和弼智仿生)。

在接下来的几期报道中,我们先从3D视觉应用方案谈起,方案的原理、优缺点、国内外厂商面临的挑战和机遇,再深入到各种核心元器件。欢迎关注麦姆斯咨询,获得更多的知识和市场信息!

arrow
arrow
    全站熱搜

    Shacho San 發表在 痞客邦 留言(0) 人氣()