盎锐孙燕生博士,RK开发者之春受邀演讲

?

今年2019年的瑞信微开发者大会吸引了近千名开发商和行业领导者参与“智能期货”主题。一些具有全球影响力的知名公司参加了此次活动。 UNRE AI Limited的创始人孙燕生博士是世界着名的3D智能视觉专家,也是一位成功的连续创业者,他创立了Weitek,C-Cube和DVS等着名的硅谷高科技公司,并受邀成为一个3D连接的人。关于世界主题的精彩演讲。

img_pic_1556594986_0.jpg

以下是孙燕生博士关于“3D连通人与世界”主题的精彩演讲:

三维世界是现实世界,目前的拍摄和显示技术将我们限制在一个平坦的世界。

由于智能手机的低成本3D摄像头的出现,我们正在推动3D方式与世界互动。 3D产业的生态正在建设中。我们正面临着另外10年的发展机遇。

对于人类而言,您可以通过眼睛“看到”周围环境中的事物,您可以“识别并理解”这些事物,并对这些事物形成“认知和决策”。 AI领域越来越多的研究人员正在努力使AI做同样的事情。从人类的三维视觉出发,三维智能视觉已成为人工智能研究和应用的热门领域。

随着智能视觉应用的深入,智能视觉技术进入“三维”阶段,即不仅要看东西,要知道什么,还要进入这个场景,真正感受到三维世界中的场景。需要具有三维空间感知和认知能力的智能,即三维智能视觉。

3D智能视觉是许多学科的融合,包括计算机视觉,计算机图形学和其他技术领域和深度学习,大数据的交叉融合。

img_pic_1556594987_1.jpg

三维智能视觉有几个主要方向,一是三维感知,即感知三维空间,获取和处理三维深度;然后,位置感应,例如感应相机的位置;三,三维成像和建模,不仅对于场景有基本的深度感知,而且描述了场景的完整几何模型;最后从三维空间中对场景及其中的物体进行三维理解。

3D智能视觉的发展,得益于视觉传感器的发展,大致可分为两类,一类是无源传感器,如我们现在使用的各种传感器都是无源传感器。另一种类型是有源传感器,即基于有效传输信号进行测量的传感器。

对于3D成像,当前的低成本3D成像解决方案包括飞行时间(TOF),结构光,立体视觉和光场。对于用户而言,不同之处在于成像精度,速度,分辨率,帧速率和对环境的依赖性。

对于3D建模,尤其是3D肖像建模和分析处理,由于低成本消费级RGB-D传感器的出现,3D肖像建模和分析处理的成本已大大降低。在过去,3D图像重建单个图像,经典的方法是3DMM,这是一种统计方法,它是收集许多人脸模型,使用PCA减少维度来查找统计模型,然后拟合统计模型面子要问。今天的深度学习方法也使用相同的核心思想。多个图像被纹理重建,这是单图任务的自然延伸。

参考3D肖像分析,处理流程可分为数据采集,预处理(去除尖点,填充孔等),形状表示,测量和匹配。用于3D肖像分析的应用场景,包括认证,表达分析,美学分析等。典型的应用是iPhone FaceID,其收集来自人的三维数据用于记录和比较。 FaceID的出现表明3D肖像已经可以应用于某些定制产品。三维人像处理技术在人脸识别,美容行业,新零售虚拟试穿和试穿等领域有许多应用场景,并且已经被赋予产业升级的权力。

img_pic_1556594988_2.jpg

与此同时,随着3D传感器的普及,越来越多的3D数据,如何实现对3D场景的精细理解变得非常重要。理解这一场景最重要和最有效的方法之一是深度学习。最早的深度学习是针对2D图像,卷积神经网络用于2D图像,而对于3D场景,输入数据是3D点云,过去没有体积。神经网络可以自然地处理非结构化的3D点云。随着人工智能技术的进步,对3D场景的精细理解成为可能。

img_pic_1556594989_3.jpg

3D在未来拥有巨大的商机。三年后,市场已超过100亿美元。六年后,它已超过250亿美元。市场爆炸式增长的动力来自5G网络成熟,人工智能技术升级,多终端终端兴起,支持3D摄像头智能手机的普及以及3D应用的持续扩展。

3D行业的基本组成部分包括用于垂直应用的拍摄设备,分析处理工具和语义工具以及显示设备。其中,垂直应用的分析处理工具和语义工具也可以通过应用2D实现一些功能,但是通过2D成像获得的图像信息具有特征信息的丢失; 3D成像不仅用于拍照,更重要的是获取深度信息。

重建现实世界以便为后续的人机交互服务只能是3D技术的责任。生成3D成像的交互需求。计算引擎(包括VLSI可视处理器,DSP,NPU,GPU,FPGA),算法(包括计算机视觉,人工智能图像处理,计算机图像,计算机图形学)和光电技术(用于摄影和显示的光电技术)的快速发展导致3D产业迅速爆发。

产业升级的需求驱动效应进一步扩大了3D产业的市场规模,包括5G时代的4D视频通信,新零售虚拟3D产品的试穿,达美3D肖像和身体的测量和分析,精确的3D建模和建筑业和制造业等的测量。

img_pic_1556594990_4.jpg

自2017年成立以来,安瑞科技已经完成了全栈叠加UNRE AIO 3D智能视觉开发平台,该平台由单一产品线组成的3D智能视觉算法引擎,前端UNRE U8090/U8091 3D摄像头,深整合UNRE 3D Senz智能视觉算法引擎和RK3399Pro AI芯片。 3D模型相机,前3D结构光,后3D TOF。

img_pic_1556594991_5.jpg

昂锐科技涵盖3D人像处理和人像压缩,3D物体测量,4D实时视频和TOF-SLAM全栈全堆栈解决方案,全新零售一体化,娱乐,医疗,安全监控,工业控制,VR等科技领域,作为3D智能视觉的代表,安瑞一直保持着先进的产品布局,不断提升其在3D视觉领域的影响力和产品竞争力,与瑞信威,英飞凌,英特尔等国际巨头保持着深入的合作。并逐渐在全球3D智能视觉技术产业链中拥有更高的优势和声音。

目前,3D应用已达到高速爆炸的临界点。低成本3D摄像机,5G网络,低成本计算和全息显示等基础技术和设备已经可以在美国使用,大型娱乐,新零售,即时消息等。适合行业的时机。 Anglo Technology是3D智能视觉领域的先驱之一。让我们创造和享受3D互联世界的美好未来。