商汤王晓刚:人工智能赋能百业

“算法和芯片的结合、算法和传感器的联合优化是未来人工智能的重要方向。”

在2019年由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办的CCF-GAIR大会上,商汤科技联合创始人王晓刚在谈及人工智能的未来发展时如是说道。

商汤王晓刚:人工智能赋能百业

作为商汤移动智能事业群总裁兼研究院院长,王晓刚多年来一直致力于将人工智能的学术研究与现实解决方案有机结合,保持产品迭代与学术研究的动态平衡。

过去几年,商汤除了做工业落地的研究之外,也在加强学术方面的探索。“如何让普通的开发者、公测人员根据我们的工具链迅速开发出人工智能的解决方案,使其生产力释放出来,是未来我们需要面临的课题。”

针对从学术到产业化的人工智能,王晓刚也在大会上做了分享。以下为王晓刚演讲实录,经产业家编辑发布。

作为研究院院长,在实验室带着学生做研究,更多是利用有限的计算资源和数据资源做学术界的经典问题实现创新和突破,类似于传统作坊。而随着人工智能在工业的大规模落地,工业界给了其很强的助力。无论是从研究的内容、工具还是方式上看,工业界的人工智能研究都发生了很大变化。

软硬结合,释放生产力

未来人工智能研究一个重要的方面就是软硬结合,现在我们的研究更多还是停留在算法层次,未来人工智能算法和芯片的结合、算法和传感器的联合优化,是一个重要的方向。

业务系统对学术的研究也非常重要。比如整个城市有很多摄像头,现在工业领域可以把几万个摄像头连在同一个平台上。如果摄像头连到同一个平台上,一年积累的人脸数据超过上千亿。如何在大平台上进行图像搜索和大数据分析,这是学术难以接触的问题。

此外,我们的计算平台在现在一些工业上的研究上也能够使用几百块GPU同时训练一个模型。还有一些工具链,我们从研究、模型的训练到产品的部署需要有一个快速的反馈过程,反馈可以来自产品,甚至来自市场。这个过程的加快可以让我们研究的迭代更快,另外还有很多长尾的人工智能问题以及需求需要解决。

我们需要建立一套高效的工具链。最后是全面的测试和评估,比如我们做人脸识别、计算机视觉识别问题,在学术领域,我们在实验室也有工具,但真正工业应用其实要做大量的测试,后者会反馈出非常多的问题,这就是用新的问题推动研究的进步。而这些要素是学术实验室所不具备的。

商汤科技成立于是2014年,初创研究团队来自于香港中文大学,大概有20年的历史学术积淀。我们提供不同行业的人工智能算法和解决方案,现在我们和学术界还保持着密切的交流。我们和MIT、南洋理工、清华、北大等高校都有联合实验室,同时与超过20多个学校和机构有学术上的合作。

过去几年,我们除了做工业落地的研究,也会做学术方面的探索。在ICCV、ECCV上发表了几百篇论文。我们和香港中文大学联合实验室共同启动OpenMMLab开源算法库,里面包含了大家经常关注的计算机视觉问题,如物体的检测、行为的识别和超分等,把经典算法开源,帮助大家更好的复现。其他院校也会加入到这个开源平台的构建中。

我们提供了SenseAR增强现实的开发者平台,这是学术和工业联合研究的例子。我们不光有增强现实AR和AI功能集成,从SLAM到人脸人体的识别等,可以部署到不同的手机上,包括小米以及各种不同的芯片平台,除此之外还有云和端的联合。

这个平台已经部署在超过5000万台的手机上,我们把这样的平台开放给学术界的合作伙伴,整个平台的建立是基于和浙江大学一起成立的联合实验室。同时我们也把这些平台里其中一些关键模块与其他高校包括北大、中科院等共建,形成工业和学术的联动。

做计算机视觉或人工智能的研究,有三个重要的层次。

第一层是基础层,包括芯片、AI超算平台、深度学习平台、AI平台等,在这方面西方尤其是美国要做的更扎实。第二层是应用层,在这方面中国更具优势,因为国内有很多丰富的应用场景能够反向驱动人工智能算法的进步。第三层是工具链层,当不同领域需要人工智能的项目越来越多时,对研究人员的需求也是线性增长的,如何让普通开发者、公测人员根据我们的工具链迅速开发出人工智能的解决方案,使生产力释放出来是未来要面临的课题。

产研合一,加速现实与虚拟的融合

在算法精度不断提升的前提下,如何拓展智慧城市从1到N的业务边界、促进2D的感知到3D世界的落地,以及现实到虚拟现实的融合?

2014年是人工智能的工业应用年,这一年商汤团队发表Deep ID系列人脸识别算法击败Facebook,全球首次超过人眼识别率,从过去几年中可以看到随着技术持续的进步,它不断的突破业务的边界。

当时的误识率是在千分之一,现在每年都有几个量级的增长。当人脸识别的精度增长,我们可以看到其拓展的业务边界。很多人以为当你超过肉眼识别率时,这个问题已经解决得差不多了,其实不是这样,现实当中它对这项技术的要求远远超过肉眼识别的水平。识别率比较低时是1:1的比对,如人脸、身份证进行线上线下认证。比如现在在机场、旅馆里可以看到商汤SenseID基于人脸的认证。

从2017年开始,人脸的识别开始用于手机解锁功能,手机虽小但其要求更高,因为手机不但要识别准确,还要防止活体攻击,这里有各种各样活体攻击方式,从照片到视频再到3D模型。过去几年里,我们Sense ID人脸识别、活体检测的水平持续提升,可以让这一项技术进入普罗大众的日常生活中。据统计,现在人们每天使用手机人脸解锁这项功能超过100亿次。

如果1:1是相对简单的问题,1:N就是更复杂的。我们需要有数据库,这里的数据库可能是几万或者几十万的量级。在门禁、闸机等通行场景中,一个大楼或者公司有1、2万人的数据库;智慧城市的数据库可能达到几十万的量级。商汤所做的就是从几万到几十万人中识别和分析所需要找的人与物。随着场景不断的拓展,我们可以看到人脸渐渐的成为人的身份标志。

现在智慧城市应用里,有越来越多的摄像头具有AI的功能,越来越多的摄像头可以连接在同一个平台上。为了数据安全和数据隐私的保护,我们会逐渐减少人工干预和标注,数据可以存储在客户那一端。

以前我们说算法性能的提升靠人工标注,现在我们的数据量到几十亿甚至上百亿的量级不太可能靠人工标注,我们需要靠机器终身学习,使数据得到自动的更新。部署系统和训练系统可以实现融合。

从2017年开始,苹果上了结构光3D摄像头到现在,我们可以看到很多手机厂商不断的推出这样的机型,把有深度的摄像头装在手机上,可以带来很多新的研究课题和新的应用。

回顾一些大家比较熟悉的问题,看它如何从2D成长到3D并产生相应的应用。比如最开始人脸的关键点,我们推出106个人脸关键点,主要是做人脸的属性、人脸特效,用在互联网直播等。我们从106点到更稠密的240个人脸关键点,做的事情不仅是增加特效了,而且还有美妆,对人脸关键点的定位要求更准确。

根据关键点,我们有智能的美颜、美妆,更多的功能需要更多稠密的关键点和定位。现在手机上有了3D摄像头,我们可以实现人脸3D重建。它对于无论是精度、计算复杂性、几何复杂性上都提出了更高的挑战。

更好玩的是3D Avatar,通过人脸驱动3D Avatar。除了人脸的重建还有人体和一般物体的重建,正是因为手机上有了深度的信息,可以给我们带来不一样的体验,2D相册在未来可以拓展到3D相册。另外还有人体关键点定位跟踪,这是我们学术界研究很长时间的问题。我们在学术研究中从2D拓展到3D,这个应用可以用于手机体感游戏上,现在手机因为有了3D摄像头,我们可以在手机上给大家提供体感的游戏。

成立AR联盟,联动产业上下游实现创新

最后,我想介绍人工智能和AR(增强现实)的结合。

2017年是增强现实的元年,这一年苹果、谷歌发布了ARKit和ARCore的平台,商汤科技从2016年就有了自己的增强现实平台SenseAR。

2016年我们主要支持娱乐互联网的直播、特效等功能。2018年商汤以原创AR开发者平台SenseAR为基础,联合OPPO共同打造OPPO ARunit平台,通过这个技术有更多的开发者加入,包括小米。后面互联网公司也基于此做了开发。有SLAM的技术,有各种AI的功能,随着手机3D摄像头的出现我们有基于RGBD的SLAM和物体的重建。

除了手机端,我们也提供了AR云形成多云共享,几个人可以同时在虚拟空间里交互、游戏。

不过现在SLAM技术还是有很多挑战,你要应对动态的场景、弱纹理、复杂运动以及室外大场景。商汤与OPPO合作,在OPPO手机上有了SLAM技术和深度摄像头可以做AR测量,你可以拿着手机测量任何一个物体的大小,还可以自动的检测场景中的各种形状,如方形、圆形、测量身高等。

针对单个前端的设备,我们利用SLAM技术进行场景的理解和定位。例如如果几个人同时想玩一个游戏,我们的AR云可以把他们不同手机上的坐标系统一到同一个坐标系下,实现跨平台的互动。

在《黑羊守护者》的游戏中,有多个玩家,能够针对自己的终端对场景进行定位。所有的坐标信息可以在AR云上进行互动,这是一个简单的游戏,未来会有很多其他的应用。

国外的增强现实是由谷歌、苹果等巨头主导。很多研究和创新需要联合产业链上下游的力量综合实现创新。上个月我们成立了中国增强现实核心技术产业联盟(China Augmented Reality Core Technology Industry Alliance,简称CARA)(简称:AR联盟),与手机厂商、研究机构、模组厂商、算法提供商和Sensor厂商等一起联合创新。

现在和未来AI的研究不单单是在实验室研究单点的问题,我们要联动产业链上下游,通过紧密的合作和市场反馈提供新的问题,实现创新的突破。我们相信未来随着应用场景不断的丰富会给我们AI研究提出更多新的课题,我们和学术界、产业界一起把AI的研究推向更前端,有更多的落地场景。

谢谢大家!

原创文章,作者:产业家,如若转载,请注明出处:http://www.chanyejiawang.com/?p=2225

发表评论

电子邮件地址不会被公开。 必填项已用*标注