中华全国归国华侨联合会>>经济科技>>科技服务
第八届侨界贡献奖人物风采录(七十六)
王刚:用科技解决未来问题
2021年04月28日14:44  来源:中国侨联

王刚,美国伊利诺伊大学电子与计算机工程系博士,计算机视觉与机器学习领域知名专家,阿里巴巴达摩院自动驾驶实验室主任。麻省理工大学技术评论杂志评选的35岁以下青年创新者,在国际最顶尖的期刊和杂志发表100余篇高质量论文,引用次数约为13000次,H-index为56。专注于无人驾驶物流车技术攻关,视觉检测算法获得UA-DETRAC 数据测试排名第一、3D检测算法在国际公开测试集KITTI上获得排名第一、物流车动态定位精度实现厘米级。

砥砺前行 成就卓越

入职阿里前,王刚任新加坡南洋理工大学副教授。侨居新加坡期间,曾获多媒体信号处理大会最佳论文奖、新加坡模式识别与机器智能协会最佳论文奖、亚太区10名35岁以下青年创新者。他在最顶尖的国际期刊和会议上发表了100多篇文章,这些文章被广泛引用,其Google Scholar的引用次数约为3700,H-index为31。鉴于学术研究上的卓越成就,王刚受邀成为人工智能领域最顶尖杂志IEEE Transactions on Pattern Analysis and Machine Intelligence的副主编,同时成为计算机视觉最顶尖会议International Conference on Computer Vision 2017和IEEE Conference on Computer Vision and Pattern Recognition 2018的领域主席(Area Chair)。此外,他还担任多个顶级会议如International Conference on Image Processing的领域主席。除学术研究,王刚还致力于高新技术的产业化和落地。他领导的研究团队开发了多个可商用的计算机视觉产品,例如自动药品检测系统、自动医疗发票OCR系统、自动服装检索系统,以及智能安保视频分析系统等。上述技术已面向多个公司实现成果转移转化和商业化。

不懈努力 追求前沿

回国入职阿里巴巴达摩院以来,王刚作为智能音箱——天猫精灵的技术负责人,基于深度学习开发了一整套语音识别和自然语言理解系统,让天猫精灵成为一个可用的人工智能产品。迄今为止,天猫精灵是国内销量第一、全球销量第三的智能音箱。出任达摩院自动驾驶实验室负责人以来,王刚专注于无人驾驶物流车技术攻关,在自动驾驶自动化学习、深度神经网络的设计和优化上做了大量有影响力的工作,多篇文章获得了最佳论文奖,视觉检测算法获得UA-DETRAC 数据测试排名第一、3D检测算法在国际公开测试集KITTI上获得排名第一、物流车动态定位精度实现厘米级。

在学术领域,开展了如下关键技术攻关:

一是在自动驾驶领域推动和开发了首个全链路的自动化学习系统,基于数据驱动的理念,构建了大规模的仿真平台和自学习平台,能全链路的自动化学习各个算法模块包括感知、决策、定位的模型和参数。计算换智能,极大地克服了对人工专业知识的依赖,能用计算的能力极大地提升算法研发的质量和效率,从而推动了自动驾驶能力的提升。

二是图像和视频语义理解,包括物体检测、物体识别和场景理解,是视觉感知系统的重要部分。除利用更多的训练数据外,专注于设计新型神经网络以更好的利用现有训练数据实现更优的性能。其中,新型孪生神经网络在场景理解问题上获得了巨大成功,并极大地超过了所有现有方法。

三是三维感知和SLAM。通过研发针对三维感知和SLAM的深度学习技术,加强对三维场景的结构进行建模,并基于大量的训练数据实现端到端的三维感知。

四是提出了一种索引的方法把神经网络的卷积结果存储在内存中。该方法可极大提高深度神经网络运行速度并保持相似的精确度。

(责编:蔡雨荷、刘婷婷)
X