AI独角兽商汤科技再登GPU技术大会首秀动作识别黑科技

11.05.2017  11:13

   2017 5 9 —— 美国圣何塞 —— 全球人工智能计算技术领导者NVIDIA(英伟达)在硅谷隆重举办第八届GPU技术大会(GTC 2017)。商汤科技作为唯一一家再度受邀亮相GTC的中国AI公司,携包括应用于智能视频、手机影像、互联网娱乐APP等领域的众多前沿AI产品、技术和解决方案参展。其中首次展示的SensePose单目摄像头动作估计解决方案,更吸引了来自全球与会者的广泛关注。

  对于人工智能、虚拟现实和无人驾驶汽车领域的开发人员、数据科学家和企业高管而言,GTC是一年中的最大盛事。作为大会的主办方和推动者,NVIDIA每年都会在大会上表彰取得突破性成就的人工智能初创企业。在去年4月的GTC 2016大会上,商汤科技凭借其对GPU技术的深刻理解,以及在计算机视觉和深度学习领域顶尖的研发能力,获得“新兴企业峰会奖(ECS Awards)”,也是唯一获此奖项的中国企业。过去两年中,商汤科技在ILSVRC、ActivityNet、MOT Challenge、Cityscapes Challenge以及KITTI等计算机视觉领域的各类权威测试中取得过多项冠军。

  商汤科技CEO徐立博士表示:“现代人工智能的爆发,源自核心技术深度学习的突破。商汤科技团队成员自2011年开始聚焦于深度学习,并率先应用于计算机视觉领域,在学术界和工业界均取得了多项傲人成绩。凭借我们原创的深度学习框架、自主搭建的深度学习超算平台,以及与NVIDIA的深度合作,必将能够快速把AI的潜力释放于更多场景当中,利用算法的可复制性,实现AI的快速大规模应用,带动产业升级。

  在本届大会上,商汤徐立博士和颜深根博士分别就深度视频理解和工业级深度学习技术做了演讲。商汤所展示的SensePose、SenseFace、SenseVideo、SensePhoto、SenseAR等解决方案,充分诠释了其业内领先的深度学习原创技术的优势,以学习能力更强、速更快、功耗更低的神经网络架构,结合GPU技术,实现了深度视频理解和图像处理的更多可能。

   SensePose :单目摄像头实现人体动作估计

  作为商汤科技首次亮相的产品,SensePose具有开拓性意义。它区别于以往的双目摄像头、带红外线摄像头、关节处佩戴传感器等传统的动作捕捉解决方案,通过单目摄像头即实现了动作估计,大大降低了动作捕捉设备的制造成本。SensePose可充分利用GPU性能,可精确地将关键点定位在10个像素以内的人体关节,从而在视频中实时、准确地识别人体姿态,定位手、肩、脚、腰等十几个关键点位置,鲁棒性好。

  SensePose将成为日后人机交互、虚拟穿戴、虚拟试衣等应用的决定性技术,应用前景广泛。而动作估计与人脸预测技术相结合,更可用于描述视频中人物关系或人物状态,从而实现视频内容的理解和分析,为影视行业创造更多商业价值。

  此外,商汤科技还展示了一套运行于NVIDIATITANXGPU上,可读取双目视频,并实时计算深度的高质量双目深度估计系统。凭借商汤科技全新开发的神经网络架构,该系统在权威自动驾驶算法评测数据集KITTI 2015立体基准上获得了超越的性能表现。

   SenseFace 视频监控中的大规模人脸识别

  SenseFace人脸布控系统,非常适合用于飞机场、火车站等公共场合的大规模视频监控系统中的实时大库人脸识别。该系统可提供在监控视频中实时抓拍人脸、布控报警、属性识别、统计分析、重点人员轨迹还原等功能,并做出及时有效的智能预警。凭借商汤科技的超过1000层的神经网络,SenseFace在光照、角度、表情、遮挡、年龄变化等情况下,仍能保持超高的识别准确率。得益于NVIDIA cuDNN和TensorRT库,SenseFace可分别在单个Tesla M40 GPU和单个JetsonTX1上支持12路和2路全高清视频的实时处理。目前,SenseFace已协助抓获数百名罪犯。

   SenseVideo 视频监控中的对象识别与分析

  SenseVideo视频结构化系统,是商汤科技在全球权威的计算机视觉竞赛ILSVRC2016中获得场景分析第一名的深度学习模型的实际应用成果。该系统拥有行人检测、车辆检测、车辆分类等多种技术,可以在监控视频中按照时间和地点,实现人、非机动车和机动车的检测、跟踪、抓拍、检索及数据统计和分析,为路面状况动态分析、车流密集地段识别、街面安全时段分析提供强大助力。得益于NVIDIA cuDNN和TensorRT库,SenseVideo在单个Jetson TX1平台上即可实时处理双路高清视频。

   SensePhoto :全面的手机影像处理解决方案

  SensePhoto目前已被中国前十大国产手机品牌中的大部分品牌所使用。借助基于GPU的深度学习引擎,SensePhoto可以提供暗光增强、去雾、智能滤镜、艺术画以及多种人像拍照解决方案,包括人脸变形、美颜、背景虚化等功能,即便是在遇到暗光、逆光、大角度的情况下,效果也不成问题。SensePhoto还可提供智能相册解决方案,能够实现云端及离线端的人脸或场景聚类,轻松解决手机中上百数千张照片的管理归类难题。

   SenseAR :实时视频中 AR 特效生成解决方案

  SenseAR结合了全球领先的人脸检测及追踪、106个人脸关键点定位等技术。基于手机摄像头,SenseAR可进行脸部、手势、前背景的跟踪定位,并进行增强现实感特效的内容绘制,可应用于娱乐、教育等诸多领域。目前,包括Faceu、SNOW、小咖秀、熊猫直播等多种APP中均采用了SenseAR技术,用户可以体验到趣味面部贴纸、变脸乃至动作增强、背景替换等众多有趣的功能。

  作为中国汇聚科学家数量最多的创业公司,商汤科技拥有备受业内认可的大量学术成果。自主研发的深度学习框架,自主搭建的深度学习超算平台DeepLink,更成为商汤科技巨大的技术优势。同时,结合与NVIDIA、Mellanox、曙光等平台厂商的合作,以及在金融、安防、手机、互联网等领域超过300家的签约合作客户,商汤科技成功打造了SenseTimeInside的AI商业生态,如今已成长为一只AI独角兽,并且成为目前中国融资额最大的AI企业。

编辑: 罗予岐