GMIC:码隆科技CTO码特演讲AI商品识别完整实录

05.05.2017  20:20

  GMIC全球移动互联网大会是全球规模最大、最具影响力的移动互联网行业盛会,GMIC北京2017大会主题为“天·工·开·悟”,于4月27日至5月1日在北京国家会议中心、以及鸟巢举行。

  作为全球具影响力的创新者平台,大会聚集了众多国内外顶尖的科学家,本次盛会由“全世界最聪慧的大脑”——剑桥大学物理学家史蒂夫 威廉 霍金(Stephen William Hawking)在全球领袖峰会上的视频演讲引爆。

码隆科技联合创始人兼CTO

码特(Matt Scott)

  码隆科技联合创始人兼CTO码特(Matt Scott)受邀担任GMIC演讲嘉宾,于4月28日(周五)上午10:40于GMIC新技术演示SHOW上发表 人工智能商品识别助力行业创新(AI for Product Recognition) 演说,为大家带来AI商品识别从技术到商业落地应用的全方位解析。

|同台重量级演讲嘉宾|

丨如下为演讲实录丨

  Hello GMIC, 大家好,我是码特Matt Scott,码隆科技公司联合创始人兼CTO,很高兴今天来到这里,为大家带来今天的演讲主题──人工智能商品识别助力行业创新。

  要了解商品识别,首先,我们可以从人脸识别这个大家熟悉的例子来切入去理解它,其实两者的本质是一样的,我们要识别不同的人脸,并从中提取相关的语意信息,而这个世界上有各式各样不同的商品,就如同有各式各样的不同的人脸一样。当我们进行人脸识别时,我们会使用领域专用语言(Domain Specific Language)进行搜索引擎搭建,而非通用的图像搜索,同理,商品识别也是一样。

  以人脸识别为例,我们需要透过人工智能分类技术去提取如性别、年龄、种族等信息,对商品识别来说也是一样的,我们需要去提取商品的某些特定属性,举例来说,在时尚领域,我们可以提取出服饰商品的材质、色彩、风格等特征,而人工智能商品识别正是码隆科技投入大量精力去钻研的领域。

  码隆科技和其他人工智能公司不同之处在于,我们提供这样的人工智能技术给所有人。

  我们不希望这样的技术仅仅是一个C端的APP,我们的信念是将这项领先世界的商品识别技术开放给其他企业,我们相信这样才能使这项技术在市场上发挥最大的影响力。

  我们成立于2014年,总部在深圳,北京也有办公室,我们专注于人工智能商品识别技术服务,致力于让企业能够将世界级的商品识别API用于他们的产品中。

  该项技术背后是拥有海量商品数据的支持,我们能够收集到针对特定行业的商品图像数据,并运用适用于特定行业的算法去搭建这些垂直领域的模型,借此产生针对垂直领域的商品识别结果,如:分类(Classification)、检测(Detection)、分割(Segmentation)、检索(Retrieval)等等。企业能够运用这些功能去搭建他们自己的商品识别服务,我们将上述提供的服务进行整合,搭建成一个人工智能平台,我们将这个平台产品命名为ProductAI,ProductAI是企业运用这项人工智能商品识别服务的入口。

  这是ProductAI的登入界面,ProductAI为企业提供最先进的人工智能商品图像识别API。ProductAI有两大核心技术:针对垂直领域检索(Vertical AI Image Retrieval)和垂直领域标注(Vertical Auto-Tagging)服务。

   事实上,我们所提供的技术可支持各行各业的海量商品检索。 针对特定垂直行业,我们提供了专业的垂直行业商品识别技术,以时尚行业为例,我们投入了大量的时间与精力在柔性商品识别这个领域。此外,在家具行业、面料纺织行业、酒类行业、版权图片行业等等我们都投入了大量的时间。你或许曾经体验过不少已上线的图像检索服务,但他们大多只是通用的图像检索服务(Generic Image RetrievalServices),而我们专注于打造针对垂直领域的检索服务,我们能了解到特定垂直行业中商品与场景的语意,及该行业最直接的问题痛点,接着我们深入到该特定垂直行业中,打造出该垂直行业最好的图像检索服务,提供给他们。这就是垂直领域人工智能(Vertical AI)。由于我们是针对特定垂直领域打造的检索服务,这样的服务所呈现的搜索结果,将会大大优于其他通用服务所提供的解决方案。

   另一个部分是垂直领域自动标注 ,现在我们能达到毫秒级的标注速度,并以非常低的成本应用到垂直行业中,并获得特定物体的描述性的属性(Descriptive attributes)标签。

  而现阶段我们面临的技术挑战是:如何能搭建一个横跨多个领域的智能识别平台系统。举例来说,时尚服装、面料行业与酒类行业有很大差别,服装面料属于柔性物体,我们可以穿戴它、可以折叠它,而酒就属于刚性物体。同时如何维护一个高速运作、性价比高的系统,让它实时处理上亿数据,同时又满足不同行业客户,和不同类别的调用请求?我们又是如何打磨一个高质量的API,让开发者切身体会到提高了他们的工作效率,并且乐于继续使用呢?

  接下来与大家分享我们是如何突破这些技术难点,有如下三个主要方法:

  第一点是算法,在每个垂直行业的基础上,我们使用多任务的深度度量学习来训练端到端的图像检索模型,以符合该垂直行业的图像数据检索需求。此外,我们拥有大量特定垂直行业的图像数据来训练我们的深度学习模型。

  第二点是我们首次提出“场景选择”(Scenario Selection)的概念,用户可在我们提供的图像检索服务中,选择自己所属行业的场景服务,用户可将其运用到自己的产品中,以获得最好的性能。

  最后一点是速度,我们花了非常多时间与研发精力在二值神经网络和分布计算,将其运用在我们深度学习网络当中,如此一来便能实现大规模且高效率的查询检索。

  这是我们ProductAI登入界面的样子,在这里,你能够在几分钟内就搭建一个自己专属的图像检索引擎,现在我为大家演示一下如何轻松搭建一个时尚搜索引擎:给这个服务创建一个名字,这看着很像与一般服饰搜索引擎很像,但其实不同的是,这个搜索引擎是你专属的,你能够用自己的商品图片是去搭建一个自己专属的图像搜索引擎。我命名服务以后,接着上传一个CSV文件,里面有着图像的URL,现在我有一个数据集,接着我要选择一个场景,在此我选择了时尚领域场景,这样的场景选择功能,能够使得最合适的模型被运用到这个数据集上。我们稍微等个几秒钟,这个数据集的索引就搭建完毕,API也就绪了,接着我们可以去测试这个衬衫的图片,这些是高圆圆的穿搭照片,大家可以看到这个搜索结果的精度是很好的。

  上述这些功能都涉及到代码,我们为大家提供了这些代码,在ProductAI平台上和GitHub上我们都提供了SDK开发包,用户可根据需求选择自己喜欢的开发语言。

  除了图像检索之外, ProductAI 还有另一项主要功能:针对垂直行业的商品图像自动标注。 我现在在ProductAI平台上为大家演示一下为时尚服饰打标签的功能,前期我们透过许多分类和标注系统来训练这个时尚标注模型,现在我们上传了这张图片,系统反馈告诉我们,这是日式穿搭风格的照片。总结一下,上述这些服务都能过透过代码与接口在ProductAI一站式的获得,并整合到你自己的产品系统中。

  刚刚我介绍了ProductAI平台是什么,接下来我们一起看看我们的企业客户基于这个平台,有了哪些实际商业应用。接下来展示的视频,虽然看起来比较简单粗暴,但都是我们在实际使用中进行实拍的,非常具有代表性。

  第一个客户应用案例是在ProductAI平台上建立的“以图搜布”搜索引擎,全中国前10大纺织面料企业,有七家都在用我们的“以图搜布”服务,包含中国最大的面料电商平台优料宝。有了面料商品图像搜索引擎,顾客只需要对着想要购买的面料拍摄一张照片,就可以得到相应的购买链接,十分便捷。其实不仅仅是面料商品,图像搜索引擎有非常广阔的行业应用空间,尤其一些难以用语言描述的场景,比如布料的花纹和质地,用视觉方式检索就会很直接。

  接下来介绍的是搜款网,中国最大的B2B服装交易平台之一。只要将服装网站上的喜欢的款式截图,复制粘贴到基于ProductAI的图像搜索引擎上,便可以迅速得到服装的批发购买链接。即使服装商品图片经过PS、翻转、变形,即使有些相同衣服的模特不同,也能够精准而完美地搜索出来。同时,同样款式的衣服可以一起被搜索出来,进行比价挑选,找到最优选择。可以说视觉搜索是批发B2B平台非常有价值的组成部分。

  名师联是一个非常大的室内设计师平台,它的愿景便是给设计师们提供无限的设计灵感。有了ProductAI平台商品识别技术助力,名师联支持对室内设计进行任意部分地单独框选,并搜索。比如视频中,随意框选设计图中的家具,就可以在数据库中找到完全一样或类似家具的设计推荐,让设计具有无限可能性。

  《光明日报》是中国最权威、有名的报纸之一,ProductAI为其提供出版物识别技术。《光明日报》嵌入人工智能识别技术后,只要对着报纸拍一张照片,便可实时识别出与之相关联的全媒体信息,如视频等,搭建起了虚拟与现实的桥梁。

  中国纺织信息中心是中国最权威的面料纺织行业机构之一,通过ProductAI平台的技术,可以实现用人工智能分析时尚流行趋势。作为权威行业机构,中国纺织信息中心需要预测流行色等未来的流行趋势,再把预测信息和整个产业进行分享,起到引领风潮的作用。而ProductAI能够自动抽取海量T台图像信息中的主体色彩,并在非常短的时间内完成颜色分析,总结出整体趋势,大大减少了人力观测成本。POP是另一家行业领先的2C2B时尚平台,他们则是把这种技术直接植入他们的网站中,用理性数据诠释每一张感性的时尚图片。

  穿衣助手是国内最受欢迎的时尚穿搭app之一。只要对着单品服饰拍摄一张照片,ProductAI便会自动系统扫描,立刻识别出单品颜色及类型,并推荐相应的穿搭方式。

   各种各样的商品识别客户案例还有很多,那码隆科技的核心竞争力在哪里呢? 首先,第三方盲测数据表明,我们拥有业界最为精准和快速的商品识技术,这是我们ProductAI平台的立命之本;第二,几百家企业客户已在ProductAI平台创造了过亿的调用量,数据安全一直是我们关注的重中之重,并以实际效果取得了企业客户们的信任;第三,从API调用的角度来说,整个体验非常优雅、简洁,接入门槛非常低,开发者们可以非常便捷地使用人工智能服务。

  为了实现这些核心竞争力,码隆科技成立两年半以来,在技术积累、数据处理和人才引进方面都付出了巨大的努力。在技术方面,我们已经拥有了有显着优势的深度学习算法研发成果;在数据方面,为了实现垂直行业商品识别技术提升,我们的模型训练数据已经超过1个亿;在人才方面,我们吸引了来自世界顶级人工智能实验室,如微软亚洲研究院、牛津大学VGG实验室、谷歌实验室、百度深度学习实验室等高级人才加入。

  接下来,我们要做什么?

  我们想为更多垂直行业解决问题。

  比如我们为AR行业完成了一个解决方案,是市场营销的好帮手。如视频所示,对着“加多宝”的罐子不论从哪个角度拍摄一张照片,ProductAI可以进行360°立体识别,然后在此基础上生成一个AR大炮,点击便可以互动进行射击,非常有代入感和趣味性。

  当大家刚刚从新闻中看到可以开始预定HoloLens的时候,我们已经完成了HoloLens的应用开发。通过ProductAI技术的接入,售货员能够在零售场景中对顾客的信息进行迅速识别,并收到智能购物建议,是一种销售的新体验。

  我的演讲到此结束,谢谢大家!

  GMIC四楼主会场码隆科技巨幅海报

编辑: 罗予岐