从“鸡同鸭讲”到科大讯飞 人工智能风生水起
广州琶洲互联网创新聚集区效果图。广州日报全媒体记者邱伟荣、王维宣 摄
在2017广州《财富》全球论坛华盛顿推介会圆桌对话上,科大讯飞高级副总裁杜兰博士对话世界500强。
当你想和外国朋友对话,却无法用外语交流时,怎么办?当你的手机来电而你却双手负重无法接电话时,你又该怎么办?……人类90%的信息输出依靠语言,然而,超过70亿的世界人口,使用着超过6500种语言,而其中83%的人只能说1至2种。从个人交往、文化交流、商业往来,到外交事务,经常会因语言隔阂发生“鸡同鸭讲”的尴尬与笑话。如何让机器能听会说、能理解会思考,让传统产品更智能,是全球人工智能领域的重要目标。
从十几年前由大学生所创立的小公司到亚太地区最大的智能语音与人工智能上市公司,科大讯飞成功证明了中国企业在世界智能语音领域的领先地位。站在人工智能产业风口,广州也在向人工智能领导者加速飞奔。人工智能商业战略创新专家吴霁虹认为,科大讯飞、亚信数据等行业龙头带来的创新技术,助推广州成为全球人工智能应用高地。而借助广州的平台将迅速向珠三角制造业延伸并辐射,人工智能将从创新要素转化为创新型的生产力。
文、图/广州日报全媒体记者倪明(署名除外)
初心:中文智能语音中国人要做到最好
在 2000 年以前,中国的语音产业全部控制在国外巨头手上。1998年,中科大大五学生刘庆峰带队参加国家“863计划”成果比赛,他设计开发的语音合成系统不但保证了音质,还具备了优良的语音自然度,合成的语句近乎“人声”,成了当年比赛中最为轰动的科研成果。
时任微软中国副总裁李开复准备把微软奖学金给刘庆峰,条件是要到微软工作一个月即可,却被刘庆峰拒绝。研究智能语音的刘庆峰不服气:中文语音技术要由中国人做到全球最好,中文语音产业要掌握在中国人自己手中!1999年毕业后,刘庆峰召集17个同学,创立了后来的科大讯飞。那年,他26岁。十几年之后,在科大讯飞语音云开发者大会上,李开复感慨地说,刘庆峰是这么多年来唯一拒绝过微软奖学金的人。
适逢以技术研究为主的人工智能第二次浪潮结束。在人工智能最艰苦的时候成立的科大讯飞在黑暗中摸索前进道路。就在公司成立的第一年,以技术见长的刘庆峰迎来了创业路上的第一次重创。
当时,科大讯飞开发出一款电脑桌面软件,试图把手写输入的随意性、键盘输入的准确性和语音输入的高效性完美结合起来,用语音控制电脑。“这在当时确实令人耳目一新,”刘庆峰回忆道,“这款产品拿去参加展会时非常受追捧,顾客看产品时满意度一度可达100%。”
但随后的市场效果却让大家大跌眼镜。“用户自己操作时满意度瞬间降至30%,投入的资金血本无归。”刘庆峰说,当时公司账上只剩下十几万,而所有员工一个月的工资要20万。“当时正赶上过年,我们最后是借钱发工资,可以说已经断血了。”
惨败之后,刘庆峰想了好几天。科大讯飞背后是中科大语音实验室和863项目组,技术不是问题,问题最可能出在商业模式上。经过公司讨论,刘庆峰决定放弃当时的B2C模式,转向为有渠道、有市场的大公司提供核心技术的B2B业务。“科大讯飞只负责开发引擎、语音合成和语音识别芯片,而应用集成则由下游的开发商或客户自己完成。这一模式也就意味着越来越多的市场主体进入语音的产业链当中。”
定位确定后,刘庆峰和他的团队抓紧时间进行系统修改测试。终于在2000年,柳传志将联想进入风投产业后的第一单投给科大讯飞。
创业之初一度非常痛苦,整整一年几乎颗粒无收。是去是留,人心惶惶。2001年,科大讯飞为此专门在巢湖半汤召开会议。“这是科大讯飞第二个最艰难的时期。”刘庆峰回忆,当时很多股东都在质疑,语音市场到底有没有前景?要不要做来钱快的房地产业务?“当时我对员工说,不看好语音的人请离开讯飞。”结果团队无一人离开。
2004年,在语音市场上咬牙坚持了5年的科大讯飞终于扭亏为盈,开始进入发展的快车道。2006年之后,其语音合成技术和语音识别技术陆续在多个国际专业大赛上拔得头筹。2008年,科大讯飞成功登陆A股中小板。
二次创业:广州是“A.I.+”应用做得最好城市
人工智能历经了三次跌宕起伏之后,终于迎来了“产业爆发”的前夜,而这一次,中国将不再缺席。继2016年国务院发布《十三五国家科技创新规划》,人工智能成为核心看点后,今年人工智能又首次被列入政府工作报告。国务院印发《新一代人工智能发展规划》(以下简称《规划》),明确了我国新一代人工智能发展的战略目标:到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。广州市果断紧抓这一波人工智能产业浪潮,着力新兴产业“IAB”发展计划:人工智能产业不仅要通过项目构建产业链,更要打造产业生态圈。亚信数据全球总部、微软广州云暨移动应用孵化平台、华南技术转移中心等企业集聚南沙,更使广州大数据产业和人工智能在“快车道”上加速前行。
此时的科大讯飞虽逐渐从细分的智能语音行业龙头成为国内AI研发的领军者,在一些具体应用场景的技术结果上实现了国内外AI巨头的超越。但如何从合肥走向北上广深?其科学基因如何从“to B”转向“to C”,离消费端更近?刘庆峰由此喊出了“AI时代科大讯飞要二次创业”,并将这一重望寄托于广州。
2015年,杜兰离开入行15年的通信界,上任科大讯飞高级副总裁,成为科大讯飞二次创业、实现千亿市值梦想的“拓荒牛”。对于为何科大讯飞选择广州二次创业?“广州是‘A.I.+’应用的最好城市”,杜兰向广州日报记者表示,广州开放、包容的城市文化的精髓,给了人工智能大舞台。“广州有最大力度的政策扶持,最雄厚的产业基础和最优秀的政府服务创业服务,科大讯飞,也是看中了广州产业孵化的优势环境,将企业二次腾飞的中心放在广州,我们在这里建设华南总部,两年孵化了两家企业,还将在这里建设全球智慧考试中心,打造智慧医疗应用样板城市。”
“可能在讯飞的这些日子,我飞过的里程和走过的路,超过了过去的总和。”杜兰说,仅仅是2015年,她每天行驶的里程超过180公里。两年多的时间里,杜兰带领的科大讯飞华南总部的团队,从创始之初的3人,发展到今天包括并购及孵化的公司在内的700多人。
计算机可以像美国人一样念英语
如今,科大讯飞不仅是我国唯一的语音产业“国家863计划成果产业化基地”,亚太地区最大的智能语音与人工智能上市公司,在世界智能语音领域也处于领先地位。在国际最权威的语音合成比赛暴风雪竞赛(Blizzard Challenge)中,科大讯飞不仅以语音合成技术率先超过4.0分的成绩连续12年蝉联全球第一名,而且是全世界唯一能让语音合成技术能够达到真人说话水平。
语音合成技术率先超过4.0分是什么概念?“5.0分是播音员,4.0分代表美国普通老百姓的发音水平。科大讯飞的语音合成技术是唯一超过4.0分的,说明中国人做的计算机可以像美国人一样念英语——迄今为止,只有中国人能达到真人的水平。不仅如此,今年暴风雪竞赛新添了一个项目——无监督的机器学习,科大讯飞不仅是全球第一,而且和第二名的差距比传统方法的差距更大。”科大讯飞董事长刘庆峰说:“这充分证明了:我们在机器的自主学习方面取得了全球瞩目的成果。”
除了能帮助人们实现语音输入、语言互译,还可以重现、保存人类方言——目前世界上现存约6000种方言,而平均每两周就有一种方言消失。刘庆峰介绍说,现在科大讯飞的方言识别已经有22种,是全世界唯一能够做多种方言识别的核心技术厂商。在中国方言识别方面,方言识别准确率超过90%的已经接近十种,包括粤语、四川话、东北话、河南话、天津话、山东话、贵州话、宁夏话等。
今年科大讯飞登上全球50大最聪明企业榜单,并在50家企业中排名第六,在所有上榜的中国企业中排名首位。最近,在首批四家国家新一代人工智能开放创新平台名单中,科大讯飞作为智能语音国家新一代人工智能开放创新平台,与BAT三家一起共称为“BATI”人工智能国家队。
从一家“优点是低调,缺点是过于低调”的高科技公司,到成为广州创新力量的代表,这就是科大讯飞华南公司成长的最佳写照。更令杜兰自豪的是,广州市驻美国硅谷办事处正式挂牌科大讯飞美国公司,这是广州首批驻国外办事处之一。“科大讯飞可以成为广州在硅谷整合创新资源、挑选行业人才、孵化人工智能产业的窗口和桥梁。”
“广州有能力成为中国人工智能的创新高地”
在杜兰看来,最终还要有行业专家带动。“人工智能在各个细分领域的应用创新,需要与行业专家合作,由顶尖专家制定标准,把他们的知识和智慧聚集起来,供机器学习和训练,让机器具备最优秀人类的能力。”杜兰坦言,行业专家需要不断迭代数据,不断校验数据和学习训练的方法,需要花大量时间和精力。
比如,在医疗领域,他们通过让机器向顶级专家学习,然后让人工智能能够达到一流专家的水平。“让AI在专家的帮助下得到成长,同时进一步优化的人工智能也能够反过来帮助医生做更多力所能及的事情,减轻医生的工作负担,互相助益。”杜兰说。
不久前,年轻的科大讯飞智慧医疗团队完成了一项“不可能完成的任务”——科大讯飞“智医助理”机器人以456分的中高水平成绩,通过了2017年临床执业医师综合笔试测试,成为全球首个通过“医考”的机器人。
“科大讯飞已将智能语音和人工智能技术应用到智慧教育、智慧医疗、智慧城市、智能车载、智能客服等各个领域,先后和广州、珠海、佛山、深圳、东莞、阳江、河源等 7 个城市签订战略合作协议。”杜兰兴奋地说。科大讯飞华南人工智能研究院将引进总部包括研究院副院长在内最优秀的科学家团队等科研人才,实现科研人才的本地化打造。
在琶洲岛上,科大讯飞华南总部大楼正拔地而起,构筑一群追梦人的新空间。站在落地窗前,眺望珠江两岸,杜兰展望着新兴产业的未来发展:“人工智能即将像水和电一样,无处不在。IT 产业第六次浪潮,万物互联的人机交互入口,就是智能语音。如果通过我的努力,让山村的孩子们能够讲出一口地道的美语,享受到智慧教育的公平;让老百姓能够通过我们的智能社管平台足不出户就能办理多项业务,享受到智慧城市的便利;让医生借助门诊语音电子病历系统,解放他们的双手,享受到智慧医疗的效率……让世界聆听我们的声音,让人工智能建设美好世界,这就是我的梦想。我相信,广州有能力成为中国人工智能的创新高地、产业集群和应用示范地,成为真正的人工智能之城”。