科大讯飞的「AI造工厂」

以智能语音为切入点,科大讯飞用20年的时间锻造了一张人工智能的王牌。

出品/新摘商业评论

撰文/子雨

“Hi ,大家好,今天非常开心来到科大讯飞新品发布会,一直好喜欢科大讯飞哦,希望可以跟大家一起开启新的A.I.旅程,加油加油加油!”未见其人,先闻其声,难不成是志玲姐姐来到了现场?

没等大家回过神,老罗的声音又出现了,“好久不见了大家,全世界都知道我最近很低调,但科大讯飞的发布会无论如何都得参与,是吧。”

这究竟是邀请了几位大咖?带着疑问,科大讯飞的董事长刘庆峰现身了。身着黑色西装,白色衬衫,迈着坚定的步伐走上舞台,一人分饰三角的刘庆峰一出场就给大家留下了深刻的印象。

董事长刘庆峰刚刚上演的这一出“变声秀”正是科大讯飞智能语音技术的最新展示。这项全新的音色转换技术在voice conversion Challenge 2018国际音色转换大赛中获得全部指标第一名,也是音色和相似度上唯一一家超过4.0MOS分的系统。

29年前,年仅17岁的刘庆峰做出了人生第一次重要抉择,放弃清华大学汽车工程系的保送名额,进入中国科技大学电子工程系学习。

幸运之神似乎总是对天资聪颖的人格外眷顾,进入中科大的刘庆峰依旧延续着学霸的人设,为了考取全额奖学金出国读研转入了数学系,又在大二获得了人机语音通信的博导王仁华的青睐,顺利进入到实验室从此开始了近三十年语音领域的技术研究。

科大讯飞就脱胎于以刘庆峰为首的一支由18位中科大毕业生组成的创业团队。不过对于一群技术大牛来说,面临一个关键问题是,技术如果不能具象为产品应用到现实消费场景中就永远是空中楼阁,更妄论创造经济效益。

从高科技转换成产品,再到转换为大众产品之间存在着巨大的鸿沟,想填补这一道道鸿沟只能不断打破自我边界,重塑竞争力。

在人工智能战略从1.0时代进入2.0时代的档口,如何踩准时代浪潮不被新生事物覆灭成为所有科技企业的新命题。

而作为人工智能领域的“骨灰级AI语音玩家”,刘庆峰与科大讯飞已经走过了二十个年头。

一、深耕TO B等风来

“我觉得科大讯飞是有源头技术的,而且是中国自己的上市公司。”

在一次公开访谈中,刘庆峰如是说道。科大讯飞是含着金汤匙出生的,1999年,在那个独角兽称号还未盛行的年代,科大讯飞就获得了合肥市政府牵头的3家投资机构共计3000万人民币投资,并很快推出了首款TO C产品语音转换文字软件“畅言2000”。

理想很丰满,现实很骨感。只重技术缺乏足够的市场认知与运作经验,这款面向消费市场的产品最终折戟,甚至一度让科大讯飞陷入了破产的边缘。

刘庆峰与团队重整旗鼓,开了个半汤会议后决定把主营业务转为面向企业客户服务的TO B战场。1996年刘庆峰与团队就曾为华为提供语音技术服务赚到了4万元,4年后他又一次把华为视作科大讯飞转型TO B的突破口。

经过多番努力,在满足了华为的系统兼容性要求后,科大讯飞顺利拿下了华为的长期订单,趁热打铁又相继拿下了中兴、联想,还与奔驰宝马等多家汽车厂商合作,服务产品覆盖车载系统,智能家电和电子玩具等多个领域。

这次策略调整让科大讯飞进入了发展快车道,连续十八年摘得国际语音合成大赛的全能冠军,连续十二年蝉联全球顶级语音合成比赛第一名,在语音合成,语音识别,机器翻译,自动驾驶图像理解,自然语言理解等方面的国际比赛中多次刷新全球纪录。

2002年开发出了语音芯片,2005年-2007年科大讯飞净利润复合增长率超过了130%,2007年净利润5300万,营收2亿元,2008年成功在深交所上市,成为人工智能第一股。

从资本市场来看,科大讯飞在十年前就已经实现了成功企业的定义,不过在刘庆峰看来,科学家精神与企业家精神的双结合才是未来商业领袖的必备条件,战略与梦想才是他摆在企业发展的首个核心要素。

这种民族企业的历史感和使命感直接反映在了讯飞十五年后的战略升级上。2014年科大讯飞提出了“讯飞超脑”计划,口号从“能听会说”变成了“能理解、会思考”,使命也迭代为了“用人工智能建设美好世界。”

人工智能是引领新一轮科技革命和产业革命的战略性技术,具有溢出带动性很强的头雁效应。刘庆峰也提到,“源头技术在全球的顶尖竞争中,未来只有第一没有第二。”

正是源于这种争第一的焦虑感让刘庆峰从未停止技术研发的脚步,推动讯飞从智能语音到人机交互再到基于视觉呈现的语音交互逐渐迈入人工智能的深水区。

踩着科技的浪潮,在产业互联网大热的当下,深耕TO B领域多年的科大讯飞又一次站在了历史的交叉路口,面临着新的机遇,也迎接着新的挑战。

二、「B + C」换挡加速

在人工智能领域,离开核心应用场景谈技术的都是耍流氓,这在一定程度上解释了科大讯飞起于TO C,发力TO B,又回归TO C的发展路径。

在科大讯飞的产品体系中,可以大致划分为TO B和TO C两大类。TO B市场的增长点主要来自于智慧教育,智慧城市和智慧政法,TO C市场却一直没能打造出一款为大众所熟知的爆品。

过去讯飞依靠为企业提供技术与服务,一直处在产业链的上游,与C端消费者有些距离,这也导致讯飞在用户心中没能留下强烈的品牌印记。如今掌舵人刘庆峰也意识到了这一问题,“如何把一个最好的核心技术,以最快的方式推送到亿万用户中去,这方面我们还需要进一步加强。”

此前,讯飞针对C端就推出了电信增值业务产品,移动互联网产品和服务,以及讯飞输入法、灵犀以及相关的移动互联网服务、讯飞开放平台等。在智能硬件方面,推出了翻译机,智能音箱、机顶盒遥控器、魔飞麦克风等相关产品。2017年年底,刘庆峰提出要从强技术的To B市场向To C端发力,再次强化了对C端产品的投入。

这种策略转变也直接体现在了讯飞的财报数据中。2018年财报显示,科大讯飞TO C业务全年实现营业收入25.17亿,同比增长96.54%;实现毛利12.96亿,同比增长70.77%;TO C业务在整体营收中的占比也达到31.80%。

今年的新品发布会上,科大讯飞又相继推出了讯飞智能办公本,讯飞智能录音笔以及转写机,翻译机3.0等多款产品,在C端用户的商务场景中发力,打造专业高效的办公体验。

(讯飞转写机)

仔细梳理科大讯飞的产品体系会发现,科大讯飞一直在下一盘人工智能的大棋。从围绕智能语音开展的移动互联网到智能硬件和机器人,再到垂直领域的教育、汽车电子、医疗、智慧客服、智能家居、智慧车载、智能硬件……处处都渗透着以人机交互为核心的人工智能场景应用。

(讯飞翻译机3.0)

在政法赛道,科大讯飞与公安部、最高法、最高检都有战略合作以及联合实验室和专家资源的整合。今年1月,科大讯飞还在上海首次推出了公开的人工智能辅助判案系统,帮助检察官和法官提高审判效率。

在教育领域,科大讯飞积极与各大高等院校合作,致力于将AI技术从各个角度切入,更好的服务教育,还与教育部考试中心共建了联合实验室,满足自动批改、综合评价需求等。

医疗领域,依托科大讯飞的人工智能技术,国家卫计委与安徽省共同揭牌了中国第一家人工智能医院——安徽省立智慧医院人工智能辅助诊疗中心,目前已经接入了50多家医院。

2018年财报中,教育产品与服务板块实现营收20.15亿元,占公司收入比例的25.45%;信息工程业务实现营收12.92亿元,营收占比为16.32%;政法业务实现营收10.36亿元,营收占比为13.08%。 “教育产品与服务”、“信息工程”和“政法业务”成为了科大讯飞营业收入的主要来源。

而这些成绩的背后,都要归功于科大讯飞在智能语音和人工智能领域的多年积累。科大讯飞执行总裁胡郁曾提到,虽然人类获取信息80%来自于视觉,但输出信息的90%是通过语音。

尤其在人机交互变革催动的人工智能时代,想要把信息传递给机器,语音依旧是人机交互最自然的方式,能够有效促进人工智能与各行业的结合,让人工智能更容易进入大家的生活。

这些年,科大讯飞也一直按照人机交互方式的演变去建立企业自身的人工智能生态系统。

三、「骨灰级AI语音玩家」的生态之心

破坏性创新之父——克里斯坦森提出:“大公司卓越有效的管理对于延续性创新的成功具有决定性的作用,而破坏式创新能够让创业公司和小公司拥有颠覆现有产业链的能力。”

近几年科大讯飞因为这样那样的事件不停被放在舆论的火炉上炙烤,人们渐渐忽视了这家人工智能概念股的龙头企业在业务能力上的精进。

在麻省理工学院主办的《MIT科技评论》中,科大讯飞入围了2017年“全球最聪明50家公司”,并且在人工智能领域排名第六。而早前格隆汇做的一个调查,询问谁是你心目中的“上帝下注的公司”,科大讯飞也是唯一入围的A股公司。

尤其人工智能领域的竞争从不温情。BAT磨刀霍霍,百度All In人工智能,成立了专门的国家级实验;腾讯则高薪挖来张潼博士,担任腾讯AI Lab负责人;阿里成立了达摩院,还宣布投入1000个亿搞人工智能。除此之外,还有Nuance,Google等一众外企虎视眈眈,摆在科大讯飞面前的挑战,只会越来越大。

不过在刘庆峰看来,只有成为商业生态系统当中的核心节点,整合各种资源,并且把整个系统带动起来实现共赢才是伟大的、有影响力的公司,恰如PC时代的win-inter体系,google搜索加广告体系,移动互联网时代的苹果体系和石油领域的美孚。

今年AI开始进入应用红利兑现年,人工智能进入了“人工智能+”的2.0时代。

科大讯飞想用“平台+赛道”构筑起以消费者为中心的AI生态系统,实现开发者、传统企业、互联网企业、人工智能企业等各参与方共同分享的生态系统,将每一项成熟的人工智能技术赋能到合适的商业模式上,与生态伙伴互利共赢。

iFLYOS成为讯飞产业生态最具象的载体。在今天的新品发布会上,科大讯飞推出了智能语音云端操作系统iFLYOS2.0,基于讯飞20年语音识别和语音合成的人工智能核心能力,新增了21种方言识别、语句中英文混合识别;支持全双工,让智能设备可以和用户连续对话,通过AI赋能助力开发者打造自己专属的操作系统。

心之所向,行之所至,在蓬勃的AI浪潮中,与更多志同道合的合作伙伴一起构建AI产业生态,是科大讯飞新的历史使命,也是二十年不变的坚守与初心。

原创文章,作者:产业家,如若转载,请注明出处:http://www.chanyejiawang.com/?p=1560

发表评论

电子邮件地址不会被公开。 必填项已用*标注