风口不会随便眷顾一个人。有的人跑在了一个风口的前面,却倒在了下一个风口来临之前。互联网时代加速了风口的来临,也让风口的转向演化得更加变幻莫测。跑得过风口、看得清形势,是一门想在互联网时代活下去、过得好的深奥学问。
AlphaGo横扫围棋界这一标志性事件,才让“人工智能”在2016年真正开始红得发紫。但是,早在人工智能的风口来临之前,已经有一批又一批的互联网人去探索、去创新。
云知声的创始人黄伟就是其中的一位。
语音老兵的冒险创业
黄伟在中国科技大学度过了本硕博近十年的时间,对技术的笃信和大胆的个性,让他有勇气在博士二年级的暑假自作主张更换研究方向。为了获得数据,每日只睡四五个小时,最终用一个月写完了博士论文,而他的论文内容正是语音。
2004年,博士毕业的黄伟进入摩托罗拉。彼时,人工智能临近第二次浪潮破灭节点,黄伟的许多师兄弟纷纷转行。而正是得益于进入时占全球手机市场份额40%的摩托罗拉,黄伟才能在公司充分的支持下继续从事语音方面的研发。初入职场的他,被要求用半年时间完成一款“明”手机的声纹识别系统的开发。那一年,“明”手机的全球销量有6000多万台。
黄伟在摩托罗拉历练成为一名技术过硬的工程师,但公司的命运却与他的上升滑向相反方向。2009年,黄伟所在部门被Nuance收购。同年7月,黄伟加入盛大创新研究院,2010年开始担任创新研究院语音分院院长。黄伟在盛大任职期间,盛大投入大量资金研发技术及专利,其语音团队在美国国家标准技术署(NIST)举办的声纹识别评测(SRE)大赛中,力压麻省理工、斯坦福研究中心、IBM等众多名校、名企,在在9个单项任务中获得多个单项第一,整体综合指标第一。2012年,黄伟离开盛大,继而创立云知声。
后发先至,技术要过硬
云知声于2012年成立,也是在那一年,Siri开始支持中文。
语音识别领域的厮杀在这些年显得格外激烈。国外,谷歌、亚马逊、微软都通过技术积累和收购初创公司,杀入战局;国内,百度凭借着在AI领域的提前布局独自拼夺,和黄伟师出同门的科大讯飞更是成立十多年,成为行业当之无愧的老大。
2012年前后,正处在人工智能第三次兴起的交替期。那时候,科大讯飞还没有成为网红、AlphaGo也还没有惊艳亮相,市场对人工智能最火热的讨论仍然来自于科幻电影。
后发却想要先至,信心是最重要的催化剂。在那时,极少有创业公司敢把所有身家赌在“深度学习”这件事情上。
云知声做的第一件事,就是把深度学习应用到了语音识别里,而且把它开放出来提供给了第三方。2012年9月,云知声发布了基于传统统计模型的第一代引擎,准确率上升到了85%,比当时的科大讯飞高出5个百分点。但想要再优化,就必须要有迅速获得大量、免费的数据。于是,云知声开放了自己的平台,任何人、任何组织只要在平台上注册,就可以免费使用公司的SDK(软件开发工具包);在APP里接入这一SDK,就可以免费调用云知声的语音服务。
凭借着免费这一法宝,到2013年底平台上接入的企业客户数量达到接近一万家。现在,企业客户数达到了3万家。快速的数据积累,让云知声进行了一系列数据迭代和算法优化,将识别的准确率提升到了97%。
但再好的技术,只有当它变成对用户有价值的产品时,它才有商业价值。即便技术过硬,留给后来者的机会仍已不多了。
产品落地,商业化要规划好
在听起来高大上的人工智能行业,实际的发展却困难重重。这个行业的产品难以落地,造成的结果是大多数创业公司都处于亏损状态。如果没有其他业务反哺,就很难在Google和Amazon这些巨头们的夹缝之中存活下来。如果创业公司想要获取一定的生存空间,就需要把有限的资源投入到公司正确的战略方向上,把技术做得更加商业化并持续产出。
这恰恰印证了一句话:算法只是一方面,产品如何落地更关键。随着技术上实现突破后,黄伟与核心团队一直在思索:在国内BAT和行业老大科大讯飞的夹击下,云知声下一步应该怎么走?
做APP?但流量的导入掌握在BAT手里,云知声已经不可能再用那么低的价格去实现基础设施(用户)的积累;做与科大讯飞雷同的业务?也很难从成熟的大公司手中去抢蛋糕吃,更何况在教育等领域,科大讯飞的优势地位几乎是无法撼动的。
“有行业第一,并不可怕。”黄伟意识到,任何一个公司,有它的沉淀,就有它的包袱。大公司受制于股权等因素,对很多新领域很难快速反映。必须找出一条和行业老大不一样的路,同时需要向投资人证明这条路在商业上是可行的。
2012年底,科技新闻曾纷纷展望:苹果会开发一种语音的方法解锁iPhone和iPad。云知声团队认为,这一功能将在家电上更早出现,“未来用户的形态应该是,比如:在客厅的沙发上,自然与空调对话,而不需要凑上去和它交流。”
随后,在乐视TV上、美的空调、抽油烟机上,云知声的语音助手迅速落地。回过头去看,其实只用了2年的时间,云知声就将自己的基础语音识别引擎落地并步入正轨,再用数据反哺算法,不断将其客户从家电拓展到医疗、汽车等其他领域。
“云端芯”战略,提高终端渗透率
在2012年到2014年期间,黄伟坚持的是“不做APP”。到了2014年,黄伟第一次提出了自己的“云端芯”概念,将公司定位于“一个IoT(物联网)时代的语音AI服务商”。“云端芯”战略,他又有两个排除:不能只做联网方案、不能只做手机方案。
黄伟从创业初期就坚信,手机不会是语音识别的主战场。人们肯对着音箱、冰箱、马桶、抽油烟机说话,是因为这些产品是没有屏幕的,但手机还是基于屏幕的,它更常用到的交互方式是“触碰”而非声音。
为了做物联网,云知声在2014年引入高通成为战略投资方;同时进行内部架构的调整,成立了IoT事业部,占当时总人数的一半以上。在2016年2月,AlphaGo还未打败李世石,云知声又成立了AI Lab。
云知声的云端芯服务主要分为三种:1)有芯片级技术,比如说冷唤醒和打断等;2)有终端软件的交互层面,比如,开车时网络不好,还会提供纯离线的方案;3)还有一些复杂的请求走云端。最后的解决方案是考虑了有网络、无网络等所有环境,并不是只卖一个芯片或者云端SDK。有了这样的安排,芯片不仅可以收集信息,还可以承担一部分智能的功能,解决基本的需求。
“智能家居人机交互的正确做法恐怕最后不会是APP。”黄伟说,它可能会是一个全新的增强设备,甚至最终取代手机。不过与亚马逊从中控开始做的方法不同,云知声还是希望先从终端渗透率不断增加着手,培育用户的习惯。
流式交互与AI集中化
随着亚马逊智能音箱Echo销量逼近千万,预装在Echo内的个人虚拟助手Alexa一跃成为“全球范围内截至目前最为成功的消费级AI产品”。国内阿里、百度、腾讯、华为、小米、联想、海尔、科大讯飞和创业领域已有超过200多家公司正在研发类似Echo的智能音箱。
Amazon Alexa采用的技术原理是“单句指令式交互”,而在黄伟看来,这不是语音助手应有的模样。“你问‘Alexa,北京天气怎么样’,然后你不能接着说‘上海的呢?’你还必须说‘Alexa,上海天气怎么样?’”
黄伟认为自己的产品应该做到“流式交互”——对话如行云流水般顺畅,云知声的Pandora语音中控完整技术方案的真正价值正在于“一次唤醒多轮跨领域交互”,且一次唤醒后可以任意的“免唤醒打断”。
黄伟认为,Pandora更高的技术要求需要AI集中化作为前提,一定要把硬件、软件、服务,麦克风阵列、信号降噪、语音识别和理解等各种技术紧密耦合在一起。例如,一个做麦克风阵列的公司和一个做语音识别引擎的公司对接,前者的技术目标是降噪使人耳听起来清晰,但人耳的听觉机理和机器是不一样的,对后者而言,前者的信号处理是黑匣子,最终效果就只有60分。
在黄伟看来,今天很多IoT(物联网)时代的产品经理还抱着移动互联网时代产品经理的思维做事,像做APP一样分解外包;然而,手机芯片早已标准化,智能终端却可能是汽车、音箱、TV、手表……产品千差万别,每一块技术的资源、能力、参数、标准、目标都是天壤之别,“外包整合”必将导致上下游间巨大“摩擦力”——环节之中存在大量黑匣子,“只要一个地方堵住了,整个管道全堵住了”。
正因如此,人工智能行业短时间内很难出现真正的“操作系统”。
在黄伟看来,人工智能时代的产品经理一定要知道每个技术的特点是什么,技术不是单点突破的,一定要端到端打通,不让任何一个环节成为黑匣子。团队的稳定和长期的打磨都是Pandora实现这些能力的重要前提和保证。
融资后的挑战
2013年,云知声完成了1亿元A轮融资;2014年,完成5000万美元B轮融资;2015年底,完成数千万美元的B+轮;2017年8月17日,获得3亿元人民币的战略投资。目前,云知声的合作伙伴数量已超过2万家,覆盖用户达2亿,其中语音云平台覆盖的城市超过647个,覆盖设备超过1亿台。
云知声不断探索新的产业形态和业务模式,广泛尝试了语音与物联网以及其他行业的关联跨界,形成了自身的主营方向,目前已在智慧生活(家居、车载、机器人等)和智慧服务(医疗、教育、司法等)等场景落地。
在智能家居领域,云知声结合技术与工程优势成功达成与多方知名品牌的合作,包括美的,格力,华帝,海信的产品均搭载了云知声AIOS@Home智能解决方案,出货量超百万台。
在智慧医疗领域,云知声的主要竞争者是科大讯飞。作为国内首家医疗专业领域云服务提供商,云知声在国内首次提出语音病历解决方案,已在北京协和医院、福建省立医院等国内近200家完成测试并陆续上线。同时,云知声还与平安好医生成立合资公司——上海澔医智能科技有限公司,布局移动医疗,打造医疗智能硬件。
在智能车载领域,云知声提供驾驶场景下一站式智能语音交互方案及云服务。已服务近百家方案商、品牌商,在车载后装市场上占有率超过70%,位列第一。
在智能机器人领域,云知声推出儿童陪伴机器人(KAR),配备软硬结合的面向儿童陪伴的机器人一站式方案。2017年8月份量产,智伴、康力优蓝、小桔灯、亿家智宝、未来智能等多家行业标杆客户搭载云知声KAR方案的产品。
在智能教育领域,云知声采用先进的语音评测技术和自然语言处理技术为客户提供全方位智能化的语言学习产品后台服务。利用云计算技术,云知声将自动口语评测服务放在云端,并开放API接口供客户远程使用。在智能口语评测市场,云知声将直面科大讯飞、驰声科技、清睿教育、一起作业等超过10家的主要玩家。
未来,急速狂奔中的云知声如何一骑绝尘,成为行业中当之无愧的佼佼者,我们拭目以待。
网易刊登此文仅出于传递信息之目的,绝不代表网易赞同其观点或证实其描述。相关知识
云知声:我们是如何与风口赛跑的
云知声将发布智能家居语音交互完整解决方案
云知声 UniToy牵手微软小冰 让小冰姐姐给宝贝们讲故事
专访|康恒:聚焦IoT,云知声以自研AI芯片赋能更多终端
人工智能助力智慧生活 云知声参展AWE2018
世界侨商中心是如何与“桥”结缘的?
智能IN家居,云知声让生活回归本“智”
云知声让用户零成本体验智能家电语音操控服务
雷柏布局智能终端 与云知声达成战略合作
云知声为乐云记事提供智能语音解决方案