中文Siri们的出身

       iPhone 4S在发布之初,本被认为是苹果智能终端中最鸡肋的诞生,你能看出它和iPhone 4的区别吗?事实是,只要你开口,它会给你一个神奇的世界,语音识别开始逐渐成为颠覆目前的计算机交互接口。
       世界不能只有一个Siri,或者再加个Google Now,中国智能终端上的语音入口在哪里今天,小编就为国内的中文Siri们做一番梳理。近日市场上炒的较为火热的语音应用包括科大讯飞的灵犀、搜狗语音助手、智能360、虫洞等等,还有几天前盛大发布的“百灵语音助手”,小i机器人,更早的有讯飞语点、神州图骥009。如果细数,目前,在中国市场上的语音玩家,大致可以分成“一龙”“两虎”“群狼”。
       一龙:科大讯飞
        “讯飞语点”与“讯飞语音助手”,还有近期和中移动联合发布的“灵犀”产品,这三款产品均隶属于科大讯飞的“移动互联网事业部”。该事业部是科大讯飞旗下六大事业部中唯一参与ToC业务的、也是科大讯飞最年轻的事业部,同时还是科大讯飞上市公司旗下唯一不产生营收的事业部,其余的五大事业部均从事ToB业务。科大讯飞目前的三大业务核心分别是:①解决人人、人机的无碍沟通,②深挖教育领域,③着眼于国家安全。公司已将移动互联事业部独立注册了公司命名“讯飞互联”,公司在北京的注册资金高达5000万,但讯飞互联的架构仍处于ToC模式的初级阶段,如目前公司并无独立的市场和公关部门,产品市场推广力度有限。
       双虎:百度和搜狗
       和员工近2000人的科大讯飞比,百度与搜狗在语音方面的投入仍是轻量级的。它们与讯飞相比,显现出相似的竞争优劣势。识别方面,二者无论投入如何,在短期恐怕与科大讯飞都会存在者一定差距,但在内容问答较量中,百度搜狗在搜索和服务数据积累上的优势无疑成为科大讯飞的痛点。不过,在与讯飞PK之前,百度与搜狗其实是更直接的对手(从目的性上,科大讯飞更注重人机沟通层面,而百度和搜狗则是更注重最终的服务生态,它们与讯飞根本不是一个层面的战争)。搜狗胜在快。但百度的胜算在于其搜索的积累与知识图谱的建设。
       但百度后发未必不会先至。由于搜狗的语音团队不过100余人,所以在前端的语音识别方面仍采用的是第三方的软件,相比来讲百度的投入约是前者的两倍,同时据百度的公开表态,其自身的语音产品,从语音识别到最终的内容问答均是自主研发,这样的好处在于,每一步运算中的算法可以相互的融合,可以更好的提供搜索结果,当然也需要更久的研发时间——可见百度的厚积薄发有着自己的道理。
       群狼:有头有脸的神州图骥009,和“血脉相通”盛大语音、云知声,“草根兄弟”虫洞、智能360
       神州图骥009的形象是一只能说会道的中华田园犬,是最早在苹果APP Store上架的,开创了中文siri的先河,这主要是因为009把Untiy3D 和智能语音相结合,首次将文化导入GIS信息并通过LBS触发,通过创新性的中文语义搜索引擎对独占数据资源进行检索。
       神州图骥是一家以文化为导向、以科技为支撑,以地理信息产业为基础的复合型文化科技公司。神州图骥以国家地名数据库为依托, 为解决移动互联网领域的内容短板和浅薄,利用最新科技手段,在移动互联网时代打造丰富多彩的移动应用产品,占领新型文化传播阵地,让社会文化生活更加丰富多彩。神州图骥坚持开放性、合作性的理念,打造开放式的Open API平台。神州图骥为平台开放多种应用功能和资源接口,使用户享受到越来越多的应用产品和内容服务。用户通过丰富多样的应用产品实现对云计算数据平台的访问交互,获得导航、地名文化、文化伴游、数字出版、网络游戏、互动动漫等应用层服务。
       盛大曾是在语音识别技术上最接近科大讯飞的团队。曾就职于摩托罗拉,开发了世界上第一款手机声纹认证系统的黄伟博士,在2009年便加入了盛大创新院,而后黄伟则在今年的四月低调的离开了创新院,低调到甚至连一条新闻稿件都无法搜得。至于如今的盛大语音团队,已然是大换血,而整体团队也直接从创新院剥离至了陈大年的盛大掌门科技中,在其几日前发布“百灵语音助手”的通稿中甚至看不到负责人的名字。
       2012年6月,自称专注于智能语音及语言处理技术的移动互联网公司云知声成立,成立仅四五个月后,被搜狗相中,成为搜狗语音助手的合作方。结合盛大语音团队离散与云知声团队的成立时间,可以推断云知声团队里,一定留着盛大的血液。,盛大语音和云之声更多的投入是在前端的语音识别技术之上,与之相对的则是虫洞和智能360这对在后端发力的“草根兄弟”。
       这两支团队的技术背景、20余人的团队规模、500万的用户量,甚至未来的前景都将极其的相似。目前两只团队所做的业务,都是在后端的技术开发上,由于没有搜索引擎的积累,所以无法提到“知识图谱”的量级,能做到的只是生活服务相关的业务。
      虫洞语音助手于今年3月份上线Android版本,它的四位核心团队成员均毕业于北京交通大学,公司CEO俞志晨和COO郭家俞更是同班同学,毕业之后在创办北京光年无限科技(即虫洞的公司实体名称),俞志晨、郭家又一起在中软公司担任机器翻译的工作,同时均为中国模糊数学奠基人贺仲雄教授的关门弟子。
       智能360团队的两位创始人CEO何永和COO李传丰曾并肩备战过北大的研究生考试,但双双落榜。经过了一番辗转,最终做出一个语音备忘成为智能360的雏形,在2011年10月软件便正式发布那时应用的名字还叫做“语音360”,而公司的组建则是要在2011年12月拿到第一轮天使投资300万之后的事情。成立公司后,李传丰认为,语音360的想象空间很有限,公司有实力做具备云储存的软件,因此智能360的概念走向了前台,目前智能360的安装量达到了500万,据统计有17%的用户是通过口碑传播而下载的。
       上面提到,虫洞与微软有可能进一步合作,而智能360,业界也有其被巨头注资的消息。
       结语:
       从目前的的语音应用市场来看,这几家公司应该最终会走上3条道路:
       第一条:科大讯飞凭借语音识别和运营商资源,成为交互的第一入口,但可能也就仅限于此,后面的业务还是由API接口来负责更加合理。
       第二条:搜狗、百度二者最终会形成类似Web端的稳态,成为强后端的产品,其中百度还有可能结合LBS事业部的O2O业务发挥想象,补充一句,360应该迟早也会进来。
       第三条:傍大树,将是云知声、虫洞、智能360甚至其他类似的“小虎们”,将走上的必然道路,在移动互联网这场战争中,很难形成小而美的存在。而有可能成长为独立门派的则是神州图骥和盛大掌门科技,因为他们有产品、有基础、有多年的平台积累。
转自腾讯