首 页 科技文化 政策法规 企业与人才 风俗特色 旅游娱乐 科技项目 金科热链


                   中英文语音合成项目

  项目公司成立于2000年10月18日,注册资金1000万元人民币,是一家专业从事汉语语音技术研究与应用的高新技术企业。公司专注于语音合成、语音识别、人工智能领域的研究和应用,其技术和产品已广泛应用于语音互联网、计算机通讯、嵌入式设备、应用软件等相关领域,已在市场中取得一定地位,并且展现出良好的产业化前景。立足中国,走向国际市场,开发提供出国际第一流的中文语音合成技术、发展成为中国第一流的语音技术及方案的供应商是项目公司不懈追求和努力的目标。

  项目公司开发的中英文语音合成项目(中文商业标准名称为“中英文动态文本自动播音器(Chinese and English Text to Speech)” ,简称为TTS),是语音合成的核心产品,它的功能是:把收到的文本变成一个自然声音的语音流。

  该产品在研发过程中曾得到国家科技部中小企业创新基金、北京市科委、北京市经委、北京市中关村科技园区的大力扶持,并被列为2000年中关村科技园区十大IT 创新产品、北京市火炬计划项目、国家级火炬计划推广项目。

  项目公司自主开发的中英文语音合成项目(中文商业标准名称为“中英文动态文本自动播音器(Chinese and English Text to Speech)” ,简称为TTS),是语音合成的核心产品,它的功能是:把收到的文本变成一个自然声音的语音流。该语音合成技术是一项能让计算机"说话"的技术,具有优良的语音合成质量,其音色清晰流利,自然度高,并具有中英文混读、音库大小可调节、音色可转换等特点,达到了国际领先的水平,在CTI、嵌入式操作系统、应用软件等多个领域将有着广泛的应用前景。

  该项目知识产权归属于项目公司,核心开发人员皆为公司的员工或股东成员。已申请两项国家专利。它是由中科院该领域的知名科学家领衔开发,同时吸纳了中科院其它单位和清华大学在相关领域内的经验教训。相对于竞争对手的技术,它的主要技术思路是:利用中文语言本身的韵律特征,把文本变成像真人一样念出的句子。由于采取了这种思路,所以这个产品的特点是:自然度较高,有较好的抑扬顿挫的感觉;同时不需要过分庞大的语音库。可以运行在计算能力弱、内存小的嵌入式系统上,比竞争对手简单采用大音库的方法,具备更强的核心竞争力。

  从发展的角度来看,这种技术思路较能兼容其它技术思路(比如在台式机系统上、服务器系统上可以结合大音库的做法),同时能够通过不断细化韵律特征来推动技术发展,而不会使得该核心技术出现长期停顿状态。为了适应将该核心系统市场化的需求,它还包括两种不同的应用接口(API)和开发工具(SDK),可以为不同层次的语音应用提供不同调用。为了降低将核心系统移植到各个不同的平台上的成本和时间,这个语音合成系统采用的是易于移植的软件编写方法。比在通常在PC机上按照微软标准编写的语音合成核心,会提高3-4个人月的平台移植时间。这将非常有利于面向各个嵌入式平台的商业合作。采用项目公司的TTS会比采用竞争对手的产品提早3-4个月推出最终的产品。

  语音合成技术研究已成为各国竞相研究的热点,其在三个高端技术产品领域有广泛的应用前景:目前及将来IT市场中最有发展、最能赢利的计算机通讯(CTI)、语音互联网应用领域、嵌入式系统(移动办公设备)及PC应用软件。

(1)台式计算机及笔记本电脑的预装软件市场:中国地区这个市场的总量大约是每年570万台。
(2)移动通信终端市场:主要是最后面对约4000万以上的手机用户,会通过手机制造厂商以及移动通信运营商来实   现。
(3)大陆的主要PDA市场:以商务通和文曲星为代表的每年约2000万的PDA市场。
(4)固定电话通信的终端用户市场:向固定电话最终用户的中文短信息的语音化。这个市场的总量是确定的,约1-   2亿,但用户意愿很不确定,很大程度取决于市场推广和中国电信是否着力推动固定电话的中文短信息服务,  据调查,中国电信对此方面已进入调查研究阶段。
(5)呼叫中心以及其他需要对于自身信息、服务进行动态语音播放的企业级别用户、各个电话信息台等。

  根据OEM的市场行情和竞争对手的强弱,该市场的每年总量上限约为800万 + 4000万 + 2000万 + 1亿 = 1.68亿个授权(指对TTS核心的授权)。目前只有一个主要竞争对手就是中科讯飞公司,且两家之间已经就市场问题展开了合作性竞争的接触,故可以达成一个保护性的价格策略同盟。市场总的毛收入取决于每个授权的平均价格和平均成本。在目前阶段,例如在一年内,实际市场占理论市场的20%-40%之间,这主要是由于通过OEM方式可以迅速打开市场,会比零售市场有更快的扩张性。实际市场授权大约为1.68*(20%~40%)= 3360-6720万个。根据竞争实力,只要充分展开市场销售工作,项目公司基本可以取得30%的市场份额,大约会有1000万-2000万个最终授权。按照1-2元每个授权计算(这是目前OEM市场最低的价格档次),会形成1000万-2000万的市场收入来源。

  该产品的知识产权归属于项目公司。核心开发人员皆为项目公司的员工或股东成员,已申请两项国家专利。

  项目公司拥有国内外最先进的语音合成核心技术,设计完成目前有很强竞争力的各种平台及方案,以其迅捷、明快的客户服务为导向。经过竞争比对,多家集团用户已在比较中应用项目公司产品。

  从商品化角度来看,该产品核心不仅可以合成中文,也能够合成英语,很好地解决了目前很多文本文字是中英文混排的问题。它是国内首家实现中英文混读的TTS系统。从发展的角度来看,该产品技术思路较能兼容其他技术思路(比如在台式机系统上、服务器系统上可以结合大音库的做法),同时能够通过不断细化韵律特征来推动技术发展,而不会使得该核心技术出现长期停顿状态。 项目公司核心技术研究团队除拥有两位中国科学院声学专家外,还有清华博士生2名、清华硕士生及本科生各1名。这无疑为项目公司博采众家之长起到积极作用。
项目公司将利用本土优势,组建技术联盟,参与制定标准;借势使力,利用船小好掉头之优势,采取先入为主策略,快速推进商品化进程,不断将新技术推向市场,建立品牌,加强行业应用,以市场与技术共同应对风险。

  项目公司自创建以来,一直受到北京市政府及海淀区政府的扶持,并一直保持非常良好的合作关系。国家技术部、北京科委、经委、侨务办公室、中关村大管委会、海淀开发区等将项目公司视为重点支持单位。

  该项目计划需要资金总额约为1150万人民币,出让40%股权。450万元用于发展核心技术,确保项目公司TTS 处于国内外领先水平,同时启动语音识别技术的研究。300万元用于发展应用项目公司TTS的产品。400万元用于开拓语音市场的基本投入。这笔融资资金的使用,约在18个月开始实现收支平衡(如果语音服务器能够在启动后的6个月内成功推出则可以提前到12个月达到预期收支效果)。大约在第24个月开始实现每月现金收入约为100-200万元,现金净收益约为40-60万元。

  财务分析结果表明,项目公司财务状况良好,各项收益指标均高于行业基准指标,项目具有一定的抗风险能力,财务评价和经济效益良好,投资回收稳定,项目未来前景广阔。

 

 

首 页|科技文化|政策法规|企业与人才|风俗特色|旅游娱乐|潮州论坛|金科热链|科技项目
Copyright (C) 2001  XQINFO.com,  All Rights Reserved


广东金科信息网络中心湘桥分中心
潮州市湘桥区科技局 ©1998-2001