炉头厂家
免费服务热线

Free service

hotline

010-00000000
炉头厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

中文语音技术应掌握在中国人手中

发布时间:2020-02-01 06:03:03 阅读: 来源:炉头厂家

在如今的信息海洋中,直到目前为止,我们接受信息的方式主要依靠眼睛,面对着报纸、杂志和各式各样的荧屏。但是在很多情况下,“视”的方式有一定的局限性,那么,我们为什么让自己的耳朵“闲置”呢?语音是信息传播的另一大媒介,在人们看不见、不愿看或是不方便看的情况下,“听”可以使我们突破视线的限制,极大地扩展了接受信息的空间,也极大地降低了对接受信息的条件的要求。别忘了,人类最早的语言,就是在用“看”的方式无法传达信息的情况下,经由无数次呐喊而逐渐形成的。

对于今天的IT业界,提供语音服务的语音系统正在迅猛地发展起来。先说说时下火热的掌上PC、PDA和WAP手机,它们所共有的缺陷就是屏幕小,但是,“看”着不方便可以“听”呀,为什么不让它们把信息“说出来”?语音合成技术将是打破“识读不便”这个瓶颈的利器。惠普公司全球移动E-Services总监Lawrence Sellin说:“我们预测Internet最大的增长点就是语音技术。无论你在哪,都能通过你手机里发出的声音来接受网上信息,这将导致Internet使用的大爆炸。”在“全盘e化”的各行各业,计算机电信集成系统(CTI)的发展如日中天,三网合一(电话网、有线电视网、互联网)的大趋势给语音技术带来了巨大的商机。结合其他技术,语音合成将广泛应用于金融、邮电、工商、政府机关、交通、教育和游戏娱乐等领域。总之,从股票、航班查询到电脑文档的阅读,再到能说话的信息家电,凡是能“看”的地方,就应该能“听”;“看”成问题的地方,更应该能“听”!在未来几年内,语音合成技术的应用将遍及所有与IT相关的产业,其国内的市场价值,将达到几十亿甚至上百亿元。

语音合成技术的学名叫“文语转换系统”,简称为TTS-text to speech,其实就是让计算机把文字说出来,其追求的目标是计算机输出的“合成语音”可懂、清晰、自然、具有表现力。不用说,这种技术也是世界各国竞相研究的热点,20世纪60年代,英文TTS系统首先被研制出来。80年代,我国开始介入汉字TTS领域的研究,清华大学、中国科大、中科院声学所等单位都在这一领域取得了很好的成绩。近年来,在国家“863”智能计算机主题的支持下,汉语TTS技术有了长足的进步。有专家称:中文语音合成是我国具有一定竞争优势的中文软件领域中“最后的一块处女地”。早已围坐在炉边的狼群

据说鲨鱼可以在很远的地方就能闻到血腥味,然后迅速赶到猎物身边。国外的IT巨头们的嗅觉比鲨鱼更厉害,对于中文TTS技术来说,它们能在国内的市场苗头还未凸现之前,就瞄准了这块肥肉。原因很简单,目前世界上已经开发出多种语言的TTS系统,Bell实验室、ATR、Siemens公司已研制出多语种的TTS系统,法国CNET的多语种TTS已用于电话网中的公共话音服务。毋庸质疑,下一个巨大的市场当然就是以中国大陆地区为代表的使用汉语的人群。

国外著名的IT厂家很早就开始了对中文TTS技术和市场的培养与争夺,他们在这一领域投入的巨资,显示出他们对这个市场的信心和野心。微软、Intel、Motorola、IBM等均投巨资、集中大批优秀的开发力量进行语音识别方面的研究。他们对技术的占有欲就象对利润的占有欲一样强烈,因此也不惜血本地投入,微软中国研究院高级研究员的年薪一般也为几十万元人民币。和在其他领域一样,他们第一步所做的,就是抓住TTS技术的命脉——人才,在这些大公司的中文TTS实验室里,绝大部分科研人员是国内培养多年的、毕业于几个著名语音合成技术实验室的硕士和博士。更值得注意的是,1998年比尔-盖兹派往中国筹建研究院的李开复博士,就是国际著名的语音技术专家。

据笔者了解,国内两个著名的语音合成技术实验室培养的硕士、博士生,有90%以上都进入了国外著名厂商的实验室,甚至一些还没毕业的学生,就已被猎头挖走,或是提前为他们打工。某代表国内最高水平的实验室,其关键技术的发明人今年已进入微软,并开始领导一个语音合成技术小组,而他的当年的导师、一位业已退休的老教授,也被另一个国外著名大公司回聘,担任技术开发工作的指导。这家实验室本身也受这两家委托,进行语音合成音库的开发。不知道国内的IT人们急不急,反正老外们的确是“只争朝夕”,据上述那个实验室的某位员工说,这两家公司几乎每天都在查询研发的进度,估计不久就要向中文语音市场推出商品化产品。

其实,国外厂商的产品已经出现在国内的市场上了。我国某大型通信公司已开始采用由以色列一公司开发完成的中文语音合成技术,进行电话查询及声讯业务,每一条电话线的技术使用费是1万元/年。国内著名的一家软件厂商,其最新推出的手写识别软件即采用了美国L&H公司的语音合成技术,所需费用为每年几十万乃至上百万元。冰山的一角,已经开始露了出来。

据不完全统计,目前在中国开拓语音技术市场的“狼群”有以下这些成员:微软中国研究院、IBM中文语音研究中心、Intel中文语音研究中心、摩托罗拉公司、西门子公司、Dialogic公司(国际著名电话语音卡生产商)、飞利浦公司、L&H公司、Dragon公司、郎讯公司、AT&T公司。从“电子白沟”到硅谷有多远的路

中关村,这条街上的事情说起来没完没了。这条原本普通的街道承载了太多的雄心和梦想,承担了太多的责任和忧患。二十年来,多少IT业界的成功传奇和失败的遗憾都发生在这里,时至今日,这里大厦林立,各个国内外公司的标志和广告争奇斗妍,熙熙攘攘的人群中,多少IT精英正攥紧拳头,拓展自己的梦想。

可是,每一个IT人心里都明白,我们的数字产业的命脉——从CPU到操作系统,都握在别人的手里。在普通的中国人心中,这里代表着我们的未来、科技的明天,那么对于微软、Intel这样的国际IT巨人们呢?这里只是他们的组装车间和销售店铺,即使一些与他们没有直接业务联系的软件或是别的厂家,也都是在巨人们搭起的基础上修筑自己的小屋。

捷通公司的总经理张连毅先生把中关村的发展归结为三个阶段,或者说三个浪潮。最早的是知识分子走出象牙塔,下海经商办企业;接着是国内的一流大学和科研院所开始做校办企业和“院办公司”,现在的几乎所有的大型IT集团都脱胎于此,譬如联想、同方、紫光、方正等等;近年来,在政府的大力扶持之下,一批民办高科技企业逐渐显山露水,把目标定位在自主产权的IT产品和互联网服务。那么,我们有多少自己开发的关键技术呢?有哪些领域离了我们自己的技术专利就玩不转呢?答案是让人揪心的……。

在国外,当人们提到高新技术时,想到的是那些大公司如IBM、微软、摩托罗拉,而在中国,人们更多的是想到清华、北大,亦或是科大、复旦。这是一个值得深思的问题,我们的大学是做什么的,其主要的职能是什么?难道它们只是企业孵化器,各公司的产品开发部?大家都知道,诸如斯坦福、伯克利、麻省理工这样的世界名校支撑着硅谷,但是人家在做什么?是培养人才、做并没有多少现时的商业利益的学科基础研究,还是紧跟着市场开发产品?也许有人会用“中国特色”来解释这个现象,也许我们的知识分子绝不愿意再回到贫穷的昨天、让咱们的大学里先出“一百个百万富翁”再说。可是,如果代表着中国高等教育和科学研究最高水平的清华、北大都忙于办公司、经商,那么,谁来完成它们的职责呢?又有谁能完成得了呢?另外,高校自己出技术办企业,其产品的专利技术的拥有权、管理权,以及企业做到一定程度之后的产权等等问题,这些方方面面的关系如何理顺?面对这些问题,我们不禁要问:我们的大学是要争做世界一流大学还是要做“世界五百强”呢?没有世界一流的大学,中国硅谷的基础何在?

如果我们对美国高科技产业领先于世界的原因稍作一点深层次的考察,就会发现在具体的那些专利技术的背后和底层,有着强大的基础科学研究的基础。90年代初,为了在二十一世纪保持科技的领先水平,美国政府曾经制订了一个庞大的科技发展纲要,其中列在第一位的,是要保持美国数学界的世界权威水平,接下来是理论物理学。从最基础的科学研究到最具商业效益的专利技术,这中间有很长的路途,很多的环节,这些工作笔者认为绝不是某个企业能完成的。

回过头来看看我们的所谓高科技公司,他们掌握了多少自主产权的高科技技术?打着高新企业的幌子卖电子配件的先不必说,就是那些响当当的国内IT巨头们,他们又有多少自己的“硬家伙”,他们的利润有多少来自于自己的专利技术,而不是靠各级政府的扶持和保护、或是地缘优势?作为国内第一PC厂商的联想,卖出一台微机自己能赚多少钱,而Intel和微软又从中赚了多少钱?

没有成功的人总是寂寞的,如果他不能在困境之中坚守自己的选择而随波逐流,那么他永远也不会有成功的那一天。对于一个企业来说也是如此,我们的许多公司太浮躁了,太不能承受痛苦和寂寞,他们总是盯着眼前的利益,要么就是做那些低级的炒作,其实,归根到底就是寻找投机的机会,一夜暴富。可哪有那么容易的事呀!这方面,日本、韩国和台湾的一些优秀的IT厂家是值得我们学习的,我们今天的困难他们也曾遇到过,甚至现在也时常遇到,但是,如果你放弃自己参与技术竞争的权利,那么就总会受制于人,永远不得翻身。这方面,我们的惨痛经历太多了,不用敷述。

高校和科研院所向来是国家重要的科研中心,是高新技术主要的发源地。国家长期以来投入了大量资金支持其研究课题,但对技术商品化并没有明确规定,特别是软件产业中,知识产权的概念模糊,导致关键技术随着人才的流动而转移,造成许多技术“墙内开花,墙外结果”的局面。人材流失了,技术错过了市场,体制和观念等因素,使一些技术发源地逐渐地干涸了。譬如,在语音技术领域,我们可以去看看,高校、研究所有多少“专职”的科研人员?

在于语音合成技术同等重要的语音识别领域,上述的悲惨局面更始让人叹息。将近二十年来,国家投入了巨大的人力和资金,但1997年,IBM公司抢先在中国大陆市场推出了语音识别产品IBM Viavoice,一年时间内占领了大陆近90%的市场份额,获取了上亿元的利润。使国内语音识别技术的商品化功亏一篑。美国的另外两大语音技术公司L&H和Dragon分别于99年、2000年宣布进军大陆语音识别市场,Philip公司1998年仅出资二百万元给清华大学某语音识别实验室,就要求该实验室两年之内不得与其它国内、外厂家合作!国内语音识别技术厂商的市场占有率几乎为零,重要的技术源头又被别人控制,因而有业内专家预测,我国的语音识别产品几年内已无法在中国大陆市场立足!拒绝再次让别人扼住我们的咽喉

可以说,中文语音合成技术是中文民族软件市场的最后一块阵地。这一国家投入了巨大资金和人材的技术日趋成熟,一个潜在的巨大市场业已浮出水面。当然,我们的国内TTS技术相关厂家也面临巨大的挑战,此项技术和市场流失的危险也是大家都能看得到的。

在此,笔者想请诸位读者关注一个正在蓬勃而上的民办软件厂商——捷通华声。这是一家民营的股份制软件公司,汇集了众多著名高校学子和海外归国人材,有着非常雄厚的科技实力和先进的经营管理理念。

这家公司成立短短两年来,为客户提供了用于计算机电信集成系统(CTI)的语音合成技术、录易汉语智能输入/输出系统,以及可听可说的飞达多媒体电子邮件等等众多的解决方案,这一切的核心技术,就是他们自主产权的中文TTS技术。一个年轻的民营软件公司在今天所面临的困难是可想而知的,面对低迷的市场和国外IT巨头们的打压,捷通人勇敢地迈出了一大步——与中科院有关机构和清华的语音合成技术实验室合作,在科技部、市科委的大力支持下,成立民营企业的第一个语音技术研究中心——捷通华声。

日前,捷通华声语音研究中心正式成立。这个中心的成立,标志着我国软件企业在语音技术领域独立开发、自主产权的道路上迈出了崭新的一步,从具体产品的开发向关键技术的研究深入。我国一位国内、外著名的中文语音专家放弃国外几家大公司的高薪聘请参与组建捷通华声,以首席科学家的身份“坐镇”捷通华声,几位年轻的毕业于清华、中科院的优秀博士、硕士、工程师加盟捷通华声,虽然它的规模和影响还很有限,但是让我们看到了希望:真正有骨气、有远见的中国企业,开始在IT的核心技术层面向国外的大公司说不,他们拒绝再让别人扼住自己的咽喉!

捷通公司在资金并不雄厚的情况下,到目前为止,已将一半以上的资金用于技术开发,其眼光和魄力的确是令人敬佩的。掌握本领域的最先进技术,做中国市场上一流的TTS软件厂家,是捷通成立伊始就定下的发展方针,华声语音研究中心的成立,使他们进一步地靠近了自己的目标,为成为一流的民族软件厂商打下了坚实的基础。我们应该为华声语音技术有限公司的成立而欢呼,捷通人不能容忍,所有的中国人也不能容忍再次让别人扼住我们的咽喉!

芽森滴作品封面

好的番号

步兵番号推荐

素人番号封面