语音系统的出现证明进入了高科技时代,在这个具有海量数据、动态更新和个性化查询的需求得信息时代, 语音系统很重要的。interphonic5.0是一套由科大讯飞生开发的世界一流的语音合成软件系统。支持普通话与英语同音混读、广东话与英语同音混读,提供面向任何文本、任何篇章的不间断语音合成功能,合成音质可媲美真人发音,无论何时何地,它都能为用户提供高效便捷的语音信息服务。
科大讯飞语音合成系统主要特色
1. 高质量语音——将输入文本实时转换为流畅、清晰、自然和具有表现力的语音数据;
2. 多语种服务——整合了多语种语音合成引擎,可提供中文、中英文混读、英文、广东话的语音合成服务;
3. 高精度文本分析技术——保证了对文本中未登录词(如地名)、多音字、特殊符号(如标点、数字)、韵律短语等智能分析和处理;
4. 多字符集支持——支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;
5. 多种数据输出格式——支持输出多种采用率的线性Wav,A/U率Wav和Vox等格式的语音数据;
6. 灵活的接口——提供了标准接口、简单接口、COM接口、SAPI接口,便于在多种环境下进行系统的集成;
7. 语音调整功能——开发接口提供了音量、语速、音高等多种合成参数的动态调整功能;
8. 配置和管理工具——合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则、定制资源包管理等功能;
科大讯飞语音合成系统常见问题
一、使用科大讯飞的开发接口在CTI系统的IVR中如何实现语音合成和语音播放的同步进行?
建议使用语音文件链的方式实现合成与播放同步,具体实现为,IVR的每个Port用两个线程来实现服务,一个线程是用户交互线程,负责播放语音、接收用户按键;另一个线程是合成线程,用于后台合成;具体步骤如下:
1.用户交互线程需要播放文本时,先将需要合成的文本传给合成线程
2.合成线程将全部文本送入合成器(调用SynthChinese函数),取得第一部分合成数据后保存成语音文件链表中的第一个节点,然后向用户交互线程发送“可以播放”消息,之后取其他合成数据,保存成语音文件链表中的对应节点
3.播放线程得到合成线程通知后,开始顺序播放文件链表上的语音文件
二、InterPhonic软件锁问题?
1.TTS语音合成系统企业版使用HASP软件锁防止非法拷贝和控制授权数量。在TTS安装时,必须首先把加密锁插在计算机的并口上,在TTS系统运行库安装时,系统会把加密锁的驱动程序安装上去,这样TTS系统才能正确运行。TTS系统在运行时,加密锁必须一直插在计算机上,否则TTS系统将无法运行,会出现“HASP not found(-3)”的错误
2.在TTS系统KD2000 Rev2.0和InterPhonic版本的运行库安装完成后,在安装的Bin目录下,有一个HaspMan.exe程序,它可以检测TTS系统的加密锁是否正确安装,驱动程序是否正常加载,如果没有正确加载,它会提示程序无法运行,正确加载就可以看到加密锁中写入的产品的授权数量信息及产品版本信息,需要注意的是,运行这个程序时必须要关掉VC程序
3.另外在TTS系统运行库安装完成后,在安装的Bin目录下有一个Hinstall.exe的DOS程序,它是进行加密锁的驱动程序安装及卸载的程序,可以在Windows的Dos窗口运行,运行时先进入程序所在的目录:
加命令行参数( -i)安装加密狗驱动程序
加命令行参数( -r)卸载加密狗驱动程序
科大讯飞语音合成系统更新日志
InterPhonic6.5 更新内容
1、修改Bug
2、增加更多的语音库
3、支持更多的预应