字幕大师是一款基于OKVoice自主研发的高准确率语音识别技术的字幕制作软件,拥有自动对齐,批量上传,断点续传三个特点。字幕大师能够帮你将视频中的声音自动识别转换为文字,自动将声频文字匹配为时间轴(对齐声音和文字),生成字幕文件,整个制作过程减少了90%以上的人工干预,对齐准确率超过93%。让字幕工作者告别传统的“手拍字幕”,并能够自动匹配字幕时间轴,非常适合一些生肉制作组进行翻译。有需要的用户快来本站下载吧。
功能特点
目前,市面上大部分视频字幕制作软件仍依赖于人工手动编辑,使用起来非常耗时麻烦。OKVoice根据大量数据分析,发现了字幕制作软件的缺陷与字幕工作者的需求,结合其自身在智能语音技术方面的多年积累,经过一年多不断的努力,研发出依托于语音识别技术的字幕制作工具——“字幕大师”。
据了解, “字幕大师”创新运用OKVoice自主研发的语音识别技术,将视频中的声音自动识别为文字,自动将声频文字匹配为时间轴(对齐声音和文字),生成字幕文件,整个制作过程减少了90%以上的人工干预,对齐准确率超过93%。
“字幕大师”作为OKVoice推出的首款2C产品,颠覆了普通字幕软件的基本操作流程。此次开放的自动对齐功能只需导入音频与文本就即可自动生成时间轴,可节省3~5倍的时间,并具有“支持断点续传、支持批量上传、文本自动对齐”三个特点,改变了以往“手拍字幕”的繁琐,更加省时高效。
软件特色
1、语音合成(Text To Speech)或称TTS技术
是将文本状态的文字信息转换成为可闻其声的语音信息处理技术。
它涉及语音学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理行业的一项前沿技术。
随着语音合成技术陆续的发展和成熟,文字信息不仅限于眼睛的阅读,则是耳朵对文字的聆听,让生活更加的方便快捷。
2、语音识别Automatic Speech Recognition,(ASR)
将人类的自然语言转化为计算机可以理解的数据语言,这种转化是达成语音识别的基础。
语音识别的应用范围广泛,如:语言拨号、语音导航、语音智能家居、语音检索、听写录入等。
随着语音识别技术的发展和完善,不同语言语音机器翻译就会出现,人类将迎来无语言沟通障碍的世界。
3、声纹识别(Voiceprint Recognize)
是根据语音波形反映说话人声音和行为特征的语音参数,能自动识别说话人身份的技术。
和语音识别不同的是,声纹识别是采取语音信号中说话人的身份信息,并不考虑语音中的字词意思。
由于每个人的生物特征具有和其他人不同的唯一性,不易伪造和假冒,因此使用声纹识别技术进行身份认证,更加安全可靠。
4、低速率编码
先进的编码技术,最低通讯编码可以在600bps以下。
高质量的语音通讯质量,600bps以下速率的PESQ分可达2.6。
稳定的通讯效率,可在多种极端环境下确保信道传输稳定。
5、智能对话
精准智能的对话理解,支持多种应用场景对话内容理解。
面向垂直行业的语义解析精准率高达95%以上。
自有的数千G规模互联网语料,确保多种词汇的理解。
使用方法
1.下载完成后不要在压缩包内运行软件直接使用,先解压;
2.软件同时支持32位64位运行环境;
3.如果软件无法正常打开,请右键使用管理员模式运行。
更新日志
1、全新界面,底层优化
2、新增工程项目,支持打开工程二次修改
3、可根据语音识别生成字幕
4、优化降噪算法
5、支持导入srt文件进行修改
6、支持字幕批量前置、批量后置
7、字幕修改支持上下行合并、删除行、切分、标记
8、优化时间轴操作
9、多任务管理功能优化,支持批量操作、单独操作