Videosrt Pro

Videosrt Pro

pro版下载 邀请码:FS0a7J 这是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。而Videosrt Pro 是一个商业化的视频/字幕/音频效率工具集合的软件,目前主要包含语音转字幕、字幕翻译、人声分离、视频字幕压制、字幕格式转换、字幕自动打轴、视频硬字幕提取等功能模块,我们将致力打造成新媒体必备工具软件。
04660
MB iSTFT VITS

MB iSTFT VITS

我们提出了一个轻量级的端到端文本到语音模型,使用多波段生成和逆短时距傅里叶变换。我们的模型基于 VITS,一个高质量的端到端文本到语音模型,但是为了更有效的推理,我们采用了两个改变: 1)计算量最大的部分被简单的逆短时距傅里叶变换部分取代,2)多波段产生,使用固定或可训练的合成滤波器,用于产生波形。该方法不同于传统的轻量级模型,传统的轻量级模型分别使用优化或知识提取来训练两个级联组件,该方法充分利用了端到端优化的优点。实验结果表明,该模型合成的语音与 VITS 合成的语音一样自然,在 Intel Core i7 CPU 上实现了0.066的实时性,比 VITS 快4.1倍。此外,在自然性和推理速度方面,较小版本的模型明显优于轻量级基线模型。
04410
1 4 5 6 7 8 10