有时候需要记录一些视频资料,光手打记录累且麻烦,国内有做语音转录很牛的(如:讯飞输入法),但是碍于到🪜后的访问速度。最近发现了一款离线语音输入软件,而且能方便的进行字幕转录,不管是视频学习还是给自己做的视频配音,都很不错

来源

功能

    1. 按下键盘上的大写锁定键,录音开始,当松开大写锁定键时,就会识别你的录音,并将识别结果立刻输出
    1. 将音视频文件拖动到客户端打开,可以转录生成srt字幕文件

详细展示

特性

  • 完全离线、无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔
  • 热词功能:可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三种热词,客户端动态载入
  • 日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets
  • 关键词日记:识别结果若以关键词开头,会被记录在 年份/月份/关键词-日期.md,关键词在 keywords.txt 中定义
  • 转录功能:将音视频文件拖动到客户端打开,即可转录生成 srt 字幕
  • 服务端、客户端分离,可以服务多台客户端
  • 编辑 config.py ,可以配置服务端地址、快捷键、录音开关……

下载:

参照官方开源库即可,也有其他大佬改的GUI:增加图形界面包,基于pyside6,并添加了语音翻译功能
alt text

其他

关于工具中的核心,sherpa-onnx部署的Paraformer模型,细节可以参照以下卡片: