用户可以通过简单的拖放操作将音频或视频文件转换为文字,编辑和导出多种格式的转录文本,优化工作流程。软件以其直观的界面、强大的编辑功能和对多语言的支持而著称,特别适合访谈、媒体分析和字幕制作等场景。WhisperScript v2 引入了更多功能,如视频播放器支持、发言人分离和增强的工具栏,进一步提升了转录和媒体管理的效率。
主要功能与核心特性
- 高精度多语言转录:支持 99 种语言的音频和视频转录,基于 OpenAI Whisper 技术,提供接近人类水平的转录准确性,并支持将任意语言翻译成英语。
- 本地化处理:所有转录过程在用户设备上完成,音频文件无需上传到服务器,确保数据隐私和安全性。
- 视频文件支持:直接从 MOV、MP4、MKV 等格式的视频文件转录,内置视频播放器支持字幕创建和同步查看,简化视频内容创作者的工作流程。
- 发言人分离:自动检测音频中的不同发言人并标注其发言时间,支持手动校正,适合访谈或多人对话场景。
- 区域编辑:在时间轴上直观拖动和调整转录段落,支持合并、删除、移动或调整段落长度,便于精细化编辑。
- 搜索与替换:提供全文搜索和替换功能,快速定位特定内容或批量修改文本,提升编辑效率。
- 书签与片段管理:支持为关键点添加书签,允许复制、合并、删除或导出选定的转录片段,方便快速处理和整理。
- 多格式导出:支持导出为 SRT、VTT、HTML、JSON、PDF、Word、RTF 等多种格式,满足不同使用需求,如字幕生成或文档归档。
- SMPTE 时间码支持:提供帧精确的时间码显示,适合电影和广播工作流程,支持设置起始时间码和帧率,方便专业用户。
- 字幕质量监控:通过字幕指标面板实时监控每秒字符数(CPS)、每分钟单词数(WPM)等参数,确保字幕可读性和节奏。
- 自定义模型:支持德语、英语、希伯来语等精细化模型,未来计划支持更多语言(如挪威语、沃洛夫语、韩语等),可根据用户需求集成特定模型。
- 增强工具栏:提供便捷的编辑操作入口,如设置字幕参数、复制片段、合并句子等,优化用户体验。
- 批量处理:支持同时处理多个音频或视频文件,显著提高大规模转录任务的效率。
- 快速响应与优化:软件经过重新设计,界面直观且响应迅速,支持快速加载最近项目和多设备同步(通过 Wavery 账户支持最多两台设备)。
- 自动更新:内置自动更新程序,确保用户始终使用最新版本,获取新功能和性能优化。
- 初始提示设置:允许用户自定义转录输出,添加特定领域的词汇或选择语言变体(如简体或繁体中文),提高转录灵活性。
- 模型下载管理:支持并行下载多种模型,用户可自定义存储路径,节省空间和时间。
- 剪贴板转录:支持直接从剪贴板转录文件,简化操作流程。
- 多设备支持:通过 Wavery 账户在多达两台设备上使用软件,适合跨设备工作场景。
- Beta 通道更新:用户可订阅 Beta 通道,抢先体验前沿功能,Pro 用户可解锁更多高级特性。
- 直观工作流程:设计简洁,拖放文件即可开始转录,支持快速搜索、编辑和导出,适合快速生成字幕或播客记录。
- 英语专用模型:提供专为英语优化的模型,适合需要更高速度和精度的英语转录场景。
- 状态栏信息:显示当前使用的模型和语言信息,方便用户随时调整设置或重新转录。
- 社区与反馈:用户可通过 Discord 社区或邮箱(support@getwavery.com)与开发团队互动,提出建议或反馈,持续改进软件功能。
WhisperScript 通过结合强大的转录技术、直观的编辑工具和隐私保护特性,为用户提供了一个高效、灵活的转录解决方案,特别适合需要处理大量音频或视频内容的专业人士和创作者。
下载地址