Buzz 字幕 离线音频转录和翻译
Buzz 可在个人电脑上离线转录和翻译音频。由 OpenAI 的 Whisper 提供支持。
Buzz是一款基于 OpenAI whisper 技术的开源、离线软件,主要功能就是实时语音转文字,这是重中之重,当然你直接上传文件,输出文字也是不在话下的!
最厉害的当然要数将麦克风的语音实时转换为文字,这样一来,开会的时候打开这个软件,不就可以轻松记录了嘛!
这个软件有点大,大家忍一忍,毕竟功能强大。
在设置里可以进行模型选择。Whisper 是一种通用语音识别模型,它有不同的尺寸,按照你们的需求下载即可。
如果你有 OpenAI 的 API Key,就直接往这里填,至于效果如何,就不用我多说了吧。
在这里我就先用一个音频文件测试,上传之后可以选择模型、task、语言,以及导出的文件类型,这里忘记说了,task里除了有转录,即语音转文字,还有翻译功能。
第一次使用,会下载模型,保存在本地,方便下次使用。
效果还是挺让人满意的,只不过有些话带了点方言口音,识别就没那么准确。
下方这个就是实时转录功能啦,同样可以选择模型、任务、语言,只需要打开麦克风,然后点击下面的 record 即可。
支持的文件格式:MP3、WAV、M4a、ogg、MP4、WebM、ogm。
数据统计
数据评估
关于(Buzz)特别声明
本站商娱网提供的Buzz都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由商娱网实际控制,在2023-07-29 19:12收录和巡查时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,商娱网不承担任何责任。
相关导航
CEC-IDE 以“做好数字政府创新应用的孵化器和技术管理的总抓手”为使命,自主研发,提供多种主流语言的开发环境,是国内首款同时支持麒麟、统信、Windows、Mac OS 等多环境的 IDE 工具。
Ech0
Ech0 面向个人的新一代开源、自托管、专注思想流动的轻量级联邦发布平台。

ScreenToGif
ScreenToGif 免费的屏幕录制工具,可以录制、编辑并保存为gif、视频或其他格式。

Telegram
电报 Telegram是一款基于云的移动和桌面消息传递应用程序,专注于安全性和速度。

雪藏HsFreezer
雪藏HsFreezer 但它能冻结正在运行的游戏,释放占用的CPU和GPU运算资源(内存还是会占用),等解冻时还能立马恢复回来,冻结网游还能防止掉线,作者做了大量细节优化,让你快速切换大型3A游戏和切歌一样简单。

万能嗅探
万能嗅探(嗅探工具)是一款比较好用资源嗅探软件,界面干净,可以抓取浏览器的网页,客户端程序,微信小程序 等,这里面产生的 视频、音乐、图片 都可以抓取到,实测网页打开 某视频号、某音、某红薯、某站,可以做到无水印的视频和封面下载功能,支持Windows系统和Mac系统,无需安装,打开即用。
Keyviz 实时按键可视化工具
Keyviz 是一款免费的开源软件...
Caddy
Caddy是一款功能强大、面向企业、开源的web服务器,具有用Go编写的自动HTTPS。
暂无评论...
