查看原文
其他

ChatGPT | 基于OpenAI Whisper模型的WhisperDesktop转写工具

路佳宁 语言服务行业
2024-09-09


导言:当遇到无字幕、难理解的音频或视频,想要获取字幕文本怎么办?想要解放双手,在电脑端直接录音转文字怎么办?今天小编来为大家介绍一款全程免费、支持多语种、准确率高,且可以直接生成多种格式文字稿的ASR工具WhisperDesktop。


01
Whisper简介Whisper DescriptionWhisper是由OpenAI开发的一个自动语音识别(ASR)开源系统。经过训练,它能够支持多种语言的语音转录,并且可以将这些语言翻译成英文,同时还能够有效地过滤掉背景音和杂音。


Whisper官方介绍 https://openai.com/research/whisper 


Whisper支持的语言种类丰富




OpenAI的技术文档介绍了如何基于Whisper模型调用语言转文本API来实现语言转写或将语言翻译成英文的功能。

Speech-to-text API 介绍文档

https://platform.openai.com/docs/guides/speech-to-text


02
WhisperDesktop工具下载WhisperDesktop

重点来了!

基于Whisper模型,Konstanti设计了一款工具WhisperDesktop,能够在Windows系统中直接使用,无需api key,且安装步骤及操作都十分便捷。下面就来跟随小编一起下载体验吧~

WHISPERDESKTOP 下载操作首先,打开https://github.com/Const-me/Whisper,找到页面右下方releases中的最新版本,点击进行下载。


完成下载后,将压缩包进行解压缩,找到WhisperDestop.exe,即为工具程序,点击运行。运行成功后进入主页面,开始配置。


在使用前,需要下载一个二进制文件,请点击页面中的Hugging Face


https://huggingface.co/ggerganov/whisper.cpp/tree/main 


打开这个网页之后,我们会看到很多文件,根据Whisper模型的不同型号(tiny, base, small, medium, large-v1, large-v2),网页上提供了多种二进制文件(.bin文件)。模型越大,转写及翻译的准确度就越高,但同时运行的速度也会相对变慢。大家可以根据电脑配置及使用需求来选择。


推送下方可观看使用演示视频

HOW TO USE使用操作--文件转写将文件下载成功后,将文件所在的本地路径复制到Model Path后,配置完毕,点击OK,进入使用界面。


1.在language中选择音频或者视频中的语种。如果希望将其他语言翻译成英文,请勾选Translate。

2.点击Transcribe File栏中右侧的小方框,选择转写文件。

3.在Output Format的下拉菜单中,你可以选择输出的格式:纯文本Text、带时间轴的文本Text with timestamps、SRT格式的字幕文件 SubRip subtitles以及WebVTT格式的字幕文件 WebVTT subtitles。

4.如果希望将转写文件与原文件放在同一目录下,请勾选 “Place that file to the input folder”,或者你可以选择新建一个文件,将文件的路径复制到下方。

均设置好后,点击Transcribe进行转写。

HOW TO USE使用操作--语音转写

WhisperDesktop还支持Audio Capture的功能,即将录音结果进行转写或翻译。点击下方Audio Capture按钮,进入音频转写页面。


将转写文件、语言、输出文件等设置选定后,点击Capture,开始录音并转写。


如果想返回文件转写页面,点击下方Transcribe File即可。03
演示操作视频


希望本次介绍可以对大家日常的学习生活有所帮助,也期待小伙伴们可以多多探索这个工具的不同使用场景。


声明:本公众号转载此文章是出于传播行业资讯、洞见之目的,如有侵犯到您的合法权益,请致信:chongchong@lingotek.cn,我们将及时调整处理。谢谢支持!


-END-
本文转载自:翻译技术教育与研究
转载编辑:Pickey


关注我们,获取更多资讯!

往期回顾

行业动态1. 论坛预告 | 第十届中国术语学建设暨术语研究的发展与未来国际学术研讨会(2号通知)
2. 论坛预告 | 中国英汉语比较研究会语言服务专业委员会2023年高端学术论坛会议通知(一号)
3. 活动预告 | 中国式现代化与长三角区域一体化语言能力建设高层论坛暨长三角语言服务竞争力报告发布会4. 行业动态 | AIGC时代医学语言服务:融合与创新——2023医学翻译南方论坛成功举办5. 论坛预告 | 全球视野下国家战略传播与翻译专业人才培养创新论坛(1号通知)
行业洞见
  1. 行业观察 | 汪淳波教授专访系列之一:中特理论外译之路的挑战
  2. 行业观察 | 陈毅强:融会贯通,口译技能持续升级
  3. 行业观察 | 郭海波:探索计算机辅助翻译的本质
  4. 精彩回顾 | 首届全国翻译技术大赛赛后沙龙,听听获奖选手怎么说


行业技术
  1. 技术应用|快速提高“搜商”之桌面搜索工具“Everything”
  2. 技术应用|8大人工智能API平台——打造超智能APP
  3. 技术应用 | 4万字+50幅图一网打尽Transformer
  4. ChatGPT | 文献阅读小帮手:New Bing
  5. 如何使用trados生成客户要求的clean和unclean文件?

精品课程
  1. 精品课程 | CATTI考前实战冲刺班,考前三周实战提升,扫除备考盲点
  2. 精品课程|译员如何提升搜商?如何应对各种复杂搜索场景?
  3. 精品课程 | 2023年十一假期研修班课程(线上)
  4. CATTI十月打卡营每日打卡督学,助你一举拿下CATTI证书!
  5. 翻译搜索专题课来啦,名师带你一一攻克搜索难关!

资源干货
  1. 技术科普 | 揭开手写文本识别“最先进”的秘密
  2. 资源干货 | 英语外刊获取途径、网站推荐
  3. ChatGPT | AI外语写作助手,助力高效写作
  4. 双语干货 | 谢锋大使向中美媒体发表讲话
  5. 资源宝库|译者用“典”,多多益善——精选31款在线词典

招聘就业1. 招聘快报 | 美图秀秀招聘翻译经理
2. 博硕星睿 | 办公室实习助理招聘(北京)3. 译者招募丨英译中,经济学(有署名)4. 招聘快报 | CNBC财经电视台上海分公司招聘发行部助理实习生5. CATTI备考在即,备考实习两不误,硬核语言专业线上实习机会来了!


继续滑动看下一个
语言服务行业
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存