Amazon Transcribe 语音转字幕 每个月 60 分钟免费 最大 5GB 文件免费
最近一直在找免费生成字幕并翻译的网站。发现了 Amazon Transcribe 语音转文字,每个月
1. Amazon Transcribe
https://aws.amazon.com/transcribe/
还不是
注意选择语言,或者选择让 Amazon 自动识别。
本页面需要从注意 S3 存储服务要和 Amazon Transcribe 服务在同一个区域。
在 Amazon Transcribe 页面右上角,确认一下当前区域。
2. 音视频文件上传至 AWS S3 存储服务
一、直接在 Web 页面上传
二、命令行 (AWS CLI) 上传
我是用 vps 下载的视频,所以视频文件本来就在 vps 上,连接 AWS 的速度也快,所以我用命令行的方式上传到 s3
安装 AWS CLI
apt-get install -y unzip libc6 groff lesscurl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"unzip awscliv2.zipsudo ./aws/install
AWS CLI 需要 IAM 用户
注意勾选 “编程访问”
添加 “AmazonS3FullAccess” 策略
一路AWS CLI 命令行认证权限
aws configure
把刚刚生成的用户的 ID 和私钥填过来
剩下的不用管直接回车。
Default region name [None]:Default output format [None]:
然后就可以用命令行上传文件了,比如:
aws s3api put-object --bucket 你的S3 存储桶名称 --key 你准备放在 S3 的文件名 --body 你的 VPS 上的文件名
4. 现在可以继续操作 Amazon Transcribe 了
Input 从 S3 中选择要处理的影音文件,Output 让 Transcribe 的处理结果放到我们自己的存储桶里。“下一步”。
后续页面的设置都不用管,一路 “下一步”。
等处理完后,打开 job
你可以通过右上角的 “对象操作” 来下载
你也可以找到 KEY(键),
用 AWS CLI 命令行来下载,比如:
aws s3api get-object --bucket 你的S3 存储桶名称 -key S3 上文件的 KEY 你准备保存到 VPS 的文件名
到目前为止,得到的.json 文件还不是字幕文件。它的结构是下面这个样子的。
====
可以用这个 github repo 把 json 转换为 srt 文件
不过转换很粗暴,所以效果很一般。
====
翻译工作交给 Google Translate
效果很一般,不过免费又不限制文本长度。
注意:文件后缀不包括 .srt,我们需要先改成.txt 才行。
Google Translate 会把英文的半角符号都转换为中文的全角形式。对于 srt 文件来说不是一件好事情。
所以你可能最后需要用一些其它工具,比如:excel 的 vba
Sub 按钮1_Click() Dim curLine As IntegercurLine = 3Do While Worksheets(1).Cells(curLine, 1).Value <> ""Worksheets(1).Cells(curLine, 1).Value = Worksheets(2).Cells(curLine, 1).ValuecurLine = curLine + 4LoopEnd Sub
====
提醒:
把你 AWS 上面创建的各种 Transcribe 任务和 S3 存储都删除干净。以免一不小心产生费用。
评论
发表评论