Amazon Transcribe

自动将语音转换为文本

Amazon Transcribe 是一项自动语音识别(ASR)服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。您还可以将实时音频流发送到 Amazon Transcribe,并实时接收转录流。

Amazon Transcribe 可用于多种常见应用,包括客户服务通话转录,以及为音频和视频内容生成字幕。该服务可以转录以常见格式(例如 WAV 和 MP3)存储的音频文件,并为每个词附加时间戳,以便您可以通过搜索文本轻松找到原始源中的音频。Amazon Transcribe 在不断学习和改进,以跟上语言发展的步伐。

主要功能

方便阅读的转录

大多数语音识别系统输出的文本都没有标点符号。Amazon Transcribe 利用深度学习技术自动添加标点符号和格式,从而使输出内容更容易理解,无需进一步编辑即可直接使用。

时间戳生成

Amazon Transcribe 会为每个词返回一个时间戳,以便您可以通过搜索文本轻松找到原始录音中的音频。

支持多种使用场景

Amazon Transcribe 可为各种质量的音频提供准确的自动转录。您可以为任何视频或音频文件生成字幕,甚至可以转录低质量的电话录音,例如客户服务电话。

自定义词汇表

Amazon Transcribe 允许您扩展和自定义语音识别词汇表。您可以将新词添加到基本词汇表中,并生成使用场景特定的高度准确的转录,例如产品名称、领域特定术语或个人姓名。

识别多个讲话者

Amazon Transcribe 能够识别讲话者的变化,并相应地确定转录文本的归属。从而显著减少转录具有多个讲话者的音频(例如电话、会议和电视节目)所需的工作量。

声道识别

Amazon Transcribe 能够处理通过不同声道来记录每个讲话者的音频和视频。通过将单个音频文件提交到 Amazon Transcribe,由其会识别每个声道,然后生成使用声道标记标注的单个转录,将给联系中心带来显著的效益。

流式转录

借助 Amazon Transcribe,您可以实时将音频转录为文本。借助通过 HTTP 2 协议的安全连接,您可以将实时音频流发送到该服务,并且可以实时接收文本流。

使用场景

Amazon Transcribe 可以为各种使用场景提供转录服务,包括客户服务、字幕制作、搜索与合规性监控。

改善客户服务

借助 Amazon Transcribe 将音频输入转换成文本,您可以构建能够搜索和分析语音输入的文本分析应用程序。客户联系中心可以使用 Amazon Transcribe 来转录语音通话,并借助其他bet9网站下载云科技服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取洞察。

字幕制作工作流

Amazon Transcribe 可以自动生成带时间戳的字幕(可随视频内容一起显示),从而帮助内容生成和媒体发行者提高覆盖率和访问量。

音频归档分类

借助该服务,您可以将音频和视频资产转录成完全可搜索的归档文件,以支持合规性监控和风险管理。客户可以使用 Amazon Transcribe 将音频转换成文本,使用 Amazon Elasticsearch Service 为其音频/视频库编写索引并执行基于文本的搜索。

优势

解锁音频和视频内容的价值

通过将音频输入转换成文本,Amazon Transcribe 可帮助您构建能够搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用 Amazon Transcribe 转录语音通话,并借助其他 bet9网站下载云科技服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取见解。

提升客户体验

您可以使用 Transcribe 针对通话转录、实时视频字幕制作和临床文档记录的优化模型,提升客户体验。

利用准确的转录节省时间和资金

Transcribe 使用一种称为自动语音识别(ASR)的深度学习过程来提供高度准确的转录。定义词汇表单词,从而领域特定的单词和短语(如名称或技术术语)生成更准确的转录。

详细了解 Amazon Transcribe 定价

访问定价页面
准备好开始构建了吗?
开始使用 Amazon Transcribe
还有其他问题?
联系我们