NVIDIA® Riva 是一组 GPU 加速的多语种语音和翻译微服务,用于构建完全可定制的实时对话式 AI 工作流。Riva 使用业界领先的自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT) 技术,可在所有云、数据中心、边缘和嵌入式设备上部署。借助 Riva,企业可以添加语音和翻译界面,将聊天机器人转化为善于互动且富有表现力的多语种语音 AI 智能体或虚拟形象。
实现高度准确的多语种转录和翻译,并借助经过数千小时音频预训练的先进模型提供开箱即用、富有表现力和专业性的男女声语音。
借助 NVIDIA Riva 加速生产级多语种语音赋能 AI 应用的开发和部署。NVIDIA Riva 是灵活的 NVIDIA AI Enterprise 模块化平台的一部分,旨在加速 AI 开发和部署。
了解 NVIDIA AI 如何支持行业用例,并通过精选示例快速启动语音 AI 开发。
各公司正在部署 AI 虚拟助手,全天候自动处理数百万客户和员工的查询。借助 Riva 的语音和翻译 AI 微服务,这些助手可以在对话的每个阶段都提供有用且自然的回答,不受背景噪音、音质不佳以及说话者方言和口音多样化的影响。
为提升客户服务体验以及良好客户关系,企业正在打造具有可识别品牌声音的数字人。借助 Riva,仅需三秒的语音数据即可创造出独特、高质量的个性化语音。
每天都有数亿次会议在线上进行,视频会议已成为企业不可或缺的工具。借助 Riva 实时转录技术,视频会议应用在实时字幕和会议摘要方面实现了令人惊叹的准确度,可为全球不同口音、使用各种领域特定词汇的用户提供辅助。
在全球化的经济中,企业跨国运营,且服务于具有多元语言文化背景的客户群体。全球语言的多样性给寻找母语使用者或以多个语种对员工进行培训带来挑战。Riva 翻译能够助力实现准确而高效的沟通,促进全球协作顺畅进行。
AI 机器人越来越多地出现在世界各地的医院、机场和零售店中。它们通过处理餐厅和制造设施中的日常重复性任务来帮助一线工作人员,协助客户在商店中找到商品,并为医生和护士提供患者护理支持。借助 Riva,可以轻松地将语音和翻译 AI 添加到服务机器人中。
2021 年,AI2Labs 从 Yoozoo Games 中分离出来,成为新加坡的一家本地技术初创公司。AI2Labs 创新、试验和开发 AI 产品和应用,实现高效流程并改善可持续性和业务成果。
AI2Labs 将 Riva 集成到其 Speakr (特定领域的语音 AI) 语音识别 API 中,以适应亚洲语音和商业领域的复杂性,并实现了出色的新加坡英语翻译准确性。
Avaya 专注于云通信和工作流协作解决方案,通过其 OneCloud 平台提供统一通信、联系中心、通信平台即服务 (CPaaS) 和服务。
Avaya 集成了 NVIDIA Riva 语音转文本引擎,可大规模实现实时字幕。Riva 可实现更好的转录质量、更低的字错误率和经济的交付。
十多年来,位于印度浦那的 C-DAC 的应用 AI 小组一直专注于语音技术的研究和开发。他们已成功为印度语 (如印地语和马拉松语) 创建了先进的语音转文本 (STT) 系统。该小组通过探索支持 AI 的开源深度学习框架、库和工具来为其他印度语和低资源语言创建支持 STT 和语音的应用程序,从而继续推进其工作。使用各种神经网络架构和 NVIDIA 开源 NeMo 框架中的拓扑进行了实验,事实证明 Citrinet 和 Conformer-CTC 网络拓扑在构建和训练用于语音识别的神经声学模型方面非常有效。这些模型在单节点和多节点 Param Siddhi AI 系统上进行了训练,优化了训练时间和性能。最后,使用 Riva GPU 加速的生产流程部署了模型,以进行实时和批量模式推理。
NCS 是新加坡电信集团的子公司,是一家领先的技术服务公司,在亚太地区设有办事处,并与政府和企业合作,通过技术推动社区发展。NCS 结合其 12000 人的团队在 61 个专业领域的经验和专业知识,利用其在数字、数据、云和平台方面的 NEXT 能力,以及应用、基础设施、工程和网络安全方面的核心产品,为客户提供差异化的端到端技术服务。NCS 还相信与领先的技术参与者、研究机构和初创公司建立强大的合作伙伴生态系统,以支持开放式创新和共同创造。
NCS 在 Breeze (驾驶员的配套应用)中使用 NVIDIA Riva TTS 进行语音导航、实时交通和路况更新、实时停车费用以及电子道路定价费用和运营时间,帮助新加坡驾驶员体验平稳的驾驶旅程
RingCentral 是全球企业云通信、协作和联络中心解决方案的领先提供商,为数百万用户提供服务。RingCentral 平台支持从任何位置和设备进行协作,提高业务效率和客户满意度。
RingCentral 使用 NVIDIA Riva 为其平台上的 20 万并发用户进行视频会议转录
Snap 是一家摄像头和社交媒体公司,致力于通过滤镜和特效创建多媒体信息。为打造更具交互性的体验,Snapchat 用户每天使用 Lenses (一种为快照添加实时特效的功能)的次数超过 60 亿次。
NVIDIA Riva 针对噪音和术语优化的语音 AI 服务集成到 Snap AR Lens Studio 中,使创作者(艺术家和开发者)能够打造扣人心弦的增强现实 (AR) 体验。
T-Mobile 是一款功能强大的 Un - Carrier,可提供先进的 4G LTE 和变革性 5G 网络,以提供最佳客户体验。为了增强联系中心坐席的能力,T - Mobile 实施了专家协助。这个基于 AI 的软件使用 NVIDIA Riva 转录实时客户对话,为推荐系统提供信息,并为成千上万的坐席提供帮助。
借助 Riva,T-Mobile 可在自定义数据集上微调自动语音识别模型,并在杂的环境中准确解释客户术语。
我们会就您的疑问为您提供帮助。