Transformers.js 2.7.0 发布,新增文本转语音

Transformers.js 支持在浏览器中实现最先进的机器学习——无需服务器。它提供预训练模型和熟悉的 API,支持自然语言处理、计算机视觉、音频和多模态领域的任务。

借助 Transformers.js,开发者可以直接在浏览器中运行文本分类、图像分类、语音识别等任务,这使其成为 ML 从业者和研究人员的强大工具。

最近发布的Transformers.js 2.7.0添加了一项重要功能:文本转语音。

下面是演示视频:

开发者表示目前只支持 speecht5 的文本转语音,将来会添加其他模型,如 bark 和 MMS。

为了展示在浏览器中文本转语音的强大功能,开发者还发布了一个简单的示例应用: