OpenAI 的语音转文本 API“Whisper”刚刚得到增强:
这个工具转录音频的速度比 Whisper 快 70 倍
使用 Whisper JAX:最快的 Whisper API
现在可以在大约 30 秒内转录一个 2 小时的播客
在这里使用你的麦克风试试:
https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
Whisper JAX是OpenAI Whisper模型的优化实现,它在JAX平台上运行,并在后端使用TPU v4-8。与在A100 GPU上运行的Pytorch相比,Whisper JAX速度快了70倍以上,成为了最快的Whisper API。
请注意,在高峰期,您可能需要排队才能使用此演示。当您提交请求时,在演示窗格的右上角将显示您在队列中的位置。一旦您到达队列前面,您的音频文件将被转录,并通过进度条显示进度。
如果想要跳过队列,您可以创建自己的推理终端节点,具体详情可以在Whisper JAX代码库中找到。
本文地址:https://www.163264.com/2657