昨天有提到主打音视频转写的阿里云AI新品“通义听悟”,我用来听播客节目效果很舒适,今天再推荐一个类似的:whisper-web
基于Transformers.js v2.2.0
支持 100 多种不同语言转录。
代码地址:
https://github.com/xenova/transformers.js
体验地址:
https://huggingface.co/spaces/Xenova/whisper-web
可以提交音频地址或者上传音频文件体验,我上传了一段中文音频,转化的效果明显没有英文好(输出的文本是繁体的)
来源:https://mp.weixin.qq.com/s/NrffMbQg7fhiB8BgDUoD7g
本文地址:https://www.163264.com/4143