人工智能语音技术公司伊莱文实验室(ElevenLabs)推出全新语音转文字工具Scribe(Scribe),这标志着该公司正式进军语音识别领域,与谷歌(Google)、奥特(Otter)、火萤(Fireflies)和特博转录(TurboScribe)等行业知名企业展开竞争。作为一家以文字转语音和AI语音生成技术闻名的公司,ElevenLabs此次将其在语音领域的专业技术延伸到语音识别方向。
Scribe支持99种语言的语音转录,具备以下特色功能:
在准确性方面,ElevenLabs通过FLEURS和Common Voice基准测试验证,Scribe的识别效果显著优于Gemini 2.0 Flash、Whisper Large V3和Deepgram Nova-3等主流模型。具体表现为:
Scribe可广泛应用于会议记录、电影字幕制作和歌词转写等场景。开发者可通过API接口获取包含非语音事件标记、说话人分离和词级时间戳的结构化转录文本。
产品定价为每小时音频处理0.40美元,并提供为期六周的推广优惠。创作者和企业用户可直接通过ElevenLabs控制面板上传音频或视频文件,获取格式化的转录结果。
ElevenLabs表示,目前产品重点关注准确率提升,支持实时应用的低延迟版本也将很快推出。