研究 @dotey 2026-04-29

Simon Willison 实测微软 VibeVoice-ASR

微软 1 月开源的 9B 参数语音转文字模型 VibeVoice-ASR 单次可处理 60 分钟音频。Simon Willison 在 M5 Max MacBook 跑 4-bit 量化版，转写 1 小时播客耗时 8 分 45 秒。

本解读由 AI 自动生成 · 模板：事件解读 · 仅供参考，请以原文为准。