非自己回帰モデルが音声認識を変える——Whisfusionの新アプローチとは?
Whisfusion: 平行ASR解読とマスク拡散モデルによる遅延軽減
査読前の可能性がある研究情報
Whisfusionは、マスク拡散モデルを用いてリアルタイム音声認識の精度とスループットを向上させる新技術
速報・AI要約未精査
arXiv cs.AI
毎日更新・AIニュース考察
Whisfusion: 平行ASR解読とマスク拡散モデルによる遅延軽減
査読前の可能性がある研究情報
Whisfusionは、マスク拡散モデルを用いてリアルタイム音声認識の精度とスループットを向上させる新技術
速報・AI要約未精査