Speculative decodingとAUFが自動生成を加速する理由とは?
Spec-AUF: マスクブロックドラファー向けのAccept-Until-Failトレーニング
査読前の可能性がある研究情報
Speculative decodingとAUFが自動生成の効率性を向上させる
arXiv cs.AI
毎日更新・AIニュース考察
Spec-AUF: マスクブロックドラファー向けのAccept-Until-Failトレーニング
査読前の可能性がある研究情報
Speculative decodingとAUFが自動生成の効率性を向上させる
査読前の可能性がある研究情報
提案的解読の理論的枠組みを提供し、言語モデルの推論効率向上に向けた新たな可能性を示唆
速報・AI要約未精査
こんな人に機械学習エンジニア・自然言語処理研究者
arXiv cs.CL査読前の可能性がある研究情報
Dustinは、大規模言語モデルの長期コンテキスト生成における効率性とパフォーマンスを向上させる新しいフレームワークです。
速報・AI要約未精査
こんな人に機械学習エンジニア・自然言語処理研究者
arXiv cs.CL査読前の可能性がある研究情報
VIA-SDは、一部のトークンに対してスリムなサブモデルを使用することで推論コストを削減し、パフォーマンスを向上させる新し...
速報・AI要約未精査
こんな人にAI研究者・機械学習エンジニア
arXiv cs.AIvLLM v0.21.0は、transformers v4の非推奨化やC++20への移行など、多数の重要な変更を含む新バージョンです。
速報・AI要約未精査
こんな人にPythonエンジニア・大規模言語モデル開発者
vLLM ReleasesStarCoder モデルのパフォーマンスが 🤗 Optimum Intel Xeon エンジンにより向上
こんな人にPythonエンジニア・ソフトウェア開発者
Hugging Face BlogHugging FaceがWhisperモデルの推論時間を半分に短縮する新技術を発表
こんな人に機械学習エンジニア・音声認識技術者
Hugging Face Blog