長文音声指示への対応、SpeechLLMsが見せた新戦略とは?
FBKの長文音声LLM: IWSLT 2026指令従順タスクへの応答
査読前の可能性がある研究情報
FBKのSpeechLLMsがIWSLT 2026指令従順タスクで短文と長文両方に対応
速報・AI要約未精査
arXiv cs.CL
毎日更新・AIニュース考察
FBKの長文音声LLM: IWSLT 2026指令従順タスクへの応答
査読前の可能性がある研究情報
FBKのSpeechLLMsがIWSLT 2026指令従順タスクで短文と長文両方に対応
速報・AI要約未精査
査読前の可能性がある研究情報
PhantomBenchは、言語モデルのhallucination問題に対する大規模な評価基準を初めて導入した
こんな人にAI研究者・言語モデル開発者
arXiv cs.AIHugging Faceのリーダーボード設定ガイドとhallucination評価用リーダーボードを紹介
速報・AI要約未精査
こんな人に大規模言語モデル開発者・AI研究者
Hugging Face Blog