AI記事考察ノート - Signal Field Notes

絞り込み結果

条件に一致した記事を、新しい順にまとめています。 3

Preprint · ✓完成 · 深堀り済 2026.07.02

YOMI-Bench: 日本語大規模言語モデルの漢字読みと音韻理解評価ベンチマーク

査読前の可能性がある研究情報

日本語の大規模言語モデルが漢字読みと音韂理解で低パフォーマンスを示すことをYOMI-Benchが明らかに

YOMI-Bench kanji reading phonological understanding LLM evaluation

arXiv cs.CL

Field Note 読みどころ

プレプリント論文（査読前の可能性あり）

AI言語処理エンジニア自然言語処理の研究者日本語LLMのユーザー

Preprint 速報 AI要約未精査深堀り済 06.16

査読前の可能性がある研究情報

大規模言語モデルの感情管理能力を評価するための新しいシミュレータベースベンチマークEIBenchが提案された。

速報・AI要約未精査

こんな人にAI研究者・大規模言語モデル開発者

arXiv cs.CL

Preprint 速報 AI要約未精査深堀り済 06.12

査読前の可能性がある研究情報

大規模言語モデルの評価に新たなパラダイムを提案、低ランク因子による能力分析で従来の総合スコアに代わるフレームワークを確立

速報・AI要約未精査

こんな人にAI研究者・大規模言語モデル開発者

arXiv cs.CL