大規模言語モデル、航空分野での信頼性は?Pre-Flightが示す現状
飛行前検査:航空運行情報に関する大規模言語モデル評価ベンチマーク
査読前の可能性がある研究情報
Pre-Flightは、航空運行に関する大規模言語モデルの評価を可能にするオープンソースベンチマーク
arXiv cs.AI
毎日更新・AIニュース考察
飛行前検査:航空運行情報に関する大規模言語モデル評価ベンチマーク
査読前の可能性がある研究情報
Pre-Flightは、航空運行に関する大規模言語モデルの評価を可能にするオープンソースベンチマーク