LLMのモデル名が伏せられた状態で人間が投票を行い、そのデータを元に作成されたLLMランキング。
LMSYS Chatbot Arena Leaderboard https://chat.lmsys.org/?leaderboard
現在(2024.04.23)だと GPT-4-Turbo や Claude-3-Opus はもちろん、OSS の Llama-3-70b や Comannd-R+ などが頑張っている様子がわかる。
2001Y
メールアドレスが公開されることはありません。 ※ が付いている欄は必須項目です
コメント ※
名前 ※
メール ※
サイト
次回のコメントで使用するためブラウザーに自分の名前、メールアドレス、サイトを保存する。