オープンソース史上最強AI「Llama 3.1」が公開 405Bなら最新のクローズドモデルGPT-4o、Claude 3.5を凌駕。オープンLLM時代の幕開けか。

Metaが発表した最新の大規模言語モデル「Llama 3.1」は、4050億パラメータを持つ405Bバージョンが、GPT-4やClaude 3.5 Sonnetなどの主要な商用モデルと同等以上の性能を示し、オープンソースAI開発の新時代を象徴している。大規模言語モデル「Llama 3.1」の概要 Metaは、最新の大規模言語モデル「Llama 3.1」を発表した。このモデルは、8B、70B、405Bの3つのサイズで提供され、オープンソースとして公開されている。Llama 3.1の主な特徴は以下の通りである：高性能：405Bモデルは、GPT-4やClaude 3.5 Sonnetなどの主要な商用モデルと同等以上の性能を示している。多言語対応：英語、ポルトガル語、スペイン語、イタリア語、ドイツ語、フランス語、ヒンディー語、タイ語のプロンプトをサポートしている。長いコンテキストウィンドウ：128,000トークンのコンテキストウィンドウを持ち、約400ページの小説に相当するテキスト入力が可能である。幅広い能力：一般的な知識、操縦性、数学、ツール使用、多言語翻訳など、様々な分野で高い性能を発揮する。モデル蒸留と合成データ生成：405Bモデルは、小規模モデルの改善とトレーニングを可能にする合成データ生成、およびモデル蒸留などの新しいアプリケーションに対応している。Metaは、Llama 3.1の公開により、オープンソースAIが主流となる転換点になると考えている。このモデルは、AWS BedRock、SageMaker、WhatsApp、Meta AIなど、様々なプラットフォームで利用可能となる予定である。Llama 3.1の公開は、AIの民主化を推進し、開発者や研究者がより高性能なAIモデルにアクセスできるようにすることを目的としている。これにより、AIの応用範囲が広がり、新たなイノベーションが促進されることが期待される。Llama 3.1の技術的特徴 Llama 3.1は、Metaが開発した最新の大規模言語モデルであり、いくつかの重要な技術的特徴を備えています。まず、Llama 3.1のアーキテクチャは、デコーダのみのTransformerモデルを採用しています。これは、エンコーダ-デコーダ構造ではなく、デコーダ部分のみを使用する設計であり、効率的な推論と生成を可能にします。モデルのサイズについては、8B（80億）、70B（700億）、405B（4050億）の3つのバリエーションが提供されています。特に405Bモデルは、現在利用可能なオープンソースモデルの中で最大規模のものの一つであり、複雑なタスクや高度な推論に適しています。Llama 3.1の重要な特徴の一つは、128,000トークンという長いコンテキストウィンドウです。これは約400ページの小説に相当する長さのテキストを一度に処理できることを意味し、長文の要約や複雑な文脈理解を必要とするタスクに適しています。多言語対応も Llama 3.1の強みの一つです。英語、ポルトガル語、スペイン語、イタリア語、ドイツ語、フランス語、ヒンディー語、タイ語など、8つの言語でのプロンプト処理が可能です。これにより、多言語翻訳や多言語会話エージェントとしての利用が可能になります。また、Llama 3.1は高度なツール使用能力を持っています。これにより、外部ツールの呼び出しや複雑なタスクの実行が可能になり、より柔軟なAIシステムの構築が可能になります。さらに、Llama 3.1は合成データ生成やモデル蒸留などの新しいアプリケーションにも対応しています。特に405Bモデルは、小規模モデルの改善とトレーニングを可能にする合成データ生成に活用できます。最後に、Llama 3.1はオープンソースとして公開されており、開発者はモデルの重みをダウンロードし、カスタマイズや追加のファインチューニングを行うことができます。これにより、様々な用途に応じたAIモデルの開発が促進されることが期待されます。Llama 3.1とGPT-4oの比較 Llama 3.1とGPT-4oは、現在最先端の大規模言語モデルとして注目を集めています。両モデルの比較を通じて、Llama 3.1の特徴と性能をより詳細に理解することができます。性能面では、Llama 3.1の405Bモデルは複数のベンチマークでGPT-4oを上回るスコアを記録しています。特に一般的な知識、操縦性、数学、ツール使用、多言語翻訳などの分野で優れた性能を示しています。人間による評価でも、半数以上の被験者がLlama 3.1 405Bの出力結果をGPT-4oと同等以上と評価しています。コスト面では、Llama 3.1はGPT-4oと比較して大きな優位性があります。Metaによると、AWSなどの環境でLlama 3.1を実行するコストは、GPT-4oの約半分で済むとされています。これは、特に大規模な利用や長期的な運用を考える企業にとって重要な要素となります。アクセシビリティの面では、Llama 3.1はオープンソースモデルとして公開されており、開発者がモデルの重みをダウンロードし、カスタマイズやファインチューニングを行うことができます。一方、GPT-4oはクローズドソースモデルであり、APIを通じてのみアクセス可能です。この違いは、モデルの柔軟性や応用範囲に大きな影響を与えます。多言語対応については、Llama 3.1は8言語（英語、ポルトガル語、スペイン語、イタリア語、ドイツ語、フランス語、ヒンディー語、タイ語）をサポートしています。GPT-4oの正確な言語サポート数は公開されていませんが、より多くの言語に対応していると考えられます。コンテキストウィンドウの長さは、Llama 3.1が128,000トークンをサポートしており、GPT-4oの32,000トークンを大きく上回っています。これにより、Llama 3.1はより長文の処理や複雑な文脈理解を必要とするタスクに優位性を持ちます。ただし、Llama 3.1の日本語対応は現時点では限定的であり、GPT-4oの方が日本語処理能力に優れている可能性があります。総じて、Llama 3.1はGPT-4oと同等以上の性能を持ちながら、オープンソースであることやコスト面での優位性を持っています。しかし、特定の言語や用途によっては、GPT-4oの方が適している場合もあるため、具体的な利用目的に応じて選択する必要があります。Llama 3.1のベンチマーク結果 Llama 3.1は、150以上のベンチマークデータセットで広範なテストが行われ、優れた性能を示している。特に405Bモデルは、一般知識、多言語対応、数学、ツール使用など幅広い能力において、GPT-4やClaude 3.5 Sonnetなどの主要な商用モデルと同等以上の性能を発揮した。Metaの公式サイトで公開されているベンチマークスコアによると、Llama 3.1は複数の評価指標で他のモデルを上回っており、特に多言語タスクや複雑な推論を要する問題で高いスコアを記録している。これらの結果は、Llama 3.1がオープンソースAIモデルとして画期的な性能を達成したことを示している。Llama 3.1は日本語では使えない？日本語への設定方法を紹介 Llama 3.1は現時点で日本語を公式にサポートしていません。Metaが発表した対応言語リストには、英語、ポルトガル語、スペイン語、イタリア語、ドイツ語、フランス語、ヒンディー語、タイ語の8言語が含まれていますが、日本語は含まれていません。このため、Llama 3.1の日本語処理能力は限定的であると考えられます。ただし、Llama 3.1が多言語モデルであることを考慮すると、日本語でも一定の理解や生成が可能である可能性はあります。プロンプトをいじると日本語出力になる？Xでは独自日本語LLM開発などを行っているHoly-fox氏によって、日本語出力させる実験が行われています。具体的にはプロンプトの最後にlang:jaを付けることで日本語出力をさせることが可能なようです。しかし、公式サポート外の言語であるため、英語などの対応言語と比較すると性能が劣る可能性があります。%3Cblockquote%20class%3D%22twitter-tweet%22%3E%3Cp%20lang%3D%22ja%22%20dir%3D%22ltr%22%3E%E3%81%A3%E3%81%A6%E3%81%93%E3%82%8Cllama3.1%E3%81%A7%E3%82%82%E5%BE%8C%E3%82%8D%E3%81%ABlang%3Aja%E3%81%A3%E3%81%A6%E3%81%A4%E3%81%91%E3%82%8C%E3%81%B0%E6%97%A5%E6%9C%AC%E8%AA%9E%E5%AF%BE%E5%BF%9C%E3%81%99%E3%82%8B%E3%82%84%E3%82%93%E3%81%91%EF%BC%81%3Cbr%3E%3Cbr%3E%E6%97%A5%E6%9C%AC%E8%AA%9E%E9%9D%9E%E5%AF%BE%E5%BF%9C%E3%81%A8%E3%81%AF%E3%81%84%E3%81%A3%E3%81%9F%E3%81%84%E2%80%A6%20%3Ca%20href%3D%22https%3A%2F%2Ft.co%2FOJ5AewQJ9S%22%3Epic.twitter.com%2FOJ5AewQJ9S%3C%2Fa%3E%3C%2Fp%3E%26mdash%3B%20Holy-fox%20(%40Holy_fox_LLM)%20%3Ca%20href%3D%22https%3A%2F%2Ftwitter.com%2FHoly_fox_LLM%2Fstatus%2F1815781865275727976%3Fref_src%3Dtwsrc%255Etfw%22%3EJuly%2023%2C%202024%3C%2Fa%3E%3C%2Fblockquote%3E%20%3Cscript%20async%20src%3D%22https%3A%2F%2Fplatform.twitter.com%2Fwidgets.js%22%20charset%3D%22utf-8%22%3E%3C%2Fscript%3E