Anthropicは2024年6月20日、Claude 3.5モデルファミリーの最初のリリースとなる「Claude 3.5 Sonnet」を発表しました。最新AIモデルClaude 3.5 Sonnetとは?Anthropicは2024年6月20日、Claude 3.5モデルファミリーの最初のリリースとなる「Claude 3.5 Sonnet」を発表しました。 このモデルは、業界標準を大きく引き上げ、多くの評価指標で競合モデルやClaude 3 Opusを上回る性能を示しています。Claude 3.5 Sonnetの主な特徴は以下の通りです:性能と速度:Claude 3 Opusの2倍の速度で動作し、中位モデルのコストで最高レベルの知能を実現大学院レベルの推論(GPQA)、学部レベルの知識(MMLU)、コーディング能力(HumanEval)などのベンチマークで新記録を達成改善された能力:ニュアンス、ユーモア、複雑な指示の理解力が向上自然で親しみやすい口調での高品質なコンテンツ生成が可能コンテキストに応じたカスタマーサポートや複雑なワークフローの処理に適しているコーディング能力:内部のエージェントコーディング評価で64%の問題を解決(Claude 3 Opusは38%)コードの記述、編集、実行を独立して行い、高度な推論とトラブルシューティング能力を発揮視覚認識能力:これまでで最も強力な視覚モデルとなり、標準的な視覚ベンチマークでClaude 3 Opusを上回るチャートやグラフの解釈、不完全な画像からのテキスト抽出に優れている利用可能性と価格:Claude.aiとClaude iOSアププで無料で利用可能Anthropic API、Amazon Bedrock、Google CloudのVertex AIでも利用可能入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドルで、20万トークンのコンテキストウィンドウを提供また、Anthropicは新機能「Artifacts」を導入し、ユーザーがClaudeの生成物をリアルタイムで確認・編集できるようになりました。 これにより、AIとの共同作業環境が実現し、チームコラボレーションの強化が期待されています。Anthropicは今後、Claude 3.5 HaikuとClaude 3.5 Opusをリリースする予定で、エンタープライズアプリケーションとの統合や、ユーザーの好みや対話履歴を記憶する「Memory」機能の開発にも取り組んでいます。新機能の詳細と改良点、新機能「Artifacts」Claude 3.5 Sonnetには、以前のバージョンから大幅な改良が加えられています。特に注目すべきは、性能面での向上とArtifacts機能の追加です。性能面では、Claude 3.5 SonnetはClaude 3の最上位モデルOpusの2倍の速度で動作し、パフォーマンスが大幅に向上しています。また、コーディングやビジョンベンチマークにおいてもClaude 3 Opusを上回る結果を示しており、不完全な画像からテキストだけを正確に抽出することも可能になりました。内部のエージェントコーディング評価では、Claude 3.5 Sonnetは問題の64%を解決し、Claude 3 Opusの38%を大きく上回りました。 この評価では、自然言語での改善指示を受けて、バグを修正したりオープンソースのコードベースに機能を追加したりする能力がテストされています。もう一つの大きな改良点は、新機能「Artifacts」の追加です。 この機能により、ユーザーはClaude.aiのWeb上でコードやテキスト、ウェブサイトデザインなどのコンテンツ生成をClaudeに依頼すると、リアルタイムで生成物のプレビューが専用ウィンドウに会話と一緒に表示されます。 ユーザーはその場でClaudeによる創作物を確認・編集しながら、プロジェクトやワークフローにシームレスに統合できるようになりました。%3Cblockquote%20class%3D%22twitter-tweet%22%3E%3Cp%20lang%3D%22ja%22%20dir%3D%22ltr%22%3E%E3%81%93%E3%82%8C%E3%81%AF%E3%82%84%E3%81%B0%E3%81%84%EF%BC%81%EF%BC%81%EF%BC%81%E3%83%95%E3%83%AD%E3%83%BC%E3%83%81%E3%83%A3%E3%83%BC%E3%83%88%E3%82%92Claude%203.5%20Sonnet%E3%81%AE%E6%96%B0%E6%A9%9F%E8%83%BD%E3%80%8EArtifacts%E3%80%8F%E3%81%A7%E4%BD%9C%E3%81%A3%E3%81%9F%E3%82%89%E9%81%8E%E5%8E%BB%E6%9C%80%E9%AB%98%E3%81%AE%E7%B2%BE%E5%BA%A6%E3%81%A0%E3%81%A3%E3%81%9F%E4%BB%B6%E3%80%82%20%3Ca%20href%3D%22https%3A%2F%2Ft.co%2FlPrKmwPNnV%22%3Epic.twitter.com%2FlPrKmwPNnV%3C%2Fa%3E%3C%2Fp%3E%26mdash%3B%20Taiyo%20%7C%20AI%E3%81%A7%E9%81%8A%E3%81%B6%E5%A4%A7%E5%AD%A6%E7%94%9F%20(%40Taiyo_AiAA)%20%3Ca%20href%3D%22https%3A%2F%2Ftwitter.com%2FTaiyo_AiAA%2Fstatus%2F1803813712970825746%3Fref_src%3Dtwsrc%255Etfw%22%3EJune%2020%2C%202024%3C%2Fa%3E%3C%2Fblockquote%3E%20%3Cscript%20async%20src%3D%22https%3A%2F%2Fplatform.twitter.com%2Fwidgets.js%22%20charset%3D%22utf-8%22%3E%3C%2Fscript%3EAnthropicは、Artifacts機能がClaudeをチャットAIから共同作業環境へと進化させる第一歩だとしており、今後はチームでのコラボレーションを想定し、ナレッジやドキュメント、進行中の作業のためのワークスペースとしてClaudeを強化していく方針です。 将来的には、チーム全体や組織全体で知識や文書、作業を一元管理できるようになり、Claudeがオンデマンドのチームメイトとして機能するようになることが期待されています。他のAIモデルとのパフォーマンスや価格の評価Claude 3.5 Sonnetは、Anthropic社が開発した最新の大規模言語モデルで、性能と価格のバランスに優れた特徴を持っています。主な特徴として:品質指標では平均を上回る性能を示し、MMLU(Massive Multitask Language Understanding)スコアで0.887を達成しています。処理速度は平均以上で、1秒あたり78.7トークンの出力速度を実現しています。コンテキストウィンドウは200,000トークンと大きく、長文の処理に適しています。価格は入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドルで、平均的なモデルよりやや高めですが、性能とのバランスが取れています。レイテンシ(応答開始までの時間)は0.80秒と平均よりやや高めですが、全体的な処理速度の速さでカバーしています。性能面では、一般的な推論能力、知識、コーディング能力などの様々な分野で高いスコアを示しています。特に、Chatbot Arena、MMLU、MT-Benchなどのベンチマークで優れた結果を出しています。Claude 3.5 Sonnetは、GPT-4やGemini 1.5 Proなどの競合モデルと比較しても、品質と処理速度のバランスが取れたモデルとして位置づけられています。特に、コスト効率の面で優位性があり、企業での実用的な利用に適しています。このモデルは、複雑なタスク処理、コンテキストに応じたカスタマーサポート、多段階のワークフロー管理、コード変換の効率化など、幅広い用途に適しています。特に、創造的な文章作成や自然な対話生成において優れた性能を発揮し、より人間らしい、自然な文章を生成することができます。Claude 3.5 Sonnetの利用方法Claude 3.5 Sonnetは、無料でClaude.aiのWebサイトやiOSアプリから利用可能です。 有料プランのClaude ProやTeamプランの契約者は、大幅に高いレート制限でアクセスできます。また、Anthropic API、Amazon Bedrock、Google CloudのVertex AIからも利用可能で、入力トークン100万個あたり3ドル、出力トークン100万個あたり15ドルのコストがかかり、200Kトークンのコンテキストウィンドウが設定されています。Claude 3.5 Sonnetは、コードスニペット、テキストドキュメント、ウェブサイトデザインなどのコンテンツ生成を依頼すると、専用ウィンドウに会話と一緒にリアルタイムでプレビュー(Artifacts)が表示される新機能を備えています。 ユーザーはClaudeの生成物をその場で確認・編集しながら、プロジェクトやワークフローにシームレスに統合できます。この機能は、ClaudeがチャットAIから共同作業環境へと進化することを示しており、チームでの活用を想定し、ナレッジやドキュメント、進行中の作業のためのワークスペースとしての強化が図られています。 将来的には、チーム全体や組織全体で知識や文書、作業を一元管理できるようになり、Claudeがオンデマンドのチームメイトとして機能するようになるとのことです。続報Perplexity.aiにもClaude 3.5導入されたみたい%3Cblockquote%20class%3D%22twitter-tweet%22%3E%3Cp%20lang%3D%22ja%22%20dir%3D%22ltr%22%3E%3Ca%20href%3D%22https%3A%2F%2Ft.co%2FvXI3K0RB47%22%3Ehttps%3A%2F%2Ft.co%2FvXI3K0RB47%3C%2Fa%3E%E3%81%AB%E3%82%82Claude%203.5%E5%B0%8E%E5%85%A5%E3%81%95%E3%82%8C%E3%81%9F%EF%BC%81%3Ca%20href%3D%22https%3A%2F%2Ft.co%2F6r968PLCSQ%22%3Ehttps%3A%2F%2Ft.co%2F6r968PLCSQ%3C%2Fa%3E%3C%2Fp%3E%26mdash%3B%20Taiyo%20%7C%20AI%E3%81%A7%E9%81%8A%E3%81%B6%E5%A4%A7%E5%AD%A6%E7%94%9F%20(%40Taiyo_AiAA)%20%3Ca%20href%3D%22https%3A%2F%2Ftwitter.com%2FTaiyo_AiAA%2Fstatus%2F1803948596020322600%3Fref_src%3Dtwsrc%255Etfw%22%3EJune%2021%2C%202024%3C%2Fa%3E%3C%2Fblockquote%3E%20%3Cscript%20async%20src%3D%22https%3A%2F%2Fplatform.twitter.com%2Fwidgets.js%22%20charset%3D%22utf-8%22%3E%3C%2Fscript%3E