Meta は、最新かつ最も先進的なオープンソース人工知能モデルである Llama 3.1 のリリースを発表しました。この新バージョンは AI テクノロジーの大きな飛躍を表しており、Meta は OpenAI などの企業の主要な独自モデルよりも優れていると主張しています。
4,050 億のパラメータを備えた主力モデル Llama 3.1 405B は、現在公開されている基盤モデルの中で最大です。このモデルは、一般知識、数学、ツールの使用、多言語翻訳の分野で最先端の機能を発揮します。このモデルは、16,000 個を超える Nvidia H100 GPU を使用して、15 兆を超えるトークンでトレーニングされました。
Llama 3.1 の主な改善点の 1 つは、コンテキストの長さが 128K トークンに拡張されたことです。これは、以前の Llama モデルの 16 倍の容量です。これにより、AI はより長いテキストを処理および理解できるようになり、複雑なタスクを処理し、より微妙な応答を生成する能力が向上します。
新しいモデルは、英語、ドイツ語、フランス語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タイ語の 8 つの言語をサポートしています。この多言語機能により、Llama 3.1 は、グローバル AI アプリケーションに取り組む開発者や企業にとって多目的なツールになります。
Meta は、Llama 3.1 を405B、70B、8Bパラメータの 3 つのサイズでリリースします。各サイズは、さまざまなユースケースに合わせて最適化されています。
- 405B モデルは、長文テキスト生成、多言語翻訳、コーディング、複雑な推論タスクが可能で、エンタープライズ アプリケーションや高度な研究に最適です。
- 70B モデルは、コンテンツ作成、会話型 AI、言語理解に適しています。
- 8B モデルは、モバイル デバイスなど、計算リソースが限られているアプリケーション向けに設計されています。
導入を促進するため、Meta は Amazon、Google、Databricks などの大手テクノロジー企業と連携し、Llama 3.1 をさまざまなプラットフォームで利用できるようにしています。たとえば、Amazon SageMaker JumpStart や Amazon Bedrock などのサービスを通じて、Amazon Web Services (AWS) でモデルにアクセスできるようになりました。
Meta の CEO であるマーク・ザッカーバーグ氏は、オープンソース AI の重要性を強調し、それが AI のメリットを民主化するための鍵であると述べています。同氏は、Llama 3.1 のようなオープンソース モデルが、最終的には機能と採用率の点で独自のモデルを上回ると考えています。
Llama 3.1 のリリースには、開発者がモデルの出力を使用して他の AI システムを改善できるようにする更新されたライセンスも付属しています。この動きにより、AI 分野のイノベーションが加速し、開発者は AI アプリケーションの構築とカスタマイズにおいてより柔軟に作業できるようになると期待されています。
Meta のオープンソース AI への取り組みは、Linux が多くのデバイスやサーバーで主流のオープンソース オペレーティング システムになった経緯を彷彿とさせます。同社は、Llama 3.1 が同様に AI 開発の礎となることを期待しています。
AI が急速に進化し続ける中、Llama 3.1 のリリースは、強力な AI モデルを世界中の開発者や企業がより利用しやすくするための重要なマイルストーンとなります。これは、オープンソース モデルが独自のモデルと直接競合し、場合によってはそれを上回る AI イノベーションの新しい時代の基盤となります。
コメントを残す