激動の状況に対処することが困難な時にこそ、生成AIを巡るハイプ (過熱状態) に惑わされず、企業や組織にとって価値ある技術に目を向け、生成AIに関する新しい視野を広げていくことが重要です。
生成AIはハイプにあふれており、それは生成AIをサポートするテクノロジやテクニックの急速な進化の過程においても同様です。ガートナーの予測では、2026年までに、企業の80%以上が生成AIのAPIやモデルを使用して、生成AI対応のアプリケーションを本番環境に展開するようになるとみています。これは2023年の5%未満からの大幅な増加です。
利用可能なテクノロジやテクニックに大きな期待がかけられ、非常に多くの選択肢があることから、AIをDX(デジタル・トランスフォーメーション、デジタル変革)戦略に組み込み、戦略のアップデートを試みるCIOやITリーダーは、将来的にどれが最大のビジネス・インパクトをもたらすのかの判断を求められています。生成AIのハイプ・サイクルは、見込まれる成果を追求すべく、企業および組織のリスク許容度に応じて活用可能なイノベーションを特定する際に利用できます。
生成AIテクノロジの成熟度、採用状況評価指標、ビジネス・インパクトをガートナーが図示したものです。これは、CIOやその他のITリーダーが、見込まれる成果を追求すべく、組織のリスク許容度に応じて活用可能な生成AIのイノベーションを特定する際に役立ちます。
急速に進化する生成AIテクノロジの全体像を体系的に理解し、AI戦略の実行に役立つイノベーションを特定することで、企業および組織の戦略立案に活用することができます。
本記事では、ガートナーのリサーチノート「生成AIのハイプ・サイクル:2024年」*1にて解説されている生成AIの革新的なトレンドを支えるコア・テクノロジについて、その一部をご紹介いたします。ガートナーのサービスをご利用のお客様は、同リサーチノートから詳細をご覧いただけます。
生成AIのコア・テクノロジは、「生成AIモデル」「AIエンジニアリング・ツール」「アプリケーションとユースケース」「イネーブルメント・テクニック/インフラストラクチャ」という4つの主要カテゴリに分類されます。
生成AIモデルという基盤技術から、実際の開発に必要なAIエンジニアリング・ツール、具体的な活用場面を示すアプリケーションとユースケース、そしてこれらを支えるテクニックとインフラまでをそれぞれ説明します。この体系的な整理により、企業および組織が自社のDX(デジタル・トランスフォーメーション、デジタル変革)における生成AIの位置づけを明確にし、投資判断や導入計画を策定する際の指針としてご活用いただけます。
基盤となる技術領域であり、事前学習済みのファウンデーション・モデルやLLM(大規模言語モデル)が中心となっています。これらのモデルは急速に進化を続けており、マルチモーダル対応や会話能力の向上が進んでいます。
企業および組織における生成AIの実装と管理を支援するツール群です。特にModelOpsツールの重要性が増しており、複数のモデルを効率的に管理・運用するための環境整備が進んでいます。
実際の業務への適用事例が急速に拡大しています。特に顧客サービス、IT部門、マーケティング分野での活用が先行しており、エンタプライズ・アプリケーションへの組み込みも進んでいます。
生成AIは、いくつかの既存のAIテクニックを基盤としています。その一方で、強力なスーパーコンピュータを含む専用インフラストラクチャが、モデルのトレーニングと推論プロセスを加速させていくでしょう。
日本の生成AI市場は現在(2024年11月時点)、「過度な期待」(期待が最も高まった状態、ハイプ・サイクルのピーク期)にあることが特徴的です。多くの企業がRAG(検索拡張生成)技術を活用して、自社の既存データと生成AIを組み合わせる取り組みを始めていますが、その過程では様々な課題に直面し、試行錯誤を重ねている状況です。
一方で、生成AI関連のテクノロジ・トレンドには幅広いものがあり、その多くが現在進行形で進化中です。多くの企業にとって、現在認識しているテクノロジの枠組みを超えた生成AIに関する新しい視野や視点を捉えることが重要です。
向こう2-5年間で特に注目すべき技術として、マルチモーダル生成AIとオープンソースLLMが挙げられます。
マルチモーダル生成AIは、テキストだけでなく画像、音声、動画などの複数のタイプのデータを統合的に処理できる技術で、より豊かなユーザー体験の実現が期待されています。通常では実現不可能な新しい機能を実現することで、エンタプライズ・アプリケーションに変革的なインパクトをもたらします。このインパクトは特定の業界やユースケースに限定されるものではなく、AIと人間の間のあらゆる接点への適用が可能です。現在、多くのマルチモーダル・モデルは2~3つのモードに限定されていますが、今後数年のうちにさらに多くのモードが組み込まれるようになるでしょう。
また、オープンソースLLMは、商用アクセスを民主化し、開発者が特定のタスク/ユースケース向けにモデルを最適化できるようにすることで、生成AIの導入から得られる企業価値を加速させるディープ・ラーニングのファウンデーション・モデルです。さらに、モデルの改善と価値の向上という共通の目標に取り組んでいる企業、学術機関、およびその他の研究機関の開発者コミュニティにアクセスできるようにします。
長期的な視点では、ドメイン固有の生成AIモデルと自律エージェントが特に大きな可能性をもたらすでしょう。
ドメイン固有の生成AIモデルは、特定の業界、ビジネス機能、またはタスクのニーズに最適化されています。企業内でユースケースの整合性を改善すると同時に、精度、セキュリティ、プライバシーを向上させ、よりコンテキストに沿った回答を提供できるようにします。これにより、汎用モデルの場合ほど高度なプロンプト・エンジニアリングを使用する必要がなくなり、対象を絞ったトレーニングを通じて、ハルシネーション (捏造された回答) のリスクを下げることができます。
一方、自律エージェントは、人間の介入なしで、定義された目標を達成する複合システムです。さまざまなAI技術を利用して、環境におけるパターンを識別し、意思決定を行い、一連のアクションを実行し、アウトプットを生成します。自律エージェントは、環境を学習し続けることで性能が向上し、次第に、より複雑なタスクに対処できるようになる可能性を秘めています。
Gartner のサービスをご利用のお客様は、下記のレポートで詳細をご覧いただけます。契約されているサービスにより本ドキュメントを閲覧いただけない場合もございますので、ご了承ください。
ガートナーの各種コンファレンスでは、CIOをはじめ、IT投資、導入、運用管理にかかわるすべての意思決定者に最新・最適な情報とアドバイス、コミュニティを提供します。