人工知能からジェネレーティブAIへ
2024-03-20更新
人工知能の人気は急上昇し、わずか数年の間にサイエンスフィクションから現実の世界での利用まで広がっています。しかし、バズワードの裏でAIはどのように機能しているのでしょうか?「人工知能」、「ディープラーニング」、「ニューラルネット」などの用語がお互いどのように関連しているのか混乱したり、生成AIが他のタイプのAIと何が違うのかをよりよく理解したいと思っているなら、この記事を読むのが正解です。
まず、「AI」、「機械学習」、「ニューラルネット」、「ディープラーニング」といった用語が何を意味するのかを順に説明していきましょう。これらの単語はすべて、次のような階層的関係で互いにつながっています。
図1: 画像はWikipedia経由、Joel Hruskaによって修正、CC BY-SA 4.0 DEED
大雑把に言えば、人工知能とは、知的生命体と同じような方法で問題を解決するために、モデルやアルゴリズムを使用することです。これらのモデルやアルゴリズムは、ソフトウェア・アプリケーションに統合され、抽出された洞察をエンドユーザーが容易に利用できるようにします。人工知能の実装には、機械学習を含むものもありますが、すべてではありません。機械学習は、モデルが見たデータから一般的な結論を導き出すという演繹的推論ができる論理モデルや、数学モデルの構築に関係する人工知能のサブ分野と言えます。
同様に、一部の(すべてではありませんが)人工知能は、ニューラルネットと呼ばれる特殊な論理構造を持ち、脳のニューロン間のネットワーク化された情報の流れに似せて設計されています。特に高度なニューラルネットの中には、ディープラーニング(深層学習)を実行できるものもあり(詳しくは下記)、ディープラーニングが可能なニューラルネットの中には、学習したことを使って文章や芸術作品、さらには動画を生成できるものもあります。ディープラーニングを行うニューラルネットがこのような作品を生成できるようになったのは比較的最近のことであり、私たちはこのクラスのソフトウェアに Generative AI(ジェネレーティブAI)というカテゴリを設けています。
概略を説明したところで、各サブフィールドについて詳しく説明しましょう。
機械学習
機械学習、ニューラルネットワーク、ディープラーニングはいずれも、特定のシナリオにおいて、特に他の以前のタイプのAIと比較して性能面で優位性があるため、近年人気を博しています。別のAIが同じタスクを実行できることもあるかもしれませんが、それぞれのタイプのAIには独自の強みがあり、それぞれのニッチに適合します。
そのような強みのひとつが学習能力です。強力なAIであっても、自らのモデルをその場で調整する能力を備えているとは限りません。例えば、1990年代後半にゲーリー・カスパロフを破り、歴史に名を残したIBMディープ・ブルーのメインフレーム。最も有名なAIの例のひとつですが、ディープ・ブルーはゲーリー・カスパロフとの対戦成績に基づいて自らのゲームプレイを調整することはできませんでした。人工知能には、必ずしも学習が必要なわけではないのです。その代わり、専門家チームがゲームの合間にスーパーコンピューターの戦略を微調整しました。
機械学習AIの多くは、データのサニタイズ、ラベリング、構造化という形で人間の介入を必要とし、AIの学習を特定の道筋に沿って誘導します。このようなガイダンスが必要なモデルは、教師あり学習を行います。一方教師なし学習を行うように設計されている一部のモデルは、データセットのパターンを識別し、人間の介入やデータのラベリングを必要とせずに、発見したことを報告します。また、2つのアプローチを融合させた半教師あり学習もあります。
ニューラルネット
図2:イメージ:Wikipedia user CBurnett, CC-BY-SA 3.0 DEED
機械学習がAIを実装する1つの方法に過ぎないのと同様に、人工ニューラルネットワーク(しばしば「ニューラルネット」と略されます)も機械学習を実装する1つの方法です。ニューラルネットは、脳(人間の脳)や神経系を構成するニューロンに似せて設計された、計算処理能力の高い構造体です。ニューラルネットは、ソフトウェア、ハードウェア、またはその2つの組み合わせで実装することができます。では、なぜ脳を模倣するのでしょうか?脳は平均的なノートパソコンよりも小さなパワー・エンベロープの中で、膨大な数の多様なタスクを並行して実行できるからです。
ニューラルネットワークは、入力セット、入力が処理される少なくとも1つの隠れ層、そして出力層で構成されます。ネットワークのノードは、ニューロンと呼ばれています。この例では、ニューラルネットはフィードフォワード、つまり出力層に向かって一方向にしか情報を送らないと仮定します。バックプロパゲーション(逆伝播)と呼ばれる技術によって、前の層に情報をフィードバックできる、より高度なニューラルネットもあります。
ディープラーニング:
複数の隠れ層を持つニューラルネットは深層学習が可能であり、複数層の処理によって徐々に高いレベルの出力が可能になります。
画像3:WikipediaユーザーBrunelloN, CC BY-SA 4.0 DEED
この図は、ディープラーニング・ニューラルネットの一例を示しています。データはこのニューラルネットの中を、左端の入力層(大きな端)から、右端の単一ニューロンである出力層へと移動します。入力層、隠れ層、出力層の構成が異なれば、ネットワークのトポロジーも異なります。
ディープ・ニューラル・ネットは、より大きなデータセットを使用し、適切な期間でモデルを訓練するために、よりハイエンドのハードウェアに依存します。基礎となるAIモデルにさらに多くの層を追加することで、マシンはより高度なタスクを実行できるようになり、例えば、最初に人間が解析し構造化していないデータセットで自己学習することができるようになります。ディープラーニング・モデルは、単純な機械学習手法よりも洗練されたアウトプットを作成することができますが、トレーニングにも時間がかかります。
ジェネレーティブAI:
様々な方法で利用できるディープラーニングですが、その新星のひとつが、いわゆるジェネレーティブAI(生成AI)です。ジェネレーティブAIモデルは、ユーザー入力をプロンプトとして受け取り、その入力とはまったく異なる形式、スタイル、トーンで新しい出力を生成することができます。
現在、ChatGPTやGPT-4(いずれもOpenAIが開発)、Llama 2(Facebook)、Prometheus(Microsoft)など、数多くの生成AIモデルが使用されています。このような生成的AIの多くは、大規模な言語モデルを搭載しています。巨大なデータセットを使用する非常に大規模なディープラーニング・モデルで、自然言語の入力と学習データを解析する能力が注目されています。これらの新しい製品やサービスの総合的な目標は、これまで存在したものよりもはるかに高性能なボットやアシスタントを生み出すことです。
ジェネレーティブAIがテクノロジーの世界で注目されるようになったのは、テック企業が次のビッグ・シングを探しているからだけではありません。AIが最近人気を博しているとはいえ、ニューラルネットやディープラーニングの基本的な概念原理は、かなり前に解明されていました。過去10年間で、データ・ストレージ・コスト、計算効率、生の性能のすべてが向上し、ディープ・ラーニングと生成AIが商業規模で実用的に展開できるようになったのです。
ハイエンドの Radeon™ RX 7000 GPU から、一部の Ryzen™ Mobile 7040、Ryzen Mobile 8040、および Ryzen 8000 デスクトップ CPU に搭載された統合オンダイ AI アクセラレーション エンジンに至るまで、AMD はこの初期市場をリードしています。 オンダイでの人工知能処理の統合、CPU 上の特殊な命令によるサポート、およびこれらのワークロードに優れたグラフィックス プロセッサの構築はすべて、過去40年間でもっとも興味深い技術デビューの1つを支援することを目的とした、より大きな Ryzen AI イニシアチブのコンポーネントです。
ジェネレーティブAIのサービスやハードウェアメーカーの具体的な目標は様々ありますが、コンピュータ業界のこのテーマへの関心の多くは、純粋な興奮によってもたらされていると言えるでしょう。20世紀から21世紀にかけ、SF作家たちはその時代のコンピュータよりもはるかに巧みに人々を理解し、対応できるコンピュータやアンドロイドを想像してきました。ディープラーニングとジェネレーティブAIは、SFとサイエンス・ファクトの間のギャップを単独で埋めることはできないかもしれませんが、これまでのAIアプローチに比べて大きな進歩をもたらします。どちらも、従来のプログラムされたコンピュータのようにではなく、もう少し私たちに近い問題を解決する人工知能を構築するための継続的な取り組みにおいて、不可欠であることが証明されるかもしれません。
Joel HruskaはAMDのマーケティング・マネージャーです。彼の投稿は彼自身の意見であり、AMDの立場、戦略、意見を代表するものではありません。第三者のサイトへのリンクは便宜上提供されているものであり、明示的に記載されていない限り、AMDはリンク先のサイトのコンテンツについて責任を負わず、いかなる保証も意味するものではありません。GD-5
© 2024 Advanced Micro Devices, Inc. 無断複写・転載を禁じます。AMD、AMD Arrowロゴ、Radeon、Ryzenおよびこれらの組み合わせは、Advanced Micro Devices, Inc.の商標です。本書で使用されているその他の製品名は、識別のみを目的としたものであり、各所有者の商標である場合があります。
こちらの記事はAMD本社のブログ記事を機械翻訳したものです。詳しくは元記事をご覧ください。