大規模言語モデル(LLM)とは

Mark Jackley | コンテンツ・ストラテジスト | 2024年2月16日

大規模言語モデル(LLM)は、クエリに対して人間のような自然な文章を生成するよう設計された、近年注目されているAIの一種です。大量のテキストデータを使用してトレーニングされたLLMは、与えられた文脈に基づいて次の単語や語句を予測できるようになります。さらに、特定の著者やジャンルの文章スタイルを模倣することもできます。

LLMは2020年代初頭に研究所から登場し、大きな話題を集めました。それ以来、スタンドアロン製品として、また、さまざまな種類の業務ソフトウェアの組み込みの付加価値機能として利用されるようになりました。リクエストを解釈し、役立つ回答を生成するLLMの優れた能力により、自然言語処理、機械翻訳、コンテンツ生成、チャットボット、文書要約など、幅広い用途でLLMが利用されています。

大規模言語モデルとは

大規模言語モデル(LLM)は、書籍やウェブ、その他のソースから抽出された数十億語もの膨大なデータセットをもとにトレーニングされ、質問に対して人間のような文脈に沿った応答を生成する能力を持つAIシステムです。LLMは質問(LLM用語では「プロンプト」)を理解し、自然言語による回答を生成するように設計されているため、顧客からの質問への回答、レポートの要約、メールの下書きの作成、さらには詩やコンピュータコードの作成といったタスクを実行することができます。LLMは通常、トレーニングに使用された言語の文法とセマンティクスを深く理解しており、これをさらに企業データを使用して改良することもできます。

LLMは、人間の言葉を認識し解釈できるため(ただし、人間のように完全に理解できるわけではありません)、自然言語処理において大きな進歩を遂げたといえるでしょう。最も有名なLLMは、おそらく書籍、記事、ウェブサイトから収集した数十億語のデータでトレーニングされた、OpenAIのAIプログラム「ChatGPT」でしょう。ChatGPTには、ウェブブラウザやモバイルアプリから直接アクセスできます。また、プログラミング可能なAPIを介して業務ソフトウェアにリンクさせることも可能です。その他の一般的なLLMには、Cohere、GPT-4、BARDなどがあります。

LLMのトレーニングに使用されるテキストデータは、データベースのように構造化されている場合と、構造化されていない場合があります。ほとんどの企業は、テキストメッセージや電子メール、文書など、大量の非構造化データを保有しています。

LLMの主なビジネス用途としては、カスタマーサービス用のチャットボット、デジタル・アシスタント、そして従来の逐語的な翻訳ツールよりも文脈に即した自然な翻訳を提供する翻訳サービスが挙げられます。LLMは、タンパク質の構造予測やソフトウェアコードの作成など、かなり高度なタスクも実行できます。LLMを効果的に活用している業界には、ヘルスケア、製薬、金融、小売などがあります。例えば、ヘルスケア・プロバイダーは、ホットラインに電話をかけてきた患者の優先順位付けにLLMを使用することができます。また、投資会社は、利益報告書、ニュース記事、ソーシャルメディアの投稿をスクリーニングして要約し、株式トレンドを把握するのに活用することがあります。LLMはデータを管理・分析し、ビジネス価値を生み出すインサイトを引き出すのに役立ちます。そして、どちらのシナリオにおいても、LLMは人間のアナリストよりも高速にタスクを実行します。

このテクノロジーへの関心は非常に高く、2023年のValuates Reportsによる調査では、LLMのグローバル市場は2029年までに年平均成長率21.4%で成長し、408億米ドルに達すると予測されています。

LLMを理解する際に重要な概念をいくつか説明します。そのコンセプトとは、以下の通りです。

  • 自然言語。人々が日常生活で使用する言語のことを指します。会話やレポートなど、日常的に使われる言語が該当します。プログラミング言語のように特定の技術的な目的のために設計されたものではありません。
  • 自然言語処理。書面または口頭によるテキストの構造と意味を分析できるデータ処理の一種です。
  • 言語モデル。自然言語をモデル化したもので、フレーズや文章内で次に最適な単語を文脈に基づいて予測することができます。

人間と同様、LLMも完璧ではありません。LLMのアウトプットの質は、インプットの質、つまりLLMのトレーニングに使用される情報の質に依存します。古いデータを使用すると、チャットボットが企業の製品について誤った回答をするなど、ミスが発生する可能性があります。十分なデータが不足していると、LLMは実際に存在しない情報を作り出す(ハルシネーション)場合があります。LLMは予測には優れていますが、少なくとも現時点では、特定の結論に至った理由を説明することにはあまり長けていません。また、多くのLLMは書籍や新聞記事、さらにはウィキペディアのページでトレーニングされているため、著作権侵害の懸念にもつながります。さらに、LLMが厳密に管理されていない場合、例えば機密情報や個人情報を回答に含めるなど、セキュリティ上の問題が生じる可能性もあります。

検索拡張生成(RAG)と呼ばれるAI技術は、LLMのアウトプットの精度と関連性を向上させることで、これらの課題の一部を解決するのに役立ちます。RAGは、基礎となるモデルを変更することなく、対象を絞った情報を追加する方法を提供します。RAGモデルは、通常は組織独自のデータに基づいて、ナレッジ・リポジトリを作成します。このリポジトリは継続的に更新され、文脈に即した回答を迅速に提供します。例えば、チャットボットやその他の会話システムは、RAGを使用して、在庫、購入者の好み、過去の購買に関する最新情報に基づいて顧客の質問に回答します。また、LLMの意図する業務上の文脈と無関係な、または古い情報は除外します。

企業独自のトレーニングを開始する前にAIセンター・オブ・エクセレンスを整備することで、AIプロジェクトの成功率が高まります。当社のeBookでは、その理由と、効果的なCoEを構築する方法について説明します。

大規模言語モデルに関するよくある質問

大規模言語モデルのトップ5は何ですか?

専門家の間でも意見が分かれますが、多くの人が推奨する5つは、OpenAIのGPT-4、AnthropicのClaude 2、MetaのLlama 2、Microsoft ResearchのOrca 2、CohereのCommandです。なお、ChatGPTもOpenAIが開発したLLMの一つです。

LLMとAIの違いは何ですか?

AIは、人間のような行動や能力を模倣できる多くのテクノロジーを包括する幅広い用語です。一方、大規模言語モデルは、テキスト、画像、動画、音声、音楽など、さまざまなコンテンツを生成するAIモデルの総称である生成AIの一種です。