👁️‍🗨️

Slackで社内文書検索 4/4回（任意のLLMによる回答生成編）

2023/10/28 21:522025/1/8 21:45

✅

はじめに概要任意のLLMによる回答生成 1. イベントを受け取る 2. 資料を検索する 3. 資料をロードする 4. 回答生成回答生成と返信をするファンクション最後に参考

関連記事

LangGraphとは

はじめに

この記事は、「Slackで社内文書検索 3/4回（Slackからのコマンドとメッセージの受信編）」の続きです。

開発の流れは以下の通りです。

💡

開発の流れ

Slack APIアプリの作成と設定

Vertex AI Searchのアプリの作成とデータストアの自動更新

Slackからのコマンドとメッセージの受信

任意のLLMによる回答生成

今回は任意のLLMによる回答生成について説明していきます。

Cloud Functionsのファンクションの作成やコードだけが見たい方はこちら

概要

今回は以下の処理のうち、Pub/Subからイベントを受け取って、ユーザに返答するまでの処理の説明をします。

任意のLLMによる回答生成

今回の見出しが任意のLLMとなっているのは、コマンドによってLLMを指定して回答を生成するようにしているからです。コマンドは「Slackで社内文書検索 1/4回（Slack APIアプリの作成と設定編）」の記事で示しましたが、再度示しておきます。

コマンド	説明	備考
/palm2	回答生成に使うLLMモデルを「PaLM2」にする。	コマンドに続けて質問文を送る。
/gpt-3	回答生成に使うLLMモデルを「GPT-3.5」にする。	コマンドに続けて質問文を送る。
/gpt-4	回答生成に使うLLMモデルを「GPT-4」にする。	コマンドに続けて質問文を送る。

回答生成では、Vertex AI Searchのアプリを用いて、メッセージ（質問）に対する関連資料を検索し、任意のLLMモデルを使ってその資料の内容を参考に質問に関連する回答を生成します。

回答生成の処理の概要を以下に示します。

1. イベントを受け取る

Pub/Subからイベントを受け取る部分は、Cloud Functionsでファンクションを作成する際にトリガーとしてPub/Subを指定することで実現にします。

設定方法はこちらで説明しています。

受け取ったイベントからメッセージとコマンドを取り出すには以下のように関数を定義します。

2. 資料を検索する

ここではVertex AI Searchのアプリを使って、質問に関連のある資料を検索します。

今回はLangChainのRetrieversのGoogleVertexAISearchRetrieverを用いてVertex AI Searchの検索機能を実装しました。

GoogleVertexAISearchRetrieverを呼び出す際にたくさん引数を渡しますが、今回はmax_documentsに注目して説明します。その他の引数の説明についてはこちらをご覧ください。

max_documentsは検索結果として表示する資料の数を指定するものになります。今回は1にしていますが、データストアが大規模になるにつれ、関連資料が増えてくると考えられるので、将来的には複数の資料を引用して回答生成することも視野に入れています。

上記のresultには参考資料のURLやその資料の要約などが含まれていますが、要約の精度があまり良くなかったので、今回はURLのみを利用します。

また、documentではURLから資料の名前（例：○○.pdf）を取り出しています。

3. 資料をロードする

ここでは、検索してきた資料の内容をロードします。

今回は、LangChainのDocument loadersのGCSFileLoaderを用いて、ファイルをロードします。

関数の中で、資料検索とファイルのロードをしています。

4. 回答生成

ここでは、PaLM2とGPT-3.5、GPT-4の3つのLLMで回答を生成します。

今回は、LangChainのChainsを用いて回答を生成します。回答生成の処理は以下のようになります。PaLM2ではStuff、GPT-3.5、GPT-4ではMap Reduceという方法をとります。

回答生成の処理
Summarization | 🦜️🔗 Langchain
Open In Colab
https://python.langchain.com/docs/use_cases/summarization#splitting-and-summarizing-in-a-single-chain

PaLM2

PaLM2は試作段階であり、GPT-3.5やGPT-4に比べ、出力の大きさが小さい上に、クオリティも低い。（2023/10/30現在）

そのため、PaLM2はStuffDocumentsChainを用いて、テキストを参考に回答生成する簡単な処理になっています。

StuffDocumentsChainを用いた理由としては、StuffDocumentsChainはドキュメントを複数プロンプトに埋め込めるという特徴を持っているので、将来的に回答生成に利用する資料の容量が増えたときに対応が楽になるからです。

The stuff documents chain ("stuff" as in "to stuff" or "to fill") is the most straightforward of the document chains. It takes a list of documents, inserts them all into a prompt and passes that prompt to an LLM.
This chain is well-suited for applications where documents are small and only a few are passed in for most calls.
Stuff | 🦜️🔗 Langchain
The stuff documents chain ("stuff" as in "to stuff" or "to fill") is the most straightforward of the document chains. It takes a list of documents, inserts them all into a prompt and passes that prompt to an LLM.
https://python.langchain.com/docs/modules/chains/document/stuff

以下にコードを示します。

今回ChatVertexAIのモデルはchat-bisonを用いましたが、目的に応じてモデルも変更できます。モデルの一覧は以下のサイトをご覧ください。

Model API reference for Generative AI | Vertex AI | Google Cloud

Generative AI on Vertex AI (also known as genai) gives you access to Google's large generative AI models in Vertex AI.

https://cloud.google.com/vertex-ai/docs/generative-ai/model-reference/overview

GPT-3.5とGPT-4

GPT-3.5、GPT-4では回答生成に、load_summarize_chainを用います。

load_summarize_chainを用いることで、Map Reduceを簡単に実装できます。

処理の流れを簡単に説明します。まず、参考資料を分割して、それぞれの資料から回答生成に必要そうな情報を抽出します（下のコードのPROMPT）。次に、分割された資料から抽出した情報から回答生成を行います（下のコードのCOMBINE_PROMPT）。

以下にコードを示します。

回答生成と返信をするファンクション

以上の説明を踏まえてファンクションを作成します。

今回作成するファンクションの作成方法は前々回の記事と変わらないので、こちらを参照してください。ただし、前回の記事と異なる部分があります。その部分は以下に従ってください。

📌

変更内容

トリガー

HTTPS

未認証の呼び出しを許可を選択

トリガーの追加

説明

トリガーを追加を選択します。

Pub/Subトリガーを選択します。

イベントで「google.cloud.pubsub.topic.v1.messagePublished」を選択します。

Cloud Pub/Sub トピックを選択してくださいで前回の記事で作成したトピックを選択します。

トリガーを保存を選択します。

ランタイム環境変数

以下の４つを追加

名前	値
PROJECT_ID	Google Cloud のプロジェクトID
BUCKET_ID	GCSのバケット名 (gs:// は不要)
DATA_STORE_ID	Vertex AI SearchのアプリのデータストアのID
OPENAI_API_KEY	OPENAIのAPIキー
SLACK_BOT_TOKEN	アプリの認証に用いるトークン
SLACK_SIGNNG_SECRET	リクエストの認証に用いるサイン
WEBHOOK_URL	Slackのワークスペースのチャンネルに返信するのに用いる