page icon

【Difyで作るシリーズ 1】PDFファイルの要約 (v1対応)

はじめに

今回は、PDFファイルを日本語で要約するワークフローを作成する方法について紹介します。
🙂
この記事の対象者
  • Dify という言葉を聞いたことがあるが、何ができるのかがわからない方
  • Dify を業務に取り入れたいと検討している方
事前準備
  • Dify へのサインアップ
  • OpenAI APIまたはGemini APIのAPIキーの取得
    • Gemini APIの場合
        1. ここにアクセスし、「APIキーを作成」を選択します。
        1. 「新しいプロジェクトでAPIキーを作成」を押します。
        1. APIキーをコピーします。
    • Open AI APIの場合
      • サインアップした後、こちらからAPIキーを作成し、保存します。
  • APIキーのセットアップ

環境

  • Chrome
  • Dify v1.5.1(2025年7月10日時点)フリープラン
💡

Difyとは?

Difyとは、プログラミング言語を使わなくても直感的な操作でAIチャットボットやAIアプリを構築できるツールです。

Dify 特徴

Dify の3つの特徴を説明します。
  1. OSS(オープンソース)のLLMアプリ開発プラットフォーム
    1. DifyはOSSであるため誰でも自分の環境で使うことができます。またOSSであるため利用者の声が開発者に届きやすくアップデートの頻度が高いのも特徴です。
  1. ノーコードでAIアプリを作成できる
    1. Difyでの操作はノーコードで行われます。非エンジニアにでもローコストでAIアプリを作ることが可能です。
  1. 作成したAIアプリの公開が簡単にできる
    1. Difyで作ったAIアプリは簡単にユーザーに共有できます。WEBブラウザでアクセスで来るURLを発行して使ってもらったり、ホームページにチャットボットとして埋め込むことも可能です。

作成するAIアプリの概要

完成イメージ

まずは、今回作成するアプリの完成イメージについてです。
このアプリは、ブラウザからAIアプリにアクセスして使用します。
📌
イメージ
使い方は以下の通りです。
  1. 画面の左側からファイルを選択してアップロードします。
  1. エクスキュートボタンを押します。
  1. 右画面に要約文が表示されます。

作成するワークフロー

上記のアプリを構築するためにワークフローを作る説明をします。
💡
ワークフローとは
一つ一つの処理を小さなブロック(ノード)としてつなぎ合わせて、一連のプロレスを自動化する機能です。
今回作成するワークフローのDifyの画面です。
このワークフローは、4つのブロックで構成されます。
  1. 「開始」ブロックでPDFをアップロードします。
  1. 「テキスト抽出」ブロックでPDFの内容を読み込み、LLMが理解できるようにします。
  1. 「LLM」ブロックでPDFの内容を要約します。
  1. 「終了」ブロックで要約した結果を出力します。

作業手順

ここからは、ワークフロー構築の手順について説明します。
手順
  1. APIキーのセットアップ
  1. ワークフローの新規作成
  1. ワークフロー作成画面上での作業
  1. ワークフローの動作確認

1. APIキーのセットアップ

  1. まず、右上の「Dify」を選択してから「設定」を選択します。
  1. 設定画面の「モデルプロバイダー」を選択し、Geminiの「セットアップ」を選択します。
  1. 「API key」を入力してから「保存」を選択します。

2. ワークフローの新規作成

  1. 最初の画面の「最初から作成」を選択します。
  1. 「ワークフロー」を選択し、「アプリのアイコンと名前」を入力してから「作成する」を押します。
 

3. ワークフロー作成画面上での作業

  1. ワークフロー作成画面が表示されます。「開始」ノードが表示されているので「開始」ノードを選択します。
    1. 「開始」ノードにPDFをアップロードするための機能を設定します。
      「+」ボタンを押します。
      下記の表のように各項目の値を設定します。
      項目備考
      フィールドタイプ単一ファイル1つのファイルをアップロードできます。
      変数名file任意の名前(テキスト抽出の際に使用)
      ラベル名file任意の名前(変数名と同じにしておくとわかりやすいです)
      サポートされた ファイルタイプドキュメントアップロード可能にするファイルの種類を選択できます。
      アップロードされた ファイルタイプ両方ローカルアップロード(ローカルに保存されているファイルをアップロード)」か、「URL(URLを取得してアップロード)」か、「両方」を選択できます。
      入力後、「保存」を選択します。
  1. 「開始」ノードの「+」ボタンを押し、ブロック一覧の「テキスト抽出」を選択します。
    1. 「テキスト抽出」の入力フィールドを編集します。
      項目備考
      入力変数「開始 / file File」「開始」ノードで設定した「file」を選択します。
  1. 「テキスト抽出」ノードの「+」ボタンを押し「LLM」を選択します。
    1. モデル一覧で「Gemini 2.5 Pro」を選択します。
      「SYSTEM」欄にプロンプトを入力します。
      今回はとしました。
      💡
      プロンプトとは
      生成AIに与える指示文のことです。生成AIに何をして欲しいのかを記述します。 (いつも使っている生成AIのチャットのようなイメージ)
      改行し、「{x} 」ボタンを押して「テキスト抽出」の「{x} text」を選択します。
  1. 「LLM」ノードの「+」ボタンを押し、「終了」を選択します。
    1. 出力変数の変数名に「output」と入力し、変数に「LLM」の{x} textを選択します。
      以上でワークフローが完成しました。

4. ワークフローの動作確認

  1. ワークフローを作った後に正しく動くか動作確認をします。
    1. 「公開する(「更新を公開」の部分)」を選択し、「アプリを実行」を選択します。
      💡
      「公開する」と?
      アプリをすぐに利用できるWebページのURLが作成されます。ユーザーはこのURLにアクセスすることでアプリを利用できるようになります。
      ただし、URLを知っている人ならば誰でも利用できるようになるため、ワークフロー内で社外秘の情報を設定している場合、外部の人間がその情報にアクセスできる危険性があります。URLの公開については社内のポリシーなどを確認してから公開しましょう。
      以下のようなページに移りますので、PDFファイルをローカルからアップロードするか、PDFファイルのURLを入力します。
  1. 「Execute」を押します。
  1. 結果は、以下のようになりました。
    1. 無事にPDFを要約した内容が出力されました。

応用

今回の記事では、DifyのUI(画面)を使用したアプリを作成しましたが、Difyで作成したワークフローをSlackから呼び出して通知するアプリにすることも可能です。たとえば、SlackからPDFを投稿すると自動的にその要約が返ってくるチャンネルを作成できます。

おわりに

今回の記事では、Difyを使ってPDFファイルを要約するワークフローの作成手順を紹介しました。Difyを使うことで、PDF要約に限らずデータ処理やチャットボットなど、さまざまな自動化アプリを作成できます。
今後もDifyを活用したさまざまなユースケースを紹介していく予定ですので、ぜひ引き続きご覧ください。
ver.1.0から以下の要素を変更しています。
  • ノード名の変更
  • Gemini 2.5 Proの使用
(2025/07/04時点)
 

サービス紹介

Dify の構築や、ワークフローの作成は、見た目以上に複雑で思っていたより大変な部分も多いんです。でも、ご安心ください。弊社のサービスで、そんな面倒な作業も丸投げできちゃいます。
「自分たちで全部やるのは時間もないし無理だな」と感じたとき、ぜひお任せください。本当にやりたいことに集中できるよう、しっかりサポートいたします。お気軽にご相談ください!