こんにちは、佐藤です👓。
今回はTreasure Dataの新機能『AI Agent Foundry』を利用して、Kaggleが提供しているデータセットの分析を試してみたいと思います。
複雑なコードが書けなくても十分実装可能で、ハンズオン形式で使い方の説明を行っていますので、興味のあるかたはぜひ参考にしてみてください。
- Treasure Data AI Agent Foundryとは
- 1. エージェントに与える情報の準備
- 2.プロジェクトの作成
- 3.ナレッジの作成
- 4. エージェントの作成
- 5. データ分析を依頼してみる
- 6.感想
Treasure Data AI Agent Foundryとは
Treasure Data AI Agent Foundryとは、Treasure Dataに格納されているテーブルをインプットとしてAIエージェントを構築することができるアプリケーションです。
今回はこのツールを利用してどのようなことができるのか検証してみます。

1. エージェントに与える情報の準備
今回はKaggleが提供しているデータセットである「The Most Popular Books for Exchanging」を利用してこのデータ分析をAIに依頼します。
抽出するデータについて
今回利用する「The Most Popular Books for Exchanging」はブックコミュニティでユーザ同士がよく交換した本の情報がまとめられているデータです。海外では書籍交換をWEB上でおこなえるサービスがあるようです。カラムを見ると、ページ数やタグなどが情報として含まれていて、なかなか興味深いです。
テーブルの作成&データ挿入
今回挿入するデータのスキーマは、以下の画像ような形式になっています。

ダウンロードしたCSVファイルのスキーマ情報を参考にTreasure DataのGUI画面からテーブル(スキーマ)作成し、Integration HubからCSVデータを挿入します。
データ挿入完了後クエリを叩くと、早速見覚えのある本のタイトルがたくさん含まれていることが確認できます。

2.プロジェクトの作成
それでは早速AI Agentを作成する準備に入りたいと思います。
AI Agentを作成には、まずプロジェクトの作成が必要です。手順は以下の通りです。
1. AI Agent Foundryの画面を開き、右上の「プロジェクト作成」ボタンをクリック

2.遷移後の画面で『プロジェクト名』の記載と『オプションの選択』をし、「作成」ボタンをクリックするとプロジェクトが追加されます。

3.ナレッジの作成
プロジェクトの作成が完了すると、以下の画面に遷移します。この画面でエージェントの作成やエージェントにインプットしたいテーブルの設定が可能です。
この章では、エージェントに読み込んでもらいたい情報(テーブル)をインプットさせるために必要な『ナレッジベース』の作成方法を説明します。

1.「ナレッジベース」を選択しクリック

2.画面遷移後、「ナレッジベースの作成」をクリック

3.ナレッジベースのタイプで『データベース』を選択。インプットしたいテーブルが格納されているデータベースを選択後、「作成:ボタンをクリック

以上の手順を踏むことでAIにインプットしたいデータの格納が可能です。
※ナレッジベースの登録は複数可能。3の手順でテキストを選択することで、データベースの情報だけでなくテキストで事前知識をインプットすることも可能。
今回はデータベースに格納されているスキーマ情報などの概要を記載して、新たにナレッジベースを作成します。

4. エージェントの作成
この章では、実際にこれまで登録したナレッジベースなどを元にAIエージェントの作成を行います。
1.「エージェント」のタブを選択後、「エージェントの作成」ボタンをクリック

2.エージェント名や使用するモデルを選択します。今回は、最大ツールイテレーション数と温度はデフォルトの”0”で設定しました。設定後、「次へ」をクリック

3.システムプロントの設定画面に遷移します。ここでAIの回答ルールなどの設定が可能です。設定が完了後、「次へ」クリック

4.3の手順後、ツールの設定画面に遷移します。こちらで実際に作成したナレッジベースの登録します。「ツールの追加→対象(ナレッジベースを選択)→対象ナレッジベース(作成したナレッジベースの名前を選択)」を実施し、作成したナレッジベースを登録してください。完了後、「次へ」をクリック

5.出力の画面に遷移します。今回は利用しないので、そのまま「次へ」をクリック

6.プロンプト変数の画面に遷移します。今回は利用しないので「作成」をクリック

これで設定は完了です!
それでは実際にプロンプトを入力して、「The Most Popular Books for Exchanging」の内容を分析してもらいましょう🕶
5. データ分析を依頼してみる
まずはインプットされているテーブルの概要について聞いてみました。
Questions.インプットされているテーブルの情報について教えてください

AI回答

すごいです…!データの概要をよい感じにまとめてくれています。
特徴も出してくれていて、期待が高まります・・!
では実際に分析してもらって、何か面白い結果などがあれば、教えてもらいましょう。
Questions. books_reputationのテーブルを分析して何か面白い結果などがあれば教えてください

AI回答


すごいですね…!よい感じにまとまってると思います。
結果を見ると、J.K.ローリングのような有名作家が高評価を集めているのは「まぁそうだろうな」と予感していましたが、ページ数における評価のレンジなどが含まれており、なかなか興味深い結果を出力してくれました。
また使って気づいたのですが、実際にどのようなプロセス(SQL)を組んでAIがその回答を得たのかも見ることができ、本当に正しいクエリをかけているのかも以下のように確認可能なので、なかなか面白いです(笑)

6.感想
今回はTreasure Dataの新機能『AI Agent Foundry』を利用して実際にAIにデータの分析を試してみました!設定が簡単で、特にプログラミングの知識は必要なかったので、敷居は低く感じました。
今後も気になったツールなどは積極的に記事として残していこうと思いますので、よろしくお願いします。