Data Analyst Agent を使うべきタイミング
- データベースをクエリする: 接続済みのデータソースに対して SQL クエリを作成・実行する
- データを分析する: パターンを探索し、指標を計算し、データ内のトレンドを調査する
- 可視化を作成する: seaborn を使って本格的なチャートやグラフを作成する
- データに関する質問に答える: データに関する質問に対して、迅速かつ正確な回答を得る
- インサイトを得る: パターンや異常値を発見し、アクションにつながる知見を導き出す
データアナリストエージェントにアクセスする
Webアプリから利用する場合
- Devinのホームページに移動します
- エージェント選択のドロップダウンをクリックします
- ドロップダウンメニューから Data Analyst を選択します
- データに関する質問やタスクを入力してセッションを開始します
Slack から
!dana マクロでのメンションの使用:
前提条件
- Database MCP: Redshift、PostgreSQL、Snowflake、BigQuery、その他の SQL データベース
- Analytics MCP: Datadog、Metabase、その他の可観測性プラットフォーム
MCP 連携をセットアップする
MCP を通じてデータベースやその他のデータソースを接続する方法を確認してください
仕組み
データベースナレッジ
プロンプト例
シンプルな質問
- 「先週のアクティブユーザー数はいくつですか?」
- 「直近1か月の日次売上の推移を教えてください」
- 「利用量が最も多いのはどの顧客ですか?」
集計とメトリクス
- 「過去30日間のプラン別平均セッション時間を教えて」
- 「第4四半期の地域別・製品ライン別の合計売上高を表示して」
- 「今週の各APIエンドポイントごとの95パーセンタイルのレスポンス時間を計算して」
結合とテーブル間分析
- 「users テーブルと orders テーブルを結合して、生涯価値が高い順に上位 20 名の顧客を表示」
- 「サインアップ元と 30 日間リテンションを相関分析して、どの獲得チャネルのリテンション率が最も高いかを表示」
- 「セッションデータと請求データを組み合わせて、利用量が多いのに支出が少ないアカウントを特定」
フィルタリングとセグメンテーション
- 「2025年1月以降にサインアップし、セッション数が100を超える Enterprise 顧客のみを表示してください」
- 「エラーログを、直近48時間の payments サービスにおける 5xx エラーだけに絞り込んでください」
- 「トライアルアカウントを除外し、Enterprise 顧客とセルフサービス顧客ごとに消費量を内訳してください」
時系列分析
- “過去6か月間の週次アクティブユーザー数をプロットし、変化率が10%を超えた週をハイライトして”
- “2025年と2024年のサインアップ率を月次で比較して表示して”
- “過去90日間のAPIコール数の日次トレンドを表示して。7日間移動平均を重ねて”
調査と異常検知
- 「先週の火曜日にサインアップ数が減少した理由を教えてください。関連するインシデントやデプロイがなかったか確認してください」
- 「今週のエラー率に異常値はありますか?」
- 「今月の各種指標を昨年の同時期と比較し、大きな乖離があればフラグを立ててください」
複数ステップの分析
- 「Q4 のコホート別にユーザーリテンションを分析し、離脱が最も大きいコホートを特定して、考えられる原因を提案する」
- 「セッション数が最も多いユーザー上位 10 名を抽出し、そのアクティビティを時系列で表示し、チャーンしそうなユーザーにフラグを付ける」
サポートされているデータソース
SQL データベース
| データソース | MCP 名称 | 設定 |
|---|---|---|
| Amazon Redshift | Redshift | 接続文字列 + 認証情報 |
| PostgreSQL | PostgreSQL | 接続文字列 |
| Snowflake | Snowflake | アカウント + 認証情報 |
| Google BigQuery | BigQuery | OAuth またはサービス アカウント |
| MySQL | MySQL | 接続文字列 |
| SQL Server | SQL Server | 接続文字列 |
| Neon | Neon | OAuth |
| Supabase | Supabase | パーソナル アクセス トークン |
| Cloud SQL (PostgreSQL, MySQL, SQL Server) | Cloud SQL | OAuth |
分析およびオブザーバビリティプラットフォーム
| データソース | MCP 名 | 設定方法 |
|---|---|---|
| Datadog | Datadog | APIキー + アプリケーションキー |
| Metabase | Metabase | OAuth |
| Grafana | Grafana | URL + サービスアカウントトークン |
| Sentry | Sentry | OAuth |
データソースを接続する
- Settings > MCP Marketplace に移動します
- 使用したいデータソースを見つけて Enable をクリックします
- 必要な認証情報(接続文字列、APIキー、または OAuth)を入力します
- Data Analyst セッションを開始します — エージェントが接続済みのデータソースを自動的に認識します
MCP 連携をセットアップする
各データソースごとの詳細なセットアップ手順
複数のデータソースを同時に接続できます。Data Analyst Agent はクエリのコンテキストに応じて適切な MCP ツールを使用します。
ベストプラクティス
メトリクスを具体的にする
期間を指定する
特定の出力形式を依頼する
ビジネスロジックを事前に定義する
比較やコンテキストをリクエストする
結果を反復しながら深掘りする
- まずは大枠から: 「今四半期の売上上位10社の顧客は?」
- 絞り込む: 「そのうち上位3社について、過去1年間の月次売上推移を見せて」
- 調査する: 「顧客Xは3月に売上が急増している。何が要因だった?」
SQL を検証する
出力形式
テーブル
グラフと可視化
- 折れ線グラフ — 時系列の推移、時間経過に伴う比較
- 棒グラフ — カテゴリ間の比較、ランキング
- ヒートマップ — 相関行列、アクティビティパターン
- 散布図 — 2つの指標間の関係分析
要約とインサイト
- 分析結果の要約 — 質問に対する平易な言葉での回答
- SQL クエリ — ロジックを検証できるよう、実際に使用した正確なクエリ
- 主要な数値 — 特に重要な指標
- データインサイト — パターン、異常値、注目すべき発見
- Metabase リンク — 組織で MCP 経由で Metabase を接続している場合、さらなる分析のためにインタラクティブなダッシュボードへのリンクが含まれることがあります
Knowledge の管理
- 新しいスキーマ情報やテーブル同士の関係
- ビジネスロジックやメトリクスの定義
- データ品質に関するパターンや注意点
Knowledge についてさらに詳しく
Devin の Knowledge システムの仕組みを理解する
標準版 Devin との違い
| 機能 | Data Analyst Agent | 標準版 Devin |
|---|---|---|
| SQL クエリ実行 | 最適化済み | サポートあり |
| データ可視化 | seaborn の組み込みサポート | 手動セットアップが必要 |
| データベーススキーマの把握 | 事前に読み込まれた Knowledge | オンデマンドでの探索 |
| 応答スタイル | 簡潔でメトリクス重視 | 詳細な説明 |
| コード変更 | 主な対象ではない | フルサポート |
| MCP 連携 | 必須 | 任意 |
