金融Operate

金融サービス企業(従業員300名)| 2024年6月〜2024年8月(2ヶ月)

AIエージェントの品質安定化とエラー率60%削減を実現

OpenTelemetryベースのオブザーバビリティ基盤を構築し、AIエージェントの品質・コスト・セキュリティを統合管理

エラー率

60%

削減

平均応答時間

45%

改善

インシデント検知

5分

以内

月間コスト

20%

削減

Before — Challenges

プロジェクト開始前の課題

01

チャットボットの品質が安定しない

社内で導入した顧客対応チャットボット(1本番稼働、2件PoC中)の出力品質にばらつきがあり、週に数回「明らかに間違った回答」が発生。しかし、いつ・なぜ品質が劣化するのかを把握する手段がなかった。

02

トークンコストの不透明さ

月間のAPI利用料が当初見込みの45万円を超過する月が続いていたが、どの処理がコストを押し上げているのか分析できていなかった。

03

障害対応の遅延

AIエージェントの障害はユーザーからの報告で初めて認知する状態。平均検知時間は2時間以上で、金融サービスとしては許容できないレベルだった。

How — Approach

CIALTEのアプローチ

Phase 3

オブザーバビリティ基盤構築

OpenTelemetryとCloud Traceを組み合わせ、AIエージェントの全リクエストをトレーシング。プロンプト→LLM応答→後処理の各段階でレイテンシ・トークン数・エラー率を計測する基盤を構築。

Why this approach

既存のAPMツールではLLMの内部動作を可視化できない。OpenTelemetryのカスタムスパンを活用し、AIエージェント特有のメトリクス(トークン消費、プロンプトバージョン、応答品質スコア)を計測可能にした。

Phase 3

異常検知・自動アラート実装

品質スコアの閾値監視、トークン消費の異常検知、エラー率のスパイク検知を実装。Slackへの自動アラートと、重大インシデント時のフォールバック処理(安全な定型応答への切り替え)を組み込んだ。

Why this approach

金融サービスでは「間違った回答を返す」ことが最大のリスク。品質劣化を検知した瞬間に安全な応答に切り替えるフォールバック機構により、ユーザーへの影響を最小化。

Technology Stack

OpenTelemetryGoogle Cloud TracePrometheusGrafanaPythonSlack API
After — Results

プロジェクトの成果

MetricBeforeAfter
エラー率5.2%2.1%
平均応答時間3.2秒1.8秒
障害検知時間2時間以上5分以内
月間APIコスト45万円36万円

「AIの中身が見えるようになった」と情シス部門から高評価

障害対応が事後対応からプロアクティブな予防保守に転換

コスト可視化により、経営層へのAI投資の説明責任を果たせるように

Client Voice
"AIを導入したものの、ブラックボックス状態で不安でした。CIALTEのAI運用監視基盤を入れてから、AIの動作が完全に可視化され、問題が起きる前に対処できるようになりました。金融業界では「説明できないAI」は使えない。CIALTEはそれを理解してくれていた。"

情報システム部 マネージャー

金融サービス企業

Timeline

プロジェクトタイムライン

Phase 0

現状分析

1週間
既存エージェント調査メトリクス設計
Phase 3-1

基盤構築

4週間
OTel導入ダッシュボード構築
Phase 3-2

異常検知実装

3週間
アラート設定フォールバック実装

Next Case Study

自動車部品メーカー

プロンプト最適化とキャッシュ戦略でトークンコスト40%削減、品質維持

詳細を見る

次の成功事例は、貴社かもしれません

貴社のAI導入について、お気軽にご相談ください。

お問い合わせ