HyDE — Hypothetical Document Embeddings
LLM がユーザーの質問に対して仮想的な回答を生成し、その embedding でベクトル検索を実行。article タイプの項目(item_type が article)専用で、長文コンテンツの意味的マッチング精度を強化。
Hybrid Search + RRF
pgvector cosine 類似度検索と PostgreSQL ILIKE キーワード検索を並列実行、Reciprocal Rank Fusion(k=60)で順位を統合。デフォルト hybrid_weight=0.3 で意味検索寄り、bot ごとに調整可能。
Multi-Query Retrieval
リライト後の質問と元の質問を別々に検索し、項目ごとに最高類似度を採用してマージ。固定回答判定フェーズで使用し、リライトによる取りこぼしを防止。
Query Rewriting + Compound Detection
LLM が代名詞や文脈を補完し、追加質問を独立した完全な質問に変換(「いくらですか?」「サイズは?」のような前文依存の質問を解決)、同時に「一度に複数を聞く」複合質問かを検出。複合質問を検出した場合は自動的に複数の独立サブ質問に分解、下流で個別処理。書き換え・検出・分解を一度に完了、有人切替への誤判定を防ぎます。
Topic Summary Auto-Compilation
項目数が 5 以上になると、LLM が同一トピックをクラスタリングし要約項目(item_type が summary)を生成。要約項目は RRF で 1.4 倍ブースト、統合的な質問への命中を高速化。
Contradiction Detection
新規項目はベクトル類似度 ≥ 0.6 で候補をフィルタし、LLM で数値・ポリシーの矛盾を比較。LLM 失敗時は graceful degradation により書き込みをブロックせず has_contradiction=False を返却。
3 段階回答アーキテクチャ
① 固定回答:類似度 ≥ 0.90 + 長さ > 4 文字 + 非複合質問で発動;② RAG:top-3 項目をコンテキストにして LLM 生成;③ Fallback:min_similarity(デフォルト 0.4)未満で安全メッセージ。各層に独立した閾値があり、回答経路を追跡可能。
マルチ KB アーキテクチャ
検索のたびにクライアント専用 KB とシステム共有 KB を両方検索し、RRF で統合。システム KB の命中は単独で fallback 閾値を通過可能、クライアント KB が外れた際の救済として機能。
Rich Media Reply with Per-Card Threshold
AI の応答はテキスト・画像・URL を同時に配信可能、各プラットフォームのネイティブマルチメッセージ形式を使用。参照される各知識カードは個別に意味的精度をチェック、閾値を超えたカードのみがメディアを提供、「トピックがかすった項目から無関係な画像が引きずり込まれる」ミスマッチを排除。
pgvector + IVFFlat
PostgreSQL pgvector エクステンションで 1536 次元 embedding(OpenAI text-embedding-3-small)を保存。ivfflat インデックス(vector_cosine_ops, lists=10)でエンタープライズ級の検索性能を実現。
全自動有人切替システム
4 種類のトリガー(intent / ai_struggling / fallback / code)+ Pause Timer(Redis ai_disabled キーの TTL 制御)+ LLM 自動生成の引き継ぎサマリー(6 つの記述原則)。fallback counter は Redis 24 時間ローリングカウンタ、閾値到達(デフォルト 2、範囲 1–10)で自動トリガー。
Smart Handoff Structured Output
Smart handoff 有効時、LLM は OpenAI strict JSON schema 制約付き出力(reasoning / needs_handoff / intent / reply)。intent enum は AI が処理できない + 加盟店定義のシナリオに固定され、自由生成によるパース失敗を防止。
Multi-Platform OAuth & Webhook
LINE / Facebook Messenger / Instagram の webhook エンドポイントを統一インターフェース化(例:/webhook/line/redis_id/bot_id)。OAuth 2.0 フローは LINE Login / Google / Facebook / IG Graph API をサポート、CSRF トークンは Redis TTL でキャッシュ。
Compound Question Handling
お客様が一度に複数のことを質問した場合(例「水源はどこ?高雄で設置可能?」)、システムは自動的に複数の独立サブ質問に分解、それぞれに対して完全な RAG 検索と画像マッチングを実行、最終的に複数のメッセージとして個別送信。各メッセージはそのサブ質問のみに対応する内容とメディアを返答。統合回答時の画像テキストミスマッチと情報圧縮を回避、各案件にそれぞれの答えを用意。
Knowledge Gap Auto-Tracking
AI が回答できないあらゆるシナリオ──fallback による安全な定型回答、AI 自己評価が不合格、複合質問内のサブ質問が命中せず、スマート有人切替の発動など──をシステムが「知識ギャップ」として自動記録、頻度順で管理者に提示。オーナーはリストを見るだけで次に追加すべき KB エントリーを把握、会話ログを手動で確認する必要がありません。
Document Direct-Read Import
お客様が PDF / Word / Excel を管理画面にドラッグすると、システムは GPT-5 級モデルを使用してドキュメント全体を一括で直接読み込み──文書構造、表、ポリシー段落を一度に完全理解、知識ベースエントリーに自動分解。従来の「まず OCR / テキストヒューリスティックで段落を抽出し、小型モデルで結合」という多段階損失パイプラインを回避。
Inbound Image Strategy
お客様が画像を送信した場合、各加盟店はシナリオに応じて処理ポリシーを選択可能:① 自動有人切替(人物写真、現場画像、商品実写);② テキスト誘導「テキストで説明をお願いします」;③ 完全無視(ノイズ干渉を回避)。AI が画像内容を強引に解読してハルシネーションすることを防ぎ、各業界に柔軟性を提供。