HyDE — Hypothetical Document Embeddings
LLM 先針對用戶問題生成假設答案,再以該假設答案的 embedding 進行向量檢索。文章式條目(item_type 為 article)專用,補強長文段的語意命中精準度。
Hybrid Search + RRF
pgvector cosine 相似度搜尋與 PostgreSQL ILIKE 關鍵字搜尋並行執行,以 Reciprocal Rank Fusion(k=60)合併排名。預設 hybrid_weight=0.3 偏向語意,可逐 bot 調整。
Multi-Query Retrieval
改寫後問題與用戶原始問題分別執行檢索,依 similarity 取最高分合併(merged map),避免 query rewrite 漏掉邊緣 case。固定回復判斷階段使用合併結果。
Query Rewriting + Compound Detection
LLM 自動將追問還原為含完整代詞與上下文的獨立問題(處理「他多少錢?」「上一個尺寸?」依賴前文的問題),並同步偵測是否為「一次問多件事」的複合提問。命中複合提問時自動拆解為多個獨立子問題,交付下游各自處理。改寫、偵測、拆解一次完成,避免轉真人誤判。
Topic Summary Auto-Compilation
當條目數 ≥ 5 時,LLM 自動將同主題群組化並生成摘要條目(item_type 為 summary)。摘要條目在 RRF 階段獲得 1.4× boost,加速整合性問題的命中。
Contradiction Detection
新條目寫入前先以向量相似度 ≥ 0.6 篩選候選,再呼叫 LLM 比對數字、政策矛盾。LLM 失敗時 graceful degradation 不阻擋寫入,回傳 has_contradiction=False。
三層回復架構
① 固定回復:相似度 ≥ 0.90、長度 > 4 字、非複合問題才觸發;② RAG:取 top-3 條目組 context,LLM 生成回應;③ Fallback:低於 min_similarity(預設 0.4)回安全話術。每層都有獨立閾值與條件,確保回答可追蹤。
多知識庫架構
每次檢索同時搜尋客戶私有 KB 與 system 共用 KB,結果合併 RRF 排名。系統 KB 命中可獨立通過 fallback 門檻,讓共用知識在客戶 KB 未命中時仍能救援。
Rich Media Reply with Per-Card Threshold
AI 回覆可同時帶出文字、圖片、連結,三大社群平台各走原生 multi-message 格式、官網 Web Widget 自家氣泡渲染。每張被引用的知識卡片各自獨立檢查語意精準度——只有跨過門檻的卡片才會貢獻圖文,杜絕「主題擦邊的條目被順手撈出無關圖片」的失誤。
pgvector + IVFFlat
PostgreSQL pgvector extension 儲存 1536 維 embedding(OpenAI text-embedding-3-small),ivfflat 索引(vector_cosine_ops, lists=10)支撐企業級檢索效能。
全自動真人接手機制
四種觸發類型(intent / ai_struggling / fallback / code)+ Pause Timer(Redis ai_disabled key TTL 控制)+ LLM 自動產生交接摘要(六大撰寫原則)。fallback counter 走 Redis 24h 滾動計數,達閾值(預設 2,可設 1–10)自動觸發。
Smart Handoff Structured Output
啟用 smart handoff 時 LLM 走 OpenAI strict JSON schema 約束輸出(reasoning / needs_handoff / intent / reply 四欄位),intent enum 鎖死候選值含「AI 無法處理」+ 商家自訂情境,避免 LLM 自由發揮造成解析失敗。
Multi-Platform OAuth & Webhook
LINE / Facebook Messenger / Instagram 三大社群平台 webhook 端點統一介面(如 /webhook/line/redis_id/bot_id),官網 Web Widget 走獨立 /api/widget/* 端點(無需 webhook),OAuth 2.0 流程支援 LINE Login / Google / Facebook / IG Graph API,CSRF token 走 Redis TTL。
Compound Question Handling
客人一次問多件事(如「水源在哪?高雄能不能安裝?」),系統自動拆成多個獨立子問題,對每個子問題分別執行完整 RAG 檢索與圖文配對,最終以多則訊息分批送出,每則只回該子問題的內容與對應媒體。避免合答時的圖文錯配與資訊壓縮,每件事都有自己的答案。
Knowledge Gap Auto-Tracking
凡是 AI 答不到的情境——fallback 安全話術、AI 自評答不到位、複合問題裡某個子題沒命中、智慧轉接觸發等——系統都會自動記錄成「知識缺口」,依熱度排序給管理員。老闆只要看清單就知道下一步該補哪幾條 KB,不需要人工翻對話紀錄。
Document Direct-Read Import
客戶把 PDF / Word / Excel 拖進後台,系統採用 GPT-5 級模型批次直讀整份文件——文件結構、表格、政策段落一次理解完整,自動拆解為知識庫條目。免去傳統「先用 OCR / 文字 heuristic 抽段落,再用小模型拼接」的多階段失真流程。
Inbound Image Strategy
客人把圖片丟進來時,每位商家可依場景選擇處理策略:① 自動轉真人客服處理(人像、現場圖、商品實拍)② 以文字提示客人「請以文字描述需求」 ③ 直接忽略不回應(避免雜訊干擾)。避免 AI 強行解讀圖片內容導致幻覺,也讓不同行業有彈性。