Retrieval-Augmented Generation 不只是「向量数据库 + LLM」,分块策略、召回质量、重排序、缓存才是工程核心。
深入拆解 AI Agent 的四种记忆类型、上下文窗口压缩策略、RAG 向量检索原理,以及三种典型失败模式和工程选型建议。