向量存储 / RAG

使用检索增强生成提升AI的知识能力。

📚 功能介绍

RAG（Retrieval-Augmented Generation）让AI能够：

检索相关文档
基于文档回答问题
扩展知识范围
提供有依据的回复

🗂️ Collections（集合）

创建集合

进入 设置 → 向量存储
点击 "新建集合"
命名集合
添加文档

添加文档

支持的格式：

纯文本 (.txt)
Markdown (.md)
PDF（部分支持）

✂️ 文档分块

文档会被分割成小块以便检索：

策略	说明
固定大小	按字符/Token数分割
句子	按句子边界分割
段落	按段落分割

推荐设置

块大小：200-500 tokens
重叠：10-20%

🔍 相似度搜索

当用户发送消息时：

消息被转换为向量
搜索最相关的文档块
将相关内容注入上下文
AI基于这些内容回复

🎯 提示词集成

自动注入

开启后，相关文档会自动添加到提示词中。

注入位置

可以选择注入位置：

系统提示后
用户消息前
自定义位置

检索数量

设置检索多少个相关块：

推荐：3-5个
过多可能占用上下文

📤 导入/导出

导出集合

以JSON格式导出，包含：

文档内容
向量索引
配置信息

导入集合

从JSON文件恢复集合。

💡 使用场景

角色知识库

为角色创建专属知识库，让AI能准确回答角色相关问题。

世界观设定

大量世界观设定可以存入向量库，按需检索。

长篇故事

存储故事大纲和章节，AI能保持一致性。

---

⚠️ 注意事项

向量计算需要时间
大量文档会占用存储
检索质量影响回答质量

返回功能列表