向量存储 / RAG
使用检索增强生成提升AI的知识能力。
📚 功能介绍
RAG(Retrieval-Augmented Generation)让AI能够:
- 检索相关文档
- 基于文档回答问题
- 扩展知识范围
- 提供有依据的回复
🗂️ Collections(集合)
创建集合
- 进入 设置 → 向量存储
- 点击 "新建集合"
- 命名集合
- 添加文档
添加文档
支持的格式:
- 纯文本 (.txt)
- Markdown (.md)
- PDF(部分支持)
✂️ 文档分块
文档会被分割成小块以便检索:
| 策略 | 说明 |
|---|---|
| 固定大小 | 按字符/Token数分割 |
| 句子 | 按句子边界分割 |
| 段落 | 按段落分割 |
推荐设置
- 块大小:200-500 tokens
- 重叠:10-20%
🔍 相似度搜索
当用户发送消息时:
- 消息被转换为向量
- 搜索最相关的文档块
- 将相关内容注入上下文
- AI基于这些内容回复
🎯 提示词集成
自动注入
开启后,相关文档会自动添加到提示词中。
注入位置
可以选择注入位置:
- 系统提示后
- 用户消息前
- 自定义位置
检索数量
设置检索多少个相关块:
- 推荐:3-5个
- 过多可能占用上下文
📤 导入/导出
导出集合
以JSON格式导出,包含:
- 文档内容
- 向量索引
- 配置信息
导入集合
从JSON文件恢复集合。
💡 使用场景
角色知识库
为角色创建专属知识库,让AI能准确回答角色相关问题。
世界观设定
大量世界观设定可以存入向量库,按需检索。
长篇故事
存储故事大纲和章节,AI能保持一致性。
---
⚠️ 注意事项
- 向量计算需要时间
- 大量文档会占用存储
- 检索质量影响回答质量