跳转至

Mnemosyne 长期记忆插件

为 AI 赋予持久记忆能力,构建个性化对话体验

概述

Mnemosyne 是一个基于 RAG (检索增强生成) 技术和 Milvus 向量数据库的长期记忆管理插件。它能够自动总结对话内容,将其转换为向量存储,并在后续对话中智能检索相关记忆。

信息 内容
版本 v2.1.0
作者 lxfight
仓库 GitHub

核心特性

🧠 自动记忆

  • 自动总结:根据对话轮数自动触发记忆总结与存储
  • 智能检索:基于语义相似度检索最相关的历史记忆
  • 会话隔离:为不同会话维护独立的记忆上下文

🛠️ 管理功能

  • Web 管理面板:可视化管理记忆数据
  • 命令行工具:丰富的命令行指令管理记忆
  • 数据安全:支持 API 密钥认证保护

命令列表

命令 说明 权限
/memory init 初始化记忆系统(首次必须) 管理员
/memory init --force 强制重新初始化(用于维度迁移) 管理员
/memory list 查看所有记忆集合 所有人
/memory list_records [集合] [数量] 列出指定集合的记忆记录 所有人
/memory get_session_id 获取当前会话 ID 所有人
/memory remember [内容] 手动写入一条长期记忆 所有人
/memory reset confirm 清除当前会话记忆 所有人
/memory delete_record [id] [session] confirm 删除单条记忆 管理员
/memory delete_session_memory [id] confirm 删除指定会话记忆 管理员
/memory drop_collection [name] confirm 删除整个集合 管理员

使用示例

记住信息

用户: /memory remember 我的生日是 3 月 15 日
Bot: ✅ 已记录到长期记忆

自然语言记忆

你也可以用自然语言让 Bot 记住信息:

用户: 记住,我喜欢吃草莓蛋糕
Bot: 好的,我记住了~你喜欢吃草莓蛋糕

触发词

以"记住"、"别忘了"、"请记得"开头的消息会自动触发记忆功能。

技术架构

组件 技术 说明
向量数据库 Milvus Lite 轻量级向量存储与检索
Embedding Qwen3-Embedding-0.6B 文本向量化
LLM 总结 配置的 Provider 对话内容总结
检索数量 3 条 每次检索返回的记忆数

工作原理

对话消息 → 达到轮数阈值 → LLM 总结 → Embedding 向量化 → Milvus 存储
用户输入 → Embedding 向量化 → Milvus 相似度检索 → 过滤筛选 → 注入上下文

配置选项

配置项 说明 默认值
num_pairs 触发总结的对话轮数 5
top_k 检索返回的记忆数量 3
collection_name Milvus 集合名称 default
use_session_filtering 是否启用会话过滤 true
use_personality_filtering 是否启用人格过滤 true
enable_explicit_memory_capture 支持显式记忆触发 false

隐私说明

关于数据存储

  • 记忆数据存储在本地服务器
  • 按会话隔离,不同用户的记忆互不干扰
  • 可随时使用 /memory reset confirm 清除

常见问题

初始化失败怎么办?
  1. 确保已配置 Embedding Provider
  2. 检查 Milvus 连接是否正常
  3. 查看日志获取详细错误信息
记忆检索不准确?
  • 尝试增加 top_k
  • 检查 Embedding 模型是否正确加载
  • 确保记忆内容足够丰富

更多信息