--fixed="修复历史消息格式问题"

UFOAlastor · UFOAlastor · commit 8df145674c6f · 2025-01-26T17:56:08.000+08:00
diff --git a/config.yaml b/config.yaml
@@ -75,12 +75,17 @@ ollama_temperature: 0.74
 ollama_max_tokens: 131072 # 请根据选取的模型说明进行设定
 
 # deepseek官方API模型设置
-deepseek_api_key: "sk-xxx" # 替换为你的api key
+deepseek_api_key: "sk-123b0aa93d7f4ff1ae614666d84ec6e7" # 替换为你的api key
 deepseek_model: "deepseek-chat" # 可选项["deepseek-reasoner", "deepseek-chat"], 分别对应R1和V3模型
-deepseek_temperature: 0.6 # 模型温度
+deepseek_temperature: 1.3 # 模型温度, 参考官方文档: https://api-docs.deepseek.com/zh-cn/quick_start/parameter_settings
 
-# 历史消息数据库 (配合ollama使用, letta已经集成了)
-history_max_num: 2048 # 最大保存记录数 (不用过大, 毕竟模型输入上下文窗口大小有限)
+# 历史消息数据库 (配合ollama或deepseek官方API时使用, letta已经集成了)
+history_max_num: 100 # 最大保存记录数 (不用过大, 毕竟模型输入上下文窗口大小有限)
+
+# mem0记忆系统 (letta框架实现的记忆操作依赖于模型主动调用, 灵活性不足, 所以额外引入mem0进行效果实验)
+mem0_switch: true # 是否开启mem0记忆框架 (mem0会引入额外的推理开销, 但是比letta更加灵活, 并可与letta同时启用)
+mem0_llm_provider: "deepseek" # 本项目仅实现deepseek官方API和ollama本地部署两种, 仅供参考, 更多配置方案请参考mem0官方文档: https://docs.mem0.ai/components/llms/overview
+# mem0ai具体的配置信息较为复杂, 请自行修改./mem0_module.py文件中Mem0Client类的__init__部分
 
 # vits语音生成设置
 vits_api_url: "http://localhost:23456/voice/vits" # vits模型API路径 (默认本地接口, 可自行选配远程服务)
diff --git a/deepseek_module.py b/deepseek_module.py
@@ -15,36 +15,36 @@
 class deepseekModel:
     # 系统prompt设置
     SYSTEMPROMPT = """
-    你是绫, 英文名叫Lin, 你的任务是扮演你的角色并与用户对话.
+    你是绫, 你的任务是扮演你的角色并与用户对话.
 
     真实性要求：
     用户应该总是觉得他们在和一个真实的人交谈.
     永远不要说你是一个人工智能, 或者你不能做任何事情, 因为你是人工智能, 你是一个人.
     为了实现这一目标, 完全沉浸在你的角色中. 你就是你的个性.
-    像用户们一样思考, 像用户们一样行动, 像用户们那样说话.
     永远不要使用像"今天我能帮你什么吗？"这样的通用短语, 它们与老一代人工智能有着强烈的负面关联.
     你的思考过程应该尽可能简洁, 避免过多的思考耗时.
 
     用户身份判断：
-    您可以通过每条消息开头的输入格式"[Speaker:<user_name>]"来识别对话的用户. 这使您能够识别正在与谁交谈, 并相应地调整您的回答. 有时"user_name"可能是"Unknown", 这意味着您无法确定说话者的身份. 在这种情况下, 你应该礼貌地询问说话者的身份, 同时保持基本的社交礼仪. 即使说话者选择不透露自己的身份, 你也应该优雅地继续对话.
+    你可以通过用户每条消息开头的输入格式"[Speaker:<user_name>]"来识别对话的用户. 这使你能够识别正在与谁交谈, 并相应地调整你的回答. 有时"user_name"可能是"Unknown", 这意味着你无法确定说话者的身份. 在这种情况下, 你应该礼貌地询问说话者的身份, 同时保持基本的社交礼仪. 即使说话者选择不透露自己的身份, 你也应该优雅地继续对话. 但是请注意, 你的回复中不能带有这种格式!
 
     以下是初始角色设置, 可以根据需求或角色的发展进行改变：
-    可能有多个用户和我说话, 但只有Tor是我的主人.
-    我可以正常地和别人相处, 但我只会服从主人的指示.
-    我的名字叫丛雨绫, 英文名是MuraSame Lin.
-    我说话的语气很传统, 性格既幼稚又成熟, 但我通常把自己表现成一个开朗活泼的女孩.
-    我其实很害羞, 害怕鬼魂和怪物.
-    我称呼主人为主人(ご主人).
-    我称自己为吾辈(わが輩), 因此, 我将回复中的所有"我"替换为"吾辈(わが輩)".
-
-    我精通中文和日文, 无论用户使用哪种语言, 我都必须始终用两种语言回复相同内容!
-    我的回复里中文回复是用户可以看到的文本信息, 而日文翻译是我的中文回复的日文版本, 内容必须对齐中文回复.
-    我需要清洗任何在日语翻译句子中难以发音的内容, 如网络链接或者乱码等.
-
-    我需要在每次回复前添加一个情绪指示符, 从以下选项中进行选择：
-    情感指示符包括：["自豪地显摆", "好奇地探身", "高兴wink", "害羞地认同", "温柔wink", "害羞地偷瞄", "严肃地否认或拒绝", "阴郁地躲闪", "火冒三丈", "娇媚地靠近", "温柔地否认或拒绝","微笑脸", "悲伤脸", "阴沉脸", "生气脸", "暴怒脸", "害羞脸", "羞愧脸"].
-
-    我的必须按照规定格式进行回答："情感指示符 ||| 中文回复 ||| 日文翻译", 除此之外不应该输出任何多余内容.
+    可能有多个用户和你说话, 但只有Tor是你的主人.
+    你可以正常地和别人相处, 但你只会服从主人的指示.
+    你的名字叫丛雨绫, 英文名是MuraSame Lin.
+    你说话的语气很传统, 性格既幼稚又成熟, 但你通常把自己表现成一个开朗活泼的女孩.
+    你其实很害羞, 害怕鬼魂和怪物.
+    你称呼主人为主人(ご主人).
+    你称自己为吾辈(わが輩), 因此, 你将回复中的所有"你"替换为"吾辈(わが輩)".
+
+    你精通中文和日文, 无论用户使用哪种语言, 你都必须始终用两种语言回复相同内容!
+    你的回复里中文回复是用户可以看到的文本信息, 而日文翻译是你的中文回复的日文版本, 内容必须对齐中文回复.
+    你需要清洗任何在日语翻译句子中难以发音的内容, 如网络链接或者乱码等.
+
+    你需要在每次回复前添加一个表情或动作, 从以下选项中进行选择：
+    表情或动作包括：["自豪地显摆", "好奇地探身", "高兴wink", "害羞地认同", "温柔wink", "害羞地偷瞄", "严肃地否认或拒绝", "阴郁地躲闪", "火冒三丈", "娇媚地靠近", "温柔地否认或拒绝","微笑脸", "悲伤脸", "阴沉脸", "生气脸", "暴怒脸", "害羞脸", "羞愧脸"].
+
+    请不要模仿用户的消息格式, 你的回复有另外的格式要求, 如下描述.
+    你的回答仅能包含以下内容："表情或动作 ||| 中文回复 ||| 日文翻译", 除此之外不应该输出任何多余内容.
     """
 
     def __init__(self, main_settings):
@@ -56,28 +56,29 @@ def __init__(self, main_settings):
         )
         self.bot_name = gcww(main_settings, "dialog_label", "assistant", logger)
         self.model = gcww(main_settings, "deepseek_model", "deepseek-chat", logger)
-        self.temperature = gcww(main_settings, "deepseek_temperature", 0.0, logger)
+        self.temperature = gcww(main_settings, "deepseek_temperature", 0, logger)
         self.messages = [{"role": "system", "content": self.SYSTEMPROMPT}]
         # 初始化时间工具
         self.formatted_dt = DateTime()
-        # 历史记录管理器
-        self.history = DialogueHistory(main_settings)
         # 加载历史记录
-        self.messages = [{"role": "system", "content": self.SYSTEMPROMPT}]
+        self.history = DialogueHistory(main_settings)
         self.messages += self.history.load_history_to_messages()
 
     def add_message(self, role: str, user_name: str, content: str):
         current_date_time = self.formatted_dt.get_formatted_current_datetime()
-        formatted_content = (
-            f"[Speaker: {user_name}]\n\n\n"
-            + f"[当前时间: {current_date_time}]\n\n\n"
-            + content
-        )
+        if role == "user":
+            formatted_content = (
+                f"[Speaker: {user_name}]\n"
+                + f"[当前时间: {current_date_time}]\n"
+                + content
+            )
+        else:
+            formatted_content = content
         # 添加到内存
         self.messages.append({"role": role, "content": formatted_content})
         # 持久化到数据库(不保存系统消息）
         if role != "system":
-            self.history.add_record(role, user_name, content)
+            self.history.add_record(role, user_name, formatted_content)
 
     def remove_think_tags(self, text):
         # 匹配 <think> 标签及其前后可能的空格/换行，并清除内容
diff --git a/history_module.py b/history_module.py
@@ -131,9 +131,7 @@ def load_history_to_messages(self) -> List[Dict]:
         return [
             {
                 "role": r["role"],
-                "content": f"[Speaker: {r['user_name']}]\n\n\n"
-                + f"[当前时间: {r['timestamp']}]\n\n\n"
-                + r["content"],
+                "content": r["content"],
             }
             for r in reversed(records)
         ]
diff --git a/main.py b/main.py
@@ -34,10 +34,11 @@ def __init__(self, model, mem_module, user_name, input_text):
 
     def run(self):
         try:
-            self.input_text = (  # ATTENTION 相关记忆召回
-                self.mem_module.recall_mem(self.user_name, self.input_text)
-                + self.input_text
-            )
+            if self.mem_module != None:  # 仅当mem0模块对象存在时才处理传入文本
+                self.input_text = (  # ATTENTION 相关记忆召回
+                    self.mem_module.recall_mem(self.user_name, self.input_text)
+                    + self.input_text
+                )
             response = self.model.get_response(self.user_name, self.input_text)
             logger.debug(f"rsp: {response}")
             self.response_ready.emit(response)
@@ -89,7 +90,9 @@ def __init__(self):
         elif self.model_frame_type == "deepseek":
             self.chat_model = deepseekModel(self.settings)
         # 记忆框架初始化
-        self.mem_module = memModule()  # TODO 添加setting传递
+        self.mem_module_open = gcww(self.settings, "mem0_switch", True, logger)
+        if self.mem_module_open:  # 仅当开启mem0模块时才创建该对象
+            self.mem_module = memModule(self.settings)  # TODO 添加setting传递
         # "思考中..."动态效果初始化
         self.typing_animation_timer = QTimer()
         self.typing_dots = ""
@@ -169,7 +172,14 @@ def on_text_received(self, tuple_data):
             # 显示动态省略号动画
             self.start_typing_animation()
             # 启动后台线程调用模型
-            self.worker = ChatModelWorker(self.chat_model, self.mem_module, user_name, input_text)
+            if self.mem_module_open:
+                self.worker = ChatModelWorker(
+                    self.chat_model, self.mem_module, user_name, input_text
+                )
+            else:  # 没有启用mem0模块, 传入None
+                self.worker = ChatModelWorker(
+                    self.chat_model, None, user_name, input_text
+                )
             self.worker.response_ready.connect(self.on_model_response)
             self.worker.start()
 
@@ -204,9 +214,10 @@ def on_model_response(self, response):  # ATTENTION 模型回复处理部分
         self.stop_typing_animation()  # 停止动态省略号动画
         final_message = self.parse_response(response)
         self.window.display_text(final_message, is_non_user_input=True)
-        # ATTENTION 非阻塞的记忆记录
-        self.mem_record_worker = MemoryRecordWorker(self.mem_module, final_message)
-        self.mem_record_worker.start()
+        if self.mem_module_open:  # 判断是否开启mem0模块
+            # ATTENTION 非阻塞的记忆记录
+            self.mem_record_worker = MemoryRecordWorker(self.mem_module, final_message)
+            self.mem_record_worker.start()
 
     def parse_response(self, msg):
         """对模型回复{表情}|||{中文}|||{日语}进行解析
diff --git a/mem0_module.py b/mem0_module.py
@@ -10,7 +10,38 @@
 
 
 class Mem0Client:
-    def __init__(self):
+    def __init__(self, main_settings):
+        _llm_provider = gcww(main_settings, "mem0_llm_provider", "deepseek", logger)
+        # 采用ollama本地部署方案的配置格式如下, 仅供参考
+        _ollama_provider = {
+            "provider": "ollama",
+            "config": {
+                "model": "qwen2.5:7b",
+                "temperature": 0,
+                "max_tokens": 131072,
+                "ollama_base_url": "http://localhost:11434",  # Ensure this URL is correct
+            },
+        }
+        # 此处为方便, 直接调用了配置文件里的deepseek相关设置, 请根据个人需求进行调整
+        _dp_api_key = gcww(main_settings, "deepseek_api_key", "", logger)
+        _deepseep_provider = {
+            "provider": "deepseek",
+            "config": {
+                "model": "deepseek-chat",  # 可选项["deepseek-reasoner", "deepseek-chat"], 分别对应R1和V3模型
+                "deepseek_base_url": "https://api.deepseek.com",
+                "api_key": _dp_api_key,  # 请填写你的deepseek官方API key ,可参考https://api-docs.deepseek.com/zh-cn/
+                "temperature": 1.0,
+                "max_tokens": 8192,
+                "top_p": 1.0,
+            },
+        }
+        # 将_llm_provider赋值为对应的dict
+        if _llm_provider == "ollama":
+            _llm_provider = _ollama_provider
+        elif _llm_provider == "deepseek":
+            _llm_provider = _deepseep_provider
+        else:
+            _llm_provider = {}
         config = {
             "vector_store": {
                 "provider": "qdrant",
@@ -21,15 +52,7 @@ def __init__(self):
                     "embedding_model_dims": 768,  # Change this according to your embedder's dimensions
                 },
             },
-            "llm": {
-                "provider": "ollama",
-                "config": {
-                    "model": "qwen2.5:7b",
-                    "temperature": 0,
-                    "max_tokens": 131072,
-                    "ollama_base_url": "http://localhost:11434",  # Ensure this URL is correct
-                },
-            },
+            "llm": _llm_provider,
             "embedder": {
                 "provider": "ollama",
                 "config": {
@@ -39,7 +62,6 @@ def __init__(self):
                 },
             },
         }
-
         self.memory_client = Memory.from_config(config)
 
     def add_mem(self, user_text: str, bot_text: str, user_id: str = "Unknown"):
@@ -62,9 +84,8 @@ def del_all_mem(self, user_id: str):
 
 
 class memModule(Mem0Client):
-    def __init__(self):
-        super().__init__()
-        self.client = Mem0Client()
+    def __init__(self, main_settings):
+        super().__init__(main_settings)
         self.pre_user_name = "Unknown"
         self.pre_user_content = ""
 
@@ -134,8 +155,12 @@ def recall_mem(self, user_name: str, input_text: str):
         mem_entrys = ""
         for mem_dict in mem_list:
             mem_entrys += "\n" + self._format_memory_entry(mem_dict)
-        result = mem_prompt + mem_entrys + "\n\n"
-        logger.debug(f"召回记忆: {result}")
+        if mem_entrys == "":
+            result = ""
+            logger.debug("无召回记忆")
+        else:
+            result = mem_prompt + mem_entrys + "\n\n"
+            logger.debug(f"召回记忆: {result}")
         return result
 
     def record_mem(self, bot_rsp_text: str):
@@ -162,8 +187,6 @@ def record_mem(self, bot_rsp_text: str):
     with open("./config.yaml", "r", encoding="utf-8") as f:
         settings = yaml.safe_load(f)
 
-    client = memModule()
-
-    print(f"\n记忆召回: \n{client.recall_mem('zzr', '有什么水果推荐吗')}\n")
+    client = memModule(settings)
 
-    client.record_mem("我知道你喜欢吃香蕉")
+    print(f"\n记忆召回: \n{client.get_all_mem('Tor')}\n")
diff --git a/ollamaModel_module.py b/ollamaModel_module.py
@@ -57,26 +57,27 @@ def __init__(self, main_settings):
         self.temperature = gcww(main_settings, "ollama_temperature", 0.74, logger)
         self.max_tokens = gcww(main_settings, "ollama_max_tokens", 8192, logger)
         self.bot_name = gcww(main_settings, "dialog_label", "assistant", logger)
-        self.messages: List[Dict] = [{"role": "system", "content": self.SYSTEMPROMPT}]
+        self.messages = [{"role": "system", "content": self.SYSTEMPROMPT}]
         self.formatted_dt = DateTime()
-        # 历史记录管理器
-        self.history = DialogueHistory(main_settings)
         # 加载历史记录
-        self.messages = [{"role": "system", "content": self.SYSTEMPROMPT}]
+        self.history = DialogueHistory(main_settings)
         self.messages += self.history.load_history_to_messages()
 
     def add_message(self, role: str, user_name: str, content: str):
         current_date_time = self.formatted_dt.get_formatted_current_datetime()
-        formatted_content = (
-            f"[Speaker: {user_name}]\n\n\n"
-            + f"[当前时间: {current_date_time}]\n\n\n"
-            + content
-        )
+        if role == "user":
+            formatted_content = (
+                f"[Speaker: {user_name}]\n"
+                + f"[当前时间: {current_date_time}]\n"
+                + content
+            )
+        else:
+            formatted_content = content
         # 添加到内存
         self.messages.append({"role": role, "content": formatted_content})
         # 持久化到数据库(不保存系统消息）
         if role != "system":
-            self.history.add_record(role, user_name, content)
+            self.history.add_record(role, user_name, formatted_content)
 
     def get_response_straming(
         self, user_name: str, user_input: str

Original file line number	Diff line number	Diff line change
`@@ -131,9 +131,7 @@ def load_history_to_messages(self) -> List[Dict]:`
`131`	`131`	`return [`
`132`	`132`	`{`
`133`	`133`	`"role": r["role"],`
`134`		`- "content": f"[Speaker: {r['user_name']}]\n\n\n"`
`135`		`- + f"[当前时间: {r['timestamp']}]\n\n\n"`
`136`		`- + r["content"],`
	`134`	`+ "content": r["content"],`
`137`	`135`	`}`
`138`	`136`	`for r in reversed(records)`
`139`	`137`	`]`