_010001SUTANG

Datawhale AI秋训营 | AI助教创新赛学习心得

Posted on 2025-10-26 In 学习笔记

在完成 Task02 的学习后，我对“AI 辅助开发”这一范式有了更系统、更深入的理解。如果说 Task01 是一次“初尝甜头”的技术体验，那么 Task02 则是一场从“会用”到“用好”的思维跃迁。它让我意识到，真正决定一个 AI 应用成败的，并非模型本身有多强大，而是我们作为开发者能否精准地将用户需求转化为可执行的工程指令，并在产品、技术和交互之间建立高效的协同闭环。

一、角色转变：从“编码者”到“总工程师 + 产品经理”

过去，我习惯于将编程视为一种“精确控制”的过程——每一行代码都必须亲手敲下，每一个逻辑分支都必须严密推演。但在 AI 辅助开发的语境下，这种角色正在发生根本性转变：我不再是代码的“书写者”，而是需求的“定义者”、架构的“引导者”和体验的“把关人”。

正如教程中反复强调的：“我们是自己项目的总工程师和产品经理，AI 是我们的编程助理。” 这句话看似简单，实则蕴含了对开发范式的重新定义。AI 能力的边界固然重要，但更关键的是我们能否清晰表达意图、拆解任务、验证结果，并在迭代中不断逼近用户的真实痛点。

这一认知转变，正是 Task02 的核心知识点之一：AI 辅助开发的本质不是“替你做”，而是“帮你更快做对”。开发者需要具备产品视角（理解用户是谁、解决什么问题、如何衡量价值）与技术视角（理解数据流、技术栈、交互逻辑）的双重能力，才能有效引导 AI 完成高质量输出。

二、“三层积木”模型：构建轻量而完整的 AI 应用骨架

在实践中，我深刻体会到教程提出的“三层积木”模型的实用性——**界面层（HTML/CSS）、功能层（JavaScript）、AI 连接层（Prompt + 模型调用）**共同构成了一个轻量但完整的 AI 应用骨架。

以我正在开发的乡土文化教育像素风文字冒险游戏为例：

界面层决定了乡村儿童是否愿意点开这个应用——按钮是否够大、色彩是否鲜明、交互是否直观；
功能层负责将用户的输入（如“我想了解稻田”）转化为结构化请求，并调用 API 获取结果；
AI 连接层则通过精心设计的 Prompt 和模型调用，生成融合语文、历史、地理知识的互动故事。

这三层环环相扣，任何一层的薄弱都会导致整体体验的崩塌。例如，即便 AI 生成的内容再精彩，如果按钮太小、文字太密，乡村教师或学生可能根本无法顺利操作；反之，若 Prompt 设计模糊，AI 输出的内容就可能泛化、偏离教学目标，甚至产生幻觉。

三、Prompt 即 PRD：结构化需求表达决定工程效率

Task02 中关于“Prompt 即 PRD”的观点尤其令我共鸣。过去我常把 Prompt 视为技术参数，但现在我更愿意将其看作产品需求文档的延伸。

一个优秀的 Prompt 应包含四个关键要素：

角色设定（如“你是一位熟悉江南水乡文化的乡村教师”）；
任务目标（“围绕稻田、祠堂、龙舟生成跨学科故事”）；
约束条件（“包含一道选择题，选项格式为 A/B/C/D”）；
输出规范（“用 JSON 格式返回题目和解析”）。

这种结构化表达不仅提升了 AI 输出的稳定性，也大幅降低了前端解析的复杂度。在一次实践中，我发现 AI 生成的选择题无法被 JavaScript 正确解析，排查后发现问题并非出在代码逻辑，而是 Prompt 未明确要求结构化输出。当我将 Prompt 补充为“请严格按照以下 JSON Schema 输出……”后，问题迎刃而解。这让我深刻体会到：在 AI 开发中，需求描述的质量直接决定了工程实现的效率。

四、组合式创新：灵活调用多模型能力构建端到端流程

此外，教程中关于“模型选型”和“功能扩展”的案例也启发了我对技术灵活性的思考。例如，当我尝试用文生图模型生成“江南水乡”插图时，发现中文 Prompt 的效果远不如英文。于是，我采纳了教程建议，在调用图像生成模型前，先通过大语言模型将中文描述翻译为英文，再传给 Flux.1-Krea-dev 模型。

这一微小调整显著提升了图像的准确性与细节表现力。这背后反映的是一种“组合式创新”思维：我们不必受限于单一模型的能力边界，而是可以像搭积木一样，将多个 AI 能力（语言理解、翻译、图像生成）串联起来，构建更强大的端到端流程。这也呼应了教程中强调的“AI 功能 = 业务规则 + AI 模型效果 + 数据流”这一公式。

五、体验驱动的优化：从“能用”到“爱用”

更重要的是，Task02 让我重新审视了“优化”的本质。优化不是堆砌功能，而是围绕核心价值不断打磨体验。

我的游戏项目最初只支持静态故事生成，但在学习了“功能 → 操作 → 执行 → 输出”的结构化描述方法后，我尝试加入“答题反馈”和“积分激励”机制：当学生答对题目，AI 不仅给出解析，还会生成一句个性化的鼓励语（如“你对端午习俗的理解真到位！”），并触发像素风的金币动画。这种微小的正向反馈，极大提升了学习的沉浸感与成就感。

而这一切的实现，并不需要复杂的后端架构，仅通过前端 JavaScript 与大模型 API 的巧妙配合即可完成。这再次印证了教程中的观点：最终应用的效果 = 交互体验 × AI 能力 × 功能广度。三者缺一不可。

六、人机协同的代码维护：审查、清理与迭代

当然，我也清醒地认识到 AI 辅助开发的局限。AI 生成的代码往往冗长、重复，甚至包含不必要的 try-catch 块。因此，定期进行代码审查和清理变得尤为重要。

我开始尝试使用 Qoder IDE 的行间对话功能，在特定代码段落旁直接提问：“这段逻辑能否简化？”、“是否存在内存泄漏风险？”，AI 会基于上下文给出重构建议。这种“人机协同”的代码维护方式，既保留了 AI 的创造力，又确保了工程的健壮性。这也呼应了教程中强调的“质量保障”原则：永远不要完全信任 AI 生成的代码，应将其视为有才华但需指导的初级开发者输出。

总的来说，Task02 不仅教会我如何“用 AI 写代码”，更教会我如何“用产品思维驾驭 AI”。它让我明白，未来的开发者核心竞争力，将不再是语法熟练度，而是需求洞察力、系统架构力与人机协作力。

在接下来的开发中，我会继续以“总工程师 + 产品经理”的融合思维，推动我的乡土教育游戏从“能用”走向“好用”，最终实现“爱用”——让 AI 真正成为连接乡土文化与现代教育的桥梁，而非仅仅是一个炫技的工具。这不仅是技术的胜利，更是产品思维与人文关怀的融合。

Agent-camel框架练习（4）

Posted on 2025-07-24 Edited on 2025-07-25 In 自主练习

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

Task1

通过调用API或本地部署reranker模型来快速将rerank模块集成到RAG应用中

https://github.com/camel-ai/camel/blob/master/camel/retrievers/cohere_rerank_retriever.py

"""
精简版Reranker系统：在CAMEL框架下集成模拟的外部Reranker模型

该脚本旨在清晰地展示如何将一个独立的Reranker模块（通过模拟外部API或本地部署模型）
集成到RAG应用中，以实现文档重排。
"""

import os
import re
import requests
from typing import List, Dict, Any

# 导入CAMEL框架核心模块
from camel.models import ModelFactory
from camel.types import ModelPlatformType
from camel.agents import ChatAgent
from camel.embeddings import SentenceTransformerEncoder
from camel.retrievers import VectorRetriever
from camel.storages.vectordb_storages import QdrantStorage

# 导入环境变量模块
from dotenv import load_dotenv

class MinimalRerankerSystem:
    """
    精简版Reranker系统类
    包含知识库设置、模拟的外部Reranker和答案生成的核心功能
    """

    def __init__(self, api_key: str):
        """
        初始化精简版Reranker系统

        Args:
            api_key: ModelScope API密钥
        """
        self.api_key = api_key

        # 初始化嵌入模型 (用于向量检索，Reranker本身不直接使用)
        self.embedding_model = SentenceTransformerEncoder(
            model_name='intfloat/e5-large-v2'
        )

        # 初始化向量存储 (用于演示文档检索，以便Reranker有文档可重排)
        self.vector_storage = QdrantStorage(
            vector_dim=self.embedding_model.get_output_dim(),
            collection="minimal_reranker_collection",
            path="storage_minimal_reranker",
            collection_name="精简重排知识库"
        )

        # 初始化向量检索器
        self.vector_retriever = VectorRetriever(
            embedding_model=self.embedding_model,
            storage=self.vector_storage
        )

        # 初始化LLM模型 (仅用于答案生成)
        self.model = ModelFactory.create(
            model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
            model_type="Qwen/Qwen2.5-72B-Instruct",
            url='https://api-inference.modelscope.cn/v1/',
            api_key=self.api_key
        )

        # 初始化RAG答案生成代理
        self._init_agents()
        self.knowledge_base_ready = False

    def _init_agents(self):
        """初始化RAG答案生成代理"""
        
        # RAG回答生成代理
        rag_sys_msg = """
        你是一个帮助回答问题的助手。
        我会给你原始查询和检索到的上下文信息。
        请根据检索到的上下文回答原始查询。
        如果上下文信息不足以回答问题，请说"根据提供的信息，我无法完全回答这个问题"。
        请确保回答准确、完整且有条理。
        """
        self.rag_agent = ChatAgent(
            system_message=rag_sys_msg,
            model=self.model
        )
    
    def setup_knowledge_base(self, pdf_url: str = None, pdf_path: str = None):
        """
        设置知识库，用于提供待重排的文档
        
        Args:
            pdf_url: PDF文件的URL
            pdf_path: 本地PDF文件路径
        """
        os.makedirs('local_data', exist_ok=True)

        if pdf_url:
            print("正在下载PDF文件...")
            try:
                response = requests.get(pdf_url, timeout=30)
                response.raise_for_status()
                pdf_path = 'local_data/knowledge_base.pdf'
                with open(pdf_path, 'wb') as file:
                    file.write(response.content)
                print(f"✓ PDF文件已下载到: {pdf_path}")
            except Exception as e:
                print(f"PDF下载失败: {e}")
                raise

        if pdf_path:
            if not os.path.exists(pdf_path):
                raise FileNotFoundError(f"PDF文件不存在: {pdf_path}")
            
            print("正在处理PDF文件并建立向量数据库...")
            try:
                self.vector_retriever.process(content=pdf_path)
                self.knowledge_base_ready = True
                print("知识库设置完成！")
            except Exception as e:
                print(f"知识库设置失败: {e}")
                raise
        else:
            raise ValueError("必须提供 pdf_url 或 pdf_path 参数")

    def retrieve_documents(self, query: str, top_k: int = 5) -> List[Dict[str, Any]]:
        """
        从知识库中检索初步文档

        Args:
            query: 用户查询
            top_k: 返回的文档数量

        Returns:
            初步检索到的文档列表
        """
        if not self.knowledge_base_ready:
            print("知识库未准备好，无法检索文档。")
            return []

        print(f"正在初步检索文档 (Top-{top_k})...")
        retrieved_docs = self.vector_retriever.query(query=query, top_k=top_k)
        print(f"✓ 初步检索到 {len(retrieved_docs)} 个文档。")
        return retrieved_docs

    def perform_external_rerank(self, query: str, documents: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
        """
        模拟外部Reranker模型对文档进行重排。
        此函数模拟了调用外部API或本地部署的Reranker模型。
        这里使用简单的关键词匹配作为模拟的重排逻辑。

        Args:
            query: 用户查询
            documents: 待重排的文档列表，每个文档字典包含 'text' 键

        Returns:
            根据模拟的外部Reranker重排后的文档列表，每个文档会添加 'relevance_score' 字段。
        """
        if not documents:
            print("没有文档可供重排，跳过外部Reranker。")
            return []

        print("正在使用模拟的外部Reranker进行文档重排...")

        # 将查询分割成关键词（这里简单地按空格分割，实际Reranker会进行更复杂的处理）
        query_keywords = set(query.lower().split())

        scored_documents = []
        for doc in documents:
            doc_text_lower = doc['text'].lower()
            # 模拟计算相关性分数：文档中包含的查询关键词越多，分数越高
            relevance_score = sum(1 for keyword in query_keywords if keyword in doc_text_lower)
            
            # 也可以添加一些随机性来模拟真实模型的复杂性
            # import random
            # relevance_score += random.uniform(0, 0.1) 

            # 将分数添加到文档字典中
            doc_with_score = doc.copy()
            doc_with_score['relevance_score'] = relevance_score
            scored_documents.append(doc_with_score)

        # 根据相关性分数降序排序
        reranked_documents = sorted(scored_documents, key=lambda x: x.get('relevance_score', 0), reverse=True)

        print(f"✓ 模拟外部Reranker重排完成。")
        return reranked_documents

    def generate_answer(self, query: str, retrieved_docs: List[Dict[str, Any]]) -> str:
        """
        基于检索到的文档生成答案
        
        Args:
            query: 用户查询
            retrieved_docs: 检索到的文档列表
            
        Returns:
            生成的答案
        """
        if not retrieved_docs:
            return "根据提供的信息，我无法完全回答这个问题。"

        # 构建上下文
        context = "\n\n".join([doc['text'] for doc in retrieved_docs])
        
        # 构建提示
        prompt = f"""
        原始查询: {query}
        
        检索到的上下文信息:
        {context}
        
        请根据上述上下文信息回答原始查询。
        """
        
        print("\n正在生成答案...")
        response = self.rag_agent.step(prompt)
        answer = response.msgs[0].content.strip()
        print("✓ 答案生成完成。")
        
        return answer

    def run_reranker_pipeline(self, query: str, top_k_initial: int = 5) -> Dict[str, Any]:
        """
        运行重排器管道：初步检索 -> 外部Reranker重排 -> 答案生成

        Args:
            query: 用户查询
            top_k_initial: 初步检索的文档数量

        Returns:
            包含初步文档、重排文档和最终答案的字典
        """
        print("\n" + "=" * 60)
        print(f"开始运行Reranker管道，查询: {query}")
        print("=" * 60)

        # 步骤1: 初步检索文档
        initial_retrieved_docs = self.retrieve_documents(query, top_k_initial)

        # 步骤2: 外部Reranker重排文档
        reranked_docs = self.perform_external_rerank(query, initial_retrieved_docs)

        # 步骤3: 基于重排后的文档生成答案
        final_answer = self.generate_answer(query, reranked_docs)

        print("\n" + "=" * 60)
        print("Reranker管道执行完成！")
        print("=" * 60)

        return {
            "query": query,
            "initial_retrieved_docs": initial_retrieved_docs,
            "reranked_docs": reranked_docs,
            "final_answer": final_answer
        }

def main():
    """主函数：演示精简版Reranker系统的使用"""
    
    # 加载环境变量
    load_dotenv()
    api_key = os.getenv('MODELSCOPE_SDK_TOKEN')
    
    if not api_key:
        print("错误：请设置MODELSCOPE_SDK_TOKEN环境变量")
        print("请在.env文件中添加 MODELSCOPE_SDK_TOKEN=你的API密钥")
        return
    
    # 初始化Reranker系统
    print("正在初始化Reranker系统...")
    reranker_system = MinimalRerankerSystem(api_key)
    print("系统初始化完成！")

    # 设置知识库 (使用CAMEL论文作为示例)
    pdf_url = "https://arxiv.org/pdf/2303.17760.pdf"
    print(f"\n正在设置知识库（使用默认CAMEL论文: {pdf_url}）...")
    try:
        reranker_system.setup_knowledge_base(pdf_url=pdf_url)
    except Exception as e:
        print(f"知识库设置失败: {e}")
        return

    # 运行交互式会话
    while True:
        query = input("\n请输入您的查询（输入'quit'退出）: ").strip()
        
        if query.lower() in ['quit', 'exit', '退出']:
            print("感谢使用！再见！")
            break
        
        if not query:
            print("查询不能为空，请重新输入。")
            continue

        try:
            results = reranker_system.run_reranker_pipeline(query, top_k_initial=5)

            print("\n--- 原始检索结果 (Top 5) ---")
            if results['initial_retrieved_docs']:
                for i, doc in enumerate(results['initial_retrieved_docs']):
                    print(f"文档 {i+1}: {doc['text'][:150]}...")
            else:
                print("无原始检索文档。")

            print("\n--- 外部Reranker重排后的结果 ---")
            if results['reranked_docs']:
                for i, doc in enumerate(results['reranked_docs']):
                    # 显示模拟的相关性分数
                    score_info = f" (相关性分数: {doc.get('relevance_score', 'N/A'):.2f})"
                    print(f"文档 {i+1}{score_info}: {doc['text'][:150]}...")
            else:
                print("无重排文档。")

            print("\n--- 最终答案 ---")
            print(results['final_answer'])

        except Exception as e:
            print(f"\n发生错误: {e}")
            import traceback
            traceback.print_exc() # 打印详细错误信息
            continue_choice = input("是否继续？(y/n): ").strip().lower()
            if continue_choice != 'y':
                break

if __name__ == "__main__":
    main()

我们可以运行看一下重排效果：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/Reranker_lite.py  
正在初始化Reranker系统...
W0724 23:07:45.865000 37864 site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.   
系统初始化完成！

正在设置知识库（使用默认CAMEL论文: https://arxiv.org/pdf/2303.17760.pdf）...     
正在下载PDF文件...
✓ PDF文件已下载到: local_data/knowledge_base.pdf
正在处理PDF文件并建立向量数据库...
知识库设置完成！

请输入您的查询（输入'quit'退出）: camel是什么？      

============================================================
开始运行Reranker管道，查询: camel是什么？
============================================================
正在初步检索文档 (Top-5)...
✓ 初步检索到 5 个文档。
正在使用模拟的外部Reranker进行文档重排...
✓ 模拟外部Reranker重排完成。

正在生成答案...
✓ 答案生成完成。

============================================================
Reranker管道执行完成！
============================================================

--- 原始检索结果 (Top 5) ---
文档 1: 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 2: 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 3: me instructions and necessary inputs until you think the task is completed. When the task is completed, you must only reply with a single word <CAMEL_...       
文档 4: me instructions and necessary inputs until you think the task is completed. When the task is completed, you must only reply with a single word <CAMEL_...       
文档 5: Human Evaluation Guideline

Thank you for participating in our task evaluation! We are comparing the performance of ChatGPT and a method called CAMEL ...

--- 外部Reranker重排后的结果 ---
文档 1 (相关性分数: 0.00): 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 2 (相关性分数: 0.00): 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 3 (相关性分数: 0.00): me instructions and necessary inputs until you think the task is completed. When the task is completed, you must only reply with a single word <CAMEL_...
文档 4 (相关性分数: 0.00): me instructions and necessary inputs until you think the task is completed. When the task is completed, you must only reply with a single word <CAMEL_...
文档 5 (相关性分数: 0.00): Human Evaluation Guideline

Thank you for participating in our task evaluation! We are comparing the performance of ChatGPT and a method called CAMEL ...

--- 最终答案 ---
根据提供的信息，CAMEL（Communicative Agents for “Mind” Exploration of Large Language Model Society）是一种用于探索大型语言模型社会“心智”的交流代理系统。这个项目由沙特阿拉伯国王科技大学（KAUST）的研究人员开发，旨在通过交流代理来研究和理解大型语言模型之 间的互动和社会动态。更多详情可以参考该项目的官方网站：https://www.camel-ai.org。    

请输入您的查询（输入'quit'退出）: quit
感谢使用！再见！

Task2

使用大语言模型和简单的提示词工程在CAMEL框架下实现一个ReRanker，达成重排的效果（灵感来自CAMEL Shanghai Hackathon韬子哥QAQ）

https://github.com/fengju0213/NavigatorAI/blob/main/2Travel_information_generation.py

"""
LLM ReRanker：在CAMEL框架下实现基于大语言模型的文档重排

该脚本旨在清晰地展示如何使用CAMEL框架和简单的提示词工程实现文档重排。
"""

import os
import re
import requests
from typing import List, Dict, Any

# 导入CAMEL框架核心模块
from camel.models import ModelFactory
from camel.types import ModelPlatformType
from camel.agents import ChatAgent
from camel.embeddings import SentenceTransformerEncoder
from camel.retrievers import VectorRetriever
from camel.storages.vectordb_storages import QdrantStorage

# 导入环境变量模块
from dotenv import load_dotenv

class MinimalLLMReranker:
    """
    LLM ReRanker系统类
    仅包含知识库设置、LLM ReRanker和答案生成的核心功能
    """

    def __init__(self, api_key: str):
        """
        初始化LLM ReRanker系统

        Args:
            api_key: ModelScope API密钥
        """
        self.api_key = api_key

        # 初始化嵌入模型 (用于向量检索，ReRanker本身不直接使用)
        self.embedding_model = SentenceTransformerEncoder(
            model_name='intfloat/e5-large-v2'
        )

        # 初始化向量存储 (用于演示文档检索，以便ReRanker有文档可重排)
        self.vector_storage = QdrantStorage(
            vector_dim=self.embedding_model.get_output_dim(),
            collection="minimal_reranker_collection",
            path="storage_minimal_reranker",
            collection_name="精简重排知识库"
        )

        # 初始化向量检索器
        self.vector_retriever = VectorRetriever(
            embedding_model=self.embedding_model,
            storage=self.vector_storage
        )

        # 初始化LLM模型 (用于ReRanker和答案生成)
        self.model = ModelFactory.create(
            model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
            model_type="Qwen/Qwen2.5-72B-Instruct",
            url='https://api-inference.modelscope.cn/v1/',
            api_key=self.api_key
        )

        # 初始化LLM ReRanker代理和RAG答案生成代理
        self._init_agents()
        self.knowledge_base_ready = False

    def _init_agents(self):
        """初始化LLM ReRanker代理和RAG答案生成代理"""
        
        # LLM ReRanker 代理
        # 提示词工程：明确要求输出格式为逗号分隔的数字序列，不含额外文字
        reranker_sys_msg = """
        你是一个文档重排助手。你的任务是根据用户查询，对提供的文档列表进行相关性排序。
        你会接收一个用户查询和多个文档，每个文档都有一个编号。
        请你根据文档与查询的深层相关性，从最相关到最不相关，输出文档的编号序列。
        输出格式必须是逗号分隔的数字，例如：1, 3, 2, 4。
        不要包含任何其他文字或解释。
        """
        self.reranker_agent = ChatAgent(
            system_message=reranker_sys_msg,
            model=self.model
        )
        
        # RAG回答生成代理
        rag_sys_msg = """
        你是一个帮助回答问题的助手。
        我会给你原始查询和检索到的上下文信息。
        请根据检索到的上下文回答原始查询。
        如果上下文信息不足以回答问题，请说"根据提供的信息，我无法完全回答这个问题"。
        请确保回答准确、完整且有条理。
        """
        self.rag_agent = ChatAgent(
            system_message=rag_sys_msg,
            model=self.model
        )
    
    def setup_knowledge_base(self, pdf_url: str = None, pdf_path: str = None):
        """
        设置知识库，用于提供待重排的文档
        
        Args:
            pdf_url: PDF文件的URL
            pdf_path: 本地PDF文件路径
        """
        os.makedirs('local_data', exist_ok=True)

        if pdf_url:
            print("正在下载PDF文件...")
            try:
                response = requests.get(pdf_url, timeout=30)
                response.raise_for_status()
                pdf_path = 'local_data/knowledge_base.pdf'
                with open(pdf_path, 'wb') as file:
                    file.write(response.content)
                print(f"✓ PDF文件已下载到: {pdf_path}")
            except Exception as e:
                print(f"PDF下载失败: {e}")
                raise

        if pdf_path:
            if not os.path.exists(pdf_path):
                raise FileNotFoundError(f"PDF文件不存在: {pdf_path}")
            
            print("正在处理PDF文件并建立向量数据库...")
            try:
                self.vector_retriever.process(content=pdf_path)
                self.knowledge_base_ready = True
                print("知识库设置完成！")
            except Exception as e:
                print(f"知识库设置失败: {e}")
                raise
        else:
            raise ValueError("必须提供 pdf_url 或 pdf_path 参数")

    def retrieve_documents(self, query: str, top_k: int = 5) -> List[Dict[str, Any]]:
        """
        从知识库中检索初步文档

        Args:
            query: 用户查询
            top_k: 返回的文档数量

        Returns:
            初步检索到的文档列表
        """
        if not self.knowledge_base_ready:
            print("知识库未准备好，无法检索文档。")
            return []

        print(f"正在初步检索文档 (Top-{top_k})...")
        retrieved_docs = self.vector_retriever.query(query=query, top_k=top_k)
        print(f"✓ 初步检索到 {len(retrieved_docs)} 个文档。")
        return retrieved_docs

    def rerank_documents(self, query: str, documents: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
        """
        使用LLM对文档进行重排

        Args:
            query: 用户查询
            documents: 待重排的文档列表，每个文档字典包含 'text' 键

        Returns:
            根据LLM重排后的文档列表
        """
        if not documents:
            print("没有文档可供重排，跳过LLM重排。")
            return []

        print("正在使用LLM进行文档重排...")

        # 构建发送给LLM的提示
        prompt_parts = [f"用户查询: {query}\n\n以下是需要重排的文档列表："]
        for i, doc in enumerate(documents):
            # 限制文档内容长度，避免超出LLM上下文窗口
            truncated_text = doc['text'][:500] + "..." if len(doc['text']) > 500 else doc['text']
            prompt_parts.append(f"文档 {i+1}:\n{truncated_text}\n")

        prompt_parts.append("\n请根据文档与查询的相关性，从最相关到最不相关，输出文档的编号序列。输出格式必须是逗号分隔的数字，例如：1, 3, 2, 4。不要包含任何其他文字或解释。")
        rerank_prompt = "\n".join(prompt_parts)

        try:
            response = self.reranker_agent.step(rerank_prompt)
            reranked_order_str = response.msgs[0].content.strip()

            # 解析LLM的输出，获取排序后的文档索引
            # 使用正则表达式匹配数字和逗号，确保只提取数字序列
            match = re.search(r'^\s*(\d+(?:\s*,\s*\d+)*)\s*$', reranked_order_str)
            if match:
                ordered_indices = [int(idx.strip()) - 1 for idx in match.group(1).split(',')]
                
                # 过滤掉无效的索引（超出文档列表范围的）
                valid_ordered_indices = [idx for idx in ordered_indices if 0 <= idx < len(documents)]

                # 根据LLM返回的顺序重排文档
                reranked_documents = [documents[i] for i in valid_ordered_indices]

                # 如果LLM返回的文档数量少于原始文档数量，将未被LLM排序的文档按原顺序追加到末尾
                original_indices = set(range(len(documents)))
                llm_sorted_indices = set(valid_ordered_indices)
                remaining_indices = sorted(list(original_indices - llm_sorted_indices))
                
                for idx in remaining_indices:
                    reranked_documents.append(documents[idx])

                print(f"✓ LLM重排完成。新顺序: {[idx + 1 for idx in valid_ordered_indices]}")
                return reranked_documents
            else:
                print(f"LLM重排输出格式不正确，无法解析。原始输出: '{reranked_order_str}'。将返回原始文档顺序。")
                return documents # 返回原始文档顺序
        except Exception as e:
            print(f"LLM重排失败: {e}。将返回原始文档顺序。")
            return documents # 发生错误时返回原始文档顺序

    def generate_answer(self, query: str, retrieved_docs: List[Dict[str, Any]]) -> str:
        """
        基于检索到的文档生成答案
        
        Args:
            query: 用户查询
            retrieved_docs: 检索到的文档列表
            
        Returns:
            生成的答案
        """
        if not retrieved_docs:
            return "根据提供的信息，我无法完全回答这个问题。"

        # 构建上下文
        context = "\n\n".join([doc['text'] for doc in retrieved_docs])
        
        # 构建提示
        prompt = f"""
        原始查询: {query}
        
        检索到的上下文信息:
        {context}
        
        请根据上述上下文信息回答原始查询。
        """
        
        print("\n正在生成答案...")
        response = self.rag_agent.step(prompt)
        answer = response.msgs[0].content.strip()
        print("✓ 答案生成完成。")
        
        return answer

    def run_reranker_pipeline(self, query: str, top_k_initial: int = 5) -> Dict[str, Any]:
        """
        运行重排器管道：初步检索 -> LLM重排 -> 答案生成

        Args:
            query: 用户查询
            top_k_initial: 初步检索的文档数量

        Returns:
            包含初步文档、重排文档和最终答案的字典
        """
        print("\n" + "=" * 60)
        print(f"开始运行LLM重排管道，查询: {query}")
        print("=" * 60)

        # 步骤1: 初步检索文档
        initial_retrieved_docs = self.retrieve_documents(query, top_k_initial)

        # 步骤2: LLM重排文档
        reranked_docs = self.rerank_documents(query, initial_retrieved_docs)

        # 步骤3: 基于重排后的文档生成答案
        final_answer = self.generate_answer(query, reranked_docs)

        print("\n" + "=" * 60)
        print("LLM重排管道执行完成！")
        print("=" * 60)

        return {
            "query": query,
            "initial_retrieved_docs": initial_retrieved_docs,
            "reranked_docs": reranked_docs,
            "final_answer": final_answer
        }

def main():
    """主函数：演示精简版LLM ReRanker系统的使用"""
    
    # 加载环境变量
    load_dotenv()
    api_key = os.getenv('MODELSCOPE_SDK_TOKEN')
    
    if not api_key:
        print("错误：请设置MODELSCOPE_SDK_TOKEN环境变量")
        print("请在.env文件中添加 MODELSCOPE_SDK_TOKEN=你的API密钥")
        return
    
    # 初始化LLM ReRanker系统
    print("正在初始化LLM ReRanker系统...")
    reranker_system = MinimalLLMReranker(api_key)
    print("系统初始化完成！")

    # 设置知识库 (使用CAMEL论文作为示例)
    pdf_url = "https://arxiv.org/pdf/2303.17760.pdf"
    print(f"\n正在设置知识库（使用默认CAMEL论文: {pdf_url}）...")
    try:
        reranker_system.setup_knowledge_base(pdf_url=pdf_url)
    except Exception as e:
        print(f"知识库设置失败: {e}")
        return

    # 运行交互式会话
    while True:
        query = input("\n请输入您的查询（输入'quit'退出）: ").strip()
        
        if query.lower() in ['quit', 'exit', '退出']:
            print("感谢使用！再见！")
            break
        
        if not query:
            print("查询不能为空，请重新输入。")
            continue

        try:
            results = reranker_system.run_reranker_pipeline(query, top_k_initial=5)

            print("\n--- 原始检索结果 (Top 5) ---")
            if results['initial_retrieved_docs']:
                for i, doc in enumerate(results['initial_retrieved_docs']):
                    print(f"文档 {i+1}: {doc['text'][:150]}...")
            else:
                print("无原始检索文档。")

            print("\n--- LLM重排后的结果 ---")
            if results['reranked_docs']:
                for i, doc in enumerate(results['reranked_docs']):
                    # 尝试获取RRF分数或相似度，如果存在的话
                    score_info = f" (RRF分数: {doc['rrf_score']:.4f})" if 'rrf_score' in doc else ""
                    score_info = f" (相似度: {doc['similarity']:.4f})" if 'similarity' in doc else score_info
                    print(f"文档 {i+1}{score_info}: {doc['text'][:150]}...")
            else:
                print("无重排文档。")

            print("\n--- 最终答案 ---")
            print(results['final_answer'])

        except Exception as e:
            print(f"\n发生错误: {e}")
            import traceback
            traceback.print_exc() # 打印详细错误信息
            continue_choice = input("是否继续？(y/n): ").strip().lower()
            if continue_choice != 'y':
                break

if __name__ == "__main__":
    main()

运行效果：

PS D:\Camel_Test_Project> python Reranker_simple.py
正在初始化LLM ReRanker系统...
W0724 21:56:33.691000 38432 site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.   
系统初始化完成！

正在设置知识库（使用默认CAMEL论文: https://arxiv.org/pdf/2303.17760.pdf）...        
正在下载PDF文件...
✓ PDF文件已下载到: local_data/knowledge_base.pdf
正在处理PDF文件并建立向量数据库...
知识库设置完成！

请输入您的查询（输入'quit'退出）:

此时我们可以输入我们想要检索的内容，因为测试的PDF文件仍为CAMEL论文官方线上文件，所以我们直接问与CAMEL相关的：“camel是什么？对于我AI学习有什么帮助？”

请输入您的查询（输入'quit'退出）:camel是什么？对于我AI学习有什么帮助？

============================================================
开始运行LLM重排管道，查询: camel是什么？对于我AI学习有什么帮助？
============================================================
正在初步检索文档 (Top-5)...
✓ 初步检索到 5 个文档。
正在使用LLM进行文档重排...
✓ LLM重排完成。新顺序: [5, 3, 4, 2, 1]

正在生成答案...
✓ 答案生成完成。

============================================================
LLM重排管道执行完成！
============================================================

--- 原始检索结果 (Top 5) ---
文档 1: Human Evaluation Guideline

Thank you for participating in our task evaluation! We are comparing the performance of ChatGPT and a method called CAMEL ...
文档 2: Objective: Your task is to compare two messages, one generated by CAMEL and the other by ChatGPT. These messages will be displayed anonymously on your...       
文档 3: 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 4: Feedback: We highly value your feedback. If you have any suggestions, concerns, or encounter any technical issues during the evaluation, please feel f...       
文档 5: agent is asked to draw all the Camelidae species. It first reasons about what animals are included in the Camelidae family and then generates and save...       

--- LLM重排后的结果 ---
文档 1: agent is asked to draw all the Camelidae species. It first reasons about what animals are included in the Camelidae family and then generates and save...       
文档 2: 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 3: Feedback: We highly value your feedback. If you have any suggestions, concerns, or encounter any technical issues during the evaluation, please feel f...       
文档 4: Objective: Your task is to compare two messages, one generated by CAMEL and the other by ChatGPT. These messages will be displayed anonymously on your...       
文档 5: Human Evaluation Guideline

Thank you for participating in our task evaluation! We are comparing the performance of ChatGPT and a method called CAMEL ...

--- 最终答案 ---
根据提供的信息，"camel"在这里有两个不同的含义：

1. **生物学上的驼科（Camelidae）**：这是指一类哺乳动物，包括骆驼、羊驼等。然而，这个定义与您的AI学习没有直接关系。

2. **CAMEL项目**：这是一个名为“Communicative Agents for ‘Mind’ Exploration of Large Language Model Society”的研究项目，由沙特阿拉伯阿卜杜拉国王科技大学（KAUST）的研究人员开发。CAMEL项目的目的是通过创建交互式代理来探索大型语言模型的社会“心智”。这些代理 可以生成图像、进行任务比较和评估，并通过用户反馈不断改进。

### 对于AI学习的帮助：
- **理解大型语言模型**：CAMEL项目可以帮助你更好地理解大型语言模型的工作原理和能力。 
- **实践应用**：通过参与CAMEL项目，你可以实际操作和评估不同AI系统的性能，从而提升你 的实践技能。
- **研究贡献**：你的反馈和参与可以为AI研究提供有价值的数据，推动AI技术的发展。      

如果你对生物学上的驼科更感兴趣，建议查阅相关的生物学资料。如果你对AI学习更感兴趣，可以进一步了解CAMEL项目并参与其中。

请输入您的查询（输入'quit'退出）:

此时第一轮检索生成已经完成，代理自动进入第二个问题查询。我们继续输入我们的问题：“camel具备哪些特性？”

请输入您的查询（输入'quit'退出）:camel具备哪些特性？            

============================================================
开始运行LLM重排管道，查询: camel具备哪些特性？
============================================================
正在初步检索文档 (Top-5)...
✓ 初步检索到 5 个文档。
正在使用LLM进行文档重排...
✓ LLM重排完成。新顺序: [1, 2, 3, 4, 5]

正在生成答案...
✓ 答案生成完成。

============================================================
LLM重排管道执行完成！
============================================================

--- 原始检索结果 (Top 5) ---
文档 1: 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 2: me instructions and necessary inputs until you think the task is completed. When the task is completed, you must only reply with a single word <CAMEL_...       
文档 3: Human Evaluation Guideline

Thank you for participating in our task evaluation! We are comparing the performance of ChatGPT and a method called CAMEL ...
文档 4: Objective: Your task is to compare two messages, one generated by CAMEL and the other by ChatGPT. These messages will be displayed anonymously on your...       
文档 5: Feedback: We highly value your feedback. If you have any suggestions, concerns, or encounter any technical issues during the evaluation, please feel f...       

--- LLM重排后的结果 ---
文档 1: 3 2 0 2

v o N 2

] I

A . s c [

2 v 0 6 7 7 1 . 3 0 3 2 : v i X r a

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Soci...  
文档 2: me instructions and necessary inputs until you think the task is completed. When the task is completed, you must only reply with a single word <CAMEL_...       
文档 3: Human Evaluation Guideline

Thank you for participating in our task evaluation! We are comparing the performance of ChatGPT and a method called CAMEL ...
文档 4: Objective: Your task is to compare two messages, one generated by CAMEL and the other by ChatGPT. These messages will be displayed anonymously on your...       
文档 5: Feedback: We highly value your feedback. If you have any suggestions, concerns, or encounter any technical issues during the evaluation, please feel f...       

--- 最终答案 ---
根据提供的上下文信息，CAMEL（Communicative Agents for “Mind” Exploration of Large Language Model Society）具备以下特性：

1. **交互式代理**：CAMEL项目使用交互式代理来生成和处理任务，这些代理可以模拟人类的对话和思维过程。
2. **任务完成**：CAMEL代理能够接收任务指令，并在任务完成后回复特定的确认词 `<CAMEL_TASK_DONE>`。
3. **性能评估**：CAMEL项目包括对不同AI系统（如ChatGPT和CAMEL自身）的性能评估，通过用户反馈和投票来比较它们的表现。
4. **用户参与**：CAMEL项目鼓励用户参与任务评估，提供反馈和建议，以帮助改进AI系统的性能。
5. **生成内容**：CAMEL框架可以生成各种内容，包括文本、图像等，用于任务完成和评估。  
6. **社会“心智”探索**：CAMEL项目旨在通过代理之间的互动来探索大型语言模型的社会“心智”，即这些模型如何理解和处理社会互动和复杂任务。

这些特性使得CAMEL项目在AI研究和应用中具有重要的意义，特别是在理解和发展更高级的交互 式AI系统方面。

请输入您的查询（输入'quit'退出）: quit
感谢使用！再见！

此时我们可以看到两轮问答输出的排序效果：

第一次查询：“camel是什么？对于我AI学习有什么帮助？”

正在初步检索文档 (Top-5)…
✓ 初步检索到 5 个文档。
正在使用LLM进行文档重排…
✓ LLM重排完成。新顺序: [5, 3, 4, 2, 1]

原始检索结果： 文档3（“CAMEL: Communicative Agents for ‘Mind’ Exploration of Large Language Model Soci…”）是关于CAMEL项目的核心文档，但是代理将其排在第三位。而文档5（“agent is asked to draw all the Camelidae species…”）是关于生物学上的“驼科”的，与AI学习的相关性较低，故排在第五位。
LLM重排后的结果： LLM将文档5（驼科）重排到了第一位，而将文档3（CAMEL项目）重排到了第二位。这表明LLM在这次重排中将生物学含义的“camel”置于了更高的优先级，尽管我们查询的后半部分明确指向了AI学习。
最终答案： 尽管重排结果将次相关文档排在了前面，但最终答案依然能够正确识别“camel”的两种含义（生物学和CAMEL项目），并详细解释了CAMEL项目对AI学习的帮助，这说明RAG的生成部分能够有效地利用所有检索到的上下文，即使文档顺序不完全理想。

第二次查询：“camel具备哪些特性？”

原始检索结果： 文档1（“CAMEL: Communicative Agents for ‘Mind’ Exploration of Large Language Model Soci…”）是关于CAMEL项目核心的文档，排在第一位。
LLM重排后的结果： LLM的重排顺序是[1, 2, 3, 4, 5]，与原始检索结果的顺序完全一致。这表明LLM认为原始检索器提供的文档顺序已经足够优化，或者它没有找到更优的重排方式。
最终答案： 最终答案详细列举了CAMEL项目的各项特性，这得益于原始检索结果中相关性高的文档（文档1）已经位于靠前的位置。

因此可见**LLM ReRanker能够根据查询对文档进行重新排序。**在第一个查询中，它改变了文档顺序，但并非总是将最相关的文档（从人类角度看）排在首位，可能受到文档内容中“camel”多义性的影响。在第二个查询中，它维持了原始顺序。这表明LLM重排器在某些情况下可以优化文档顺序，但在处理多义性查询时可能需要更精细的提示词工程或结合其他信号来确保最高相关性的文档始终排在最前面。然而，即使重排结果并非完美，RAG的生成能力依然能够从提供的上下文中提取信息并给出较为全面的答案。

关于Task1和Task2的区别思考：这两个任务都涉及在RAG应用中集成重排（ReRanker）模块，但它们在实现方式和所依赖的技术栈上存在显著区别：

Task 1：基于API调用或本地部署的预训练Reranker模型集成

实现方式： 这个任务侧重于利用外部的、专门训练过的重排模型或服务。
- API 调用： 像Cohere ReRank这样的服务，提供了一个API接口，您可以将查询和文档列表发送给它，它会返回重排后的文档。这种方式通常开箱即用，性能经过优化。
- 本地部署Reranker模型： 指的是下载并运行一个已经预训练好的重排模型（例如基于BERT、RoBERTa等架构的跨编码器模型），在本地环境中进行文档重排。
特点：
- 效率高、性能优越： 这些模型通常是专门为重排任务训练的，能够捕捉文档和查询之间的细微相关性，性能通常比通用大模型在重排上的表现更稳定和高效。
- 开箱即用： 集成过程通常是调用SDK或API，相对简单快捷。
- 资源消耗： 如果是本地部署，需要一定的计算资源；如果调用API，则涉及外部服务费用。
参考链接分析： https://github.com/camel-ai/camel/blob/master/camel/retrievers/cohere_rerank_retriever.py 指向CAMEL框架中一个与Cohere ReRank服务集成的检索器。这明确表示Task 1是关于使用外部的、专业的重排服务。

Task 2：基于大语言模型和提示词工程实现Reranker

实现方式： 这个任务的核心是利用通用大语言模型的零样本或少样本能力，通过精巧的提示词（Prompt Engineering）来“引导”LLM执行重排任务。
- 您需要设计一个提示词，告诉LLM它是一个“重排助手”，提供查询和待重排的文档列表，并要求LLM输出重排后的文档顺序或评分。
- 重排的逻辑完全由LLM的推理能力和您的提示词设计决定。
特点：
- 灵活性高： 可以根据具体需求，通过修改提示词来调整重排逻辑，适用于各种自定义场景。
- 不依赖特定Reranker模型： 只要有通用大语言模型（如Qwen、ChatGPT等）即可实现，无需额外部署专门的重排模型。
- 性能波动： 重排效果高度依赖于LLM的理解能力和提示词的质量，可能不如专门训练的Reranker模型稳定和极致。
- 资源消耗： 调用LLM的API通常会有成本，且LLM的推理速度可能比专门的Reranker慢。
参考链接分析： https://github.com/fengju0213/NavigatorAI/blob/main/2Travel_information_generation.py 以及您之前让我优化过的代码，都是通过在CAMEL框架中使用 ChatAgent（即一个LLM代理）并结合自定义的系统消息和用户消息来模拟重排过程的。这明确表示Task 2是关于通过提示词工程将LLM作为重排器使用。

核心区别总结：

特征	Task 1：API/本地部署Reranker模型	Task 2：LLM + 提示词工程实现Reranker
重排核心	专门训练的重排模型/服务	通用大语言模型 (LLM) 的推理能力
实现方式	调用成熟的API或SDK，或部署现有模型	设计提示词，引导LLM进行重排
性能	通常更稳定、高效，针对重排任务优化	依赖LLM能力和提示词质量，可能波动较大
灵活性	较低，重排逻辑固定在模型中	较高，可通过调整提示词灵活定制重排逻辑
资源	可能需要GPU（本地）或API费用（云服务）	调用LLM的API费用，LLM本身运行资源
开发难度	相对较低，多为配置和集成	需要精通提示词工程，调试LLM行为

Task3

导出本教程文档作为一个PDF文件，尝试搭建一个具有多模态检索能力的RAG应用来帮助其他学习者回答问题。

由于我没有找到很好的将本教程文档转化为一个线上可直接数据向量化的方法，但经过运行确认确实可以将线上的PDF文档本地下载初始化数据库。
因此我们演示时暂时采用本地下载好的本教程PDF文档作为演示案例。

我们先来说明一下整个系统的具体实现：

交互式多模态RAG系统

项目简介

这是一个基于CAMEL框架的交互式多模态RAG（检索增强生成）系统，集成了PDF文档处理、网页爬取、知识图谱构建和多种检索模式。系统支持文本、图像、表格等多模态内容的智能检索和分析。

核心特性

多模态内容处理

PDF文档解析：支持在线PDF和本地PDF文件加载
多模态元素提取：自动识别和处理文本、图像、表格内容
智能内容分类：按内容类型进行分类存储和检索

多种检索模式

快速检索：基础向量检索，快速获取相关文档
深度检索：查询重写 + HyDE + RRF融合的高级检索
主题检索：PDF文档 + 网页爬取的综合检索

AI智能分析

CAMEL框架集成：使用CAMEL ModelFactory进行模型管理
查询重写：智能优化用户查询以提高检索效果
HyDE增强：假设文档生成技术提升检索精度
RRF融合：多路检索结果的智能融合排序

网页研究系统

智能网页爬取：基于主题的网页内容抓取
知识图谱构建：自动构建主题相关的知识图谱
多源信息融合：PDF文档与网页信息的智能整合

交互式体验

实时对话界面：支持连续问答和上下文理解
结果可视化：详细的检索结果展示和分析
报告生成：自动生成研究报告和结果保存

系统架构

交互式多模态RAG系统
├── 核心组件
│   ├── SimpleLLMInterface (CAMEL模型接口)
│   ├── SimpleEmbeddingModel (嵌入模型)
│   ├── SimpleVectorRetriever (向量检索器)
│   └── SimpleRAGSystem (RAG核心系统)
├── 检索模式
│   ├── 快速检索 (基础向量检索)
│   ├── 深度检索 (重写+HyDE+RRF)
│   └── 主题检索 (PDF+网页爬取)
├── 网页研究系统
│   ├── UniversalResearchSystem (通用研究系统)
│   ├── InteractiveResearchSystem (交互式研究)
│   └── EnhancedInteractiveResearchSystem (增强版)
└── 交互界面
    ├── 知识库管理
    ├── 查询处理
    └── 结果展示

核心框架

CAMEL: AI智能体框架，提供模型管理和工具集成
LangChain: 大语言模型应用开发框架
Sentence Transformers: 文本嵌入和语义检索

文档处理

PyPDF: PDF文档解析和文本提取
Unstructured: 多模态文档元素识别和处理
BeautifulSoup: HTML内容解析和清理

检索和存储

Scikit-learn: 向量相似度计算和机器学习
NumPy: 数值计算和向量操作
Neo4j: 知识图谱存储和查询（可选）

网页爬取

Requests: HTTP请求和网页内容获取
Firecrawl: 智能网页内容抓取
SearchToolkit: 网页搜索和信息检索

基本使用流程

选择PDF来源
- 在线PDF（输入URL）
- 本地PDF（输入文件路径）
- 默认示例PDF（CAMEL论文）
选择检索模式
- 快速检索：适合简单问答
- 深度检索：适合复杂分析
- 主题检索：适合综合研究
输入查询问题
- 支持中英文查询
- 支持复杂的多步骤问题
- 支持上下文相关的连续对话
查看结果
- 检索到的相关文档
- AI生成的详细答案
- 可选的结果保存功能

高级功能

网页研究模式

1 2	# 启动增强版研究系统 python RAG_WEB_TOPIC_Enhanced.py

自定义检索参数

# 在代码中调整检索参数
results = rag_system.enhanced_query(
    original_query=query,
    use_rewriting=True,      # 启用查询重写
    use_hyde=True,           # 启用HyDE增强
    use_rrf=True,            # 启用RRF融合
    top_k=5,                 # 返回文档数量
    multimodal_preference=['text', 'image', 'table']  # 多模态偏好
)

检索模式

快速检索

用途：基础问答和快速信息查找
特点：速度快，资源消耗低
适用场景：简单事实查询，概念解释

深度检索

用途：复杂分析和深度研究
特点：多步骤处理，结果精确
适用场景：学术研究，技术分析

主题检索

用途：综合信息收集和跨源研究
特点：结合PDF和网页信息
适用场景：市场调研，趋势分析

接下来我们来看看具体的实现代码：

实现代码：

实现代码主要分为3个部分：

主代码：【Interactive_Multimodal_RAG.py】集成“快速检索”+“深度检索”的多模态RAG应用
分支代码：【RAG_WEB_TOPIC_Enhanced.py + RAG_WEB_TOPIC.py】集成“主题”检索的Web 抓取 + 知识图谱构建的综合RAG应用

说明：RAG_WEB_TOPIC_Enhanced.py 系统基于 RAG_WEB_TOPIC.py 改进开发，在使用运行RAG_WEB_TOPIC_Enhanced.py 的时候会同时运行 RAG_WEB_TOPIC.py 中的一些基础依赖和配置。

主代码：【Interactive_Multimodal_RAG.py】

"""
交互式多模态RAG系统
支持PDF上传、多种检索模式和网页爬取功能
"""

import os
import sys
import json
import requests
import io
import numpy as np
from typing import List, Dict, Any, Optional
from dotenv import load_dotenv
from sklearn.metrics.pairwise import cosine_similarity

# 在文件顶部添加CAMEL相关导入
from camel.models import ModelFactory
from camel.types import ModelPlatformType

# PDF处理
try:
    from pypdf import PdfReader
except ImportError:
    print("缺少pypdf库，请运行: pip install pypdf")
    sys.exit(1)

try:
    from unstructured.partition.auto import partition
    from unstructured.documents.elements import Text, Image, Table
except ImportError:
    print("缺少unstructured库，请运行: pip install unstructured")
    sys.exit(1)

# 嵌入模型
try:
    from sentence_transformers import SentenceTransformer
    EMBEDDING_AVAILABLE = True
except ImportError:
    print("缺少sentence-transformers库")
    EMBEDDING_AVAILABLE = False

# 导入网页研究系统
try:
    from RAG_WEB_TOPIC_Enhanced import EnhancedInteractiveResearchSystem
    WEB_RESEARCH_AVAILABLE = True
    print("Web research system available")
except ImportError:
    print("Web research system not available")
    WEB_RESEARCH_AVAILABLE = False

class SimpleLLMInterface:
    """LLM接口 - 使用CAMEL ModelFactory"""
    
    def __init__(self, api_key: str, model_name: str = "Qwen/Qwen2.5-72B-Instruct", use_camel: bool = True):
        if not api_key:
            raise ValueError("API key is required")
        
        self.api_key = api_key
        self.model_name = model_name
        self.use_camel = use_camel
        self.model = None
        
        if use_camel:
            try:
                # 使用CAMEL ModelFactory初始化模型
                self.model = ModelFactory.create(
                    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
                    model_type=model_name,
                    url='https://api-inference.modelscope.cn/v1/',
                    api_key=api_key
                )
                print(f"CAMEL LLM initialized: {model_name}")
                print(f"API key: {api_key[:10]}...{api_key[-4:]}")
            except Exception as e:
                print(f"CAMEL initialization failed, using fallback: {e}")
                self.model = None
        else:
            print(f"Direct API LLM initialized: {model_name}")
            print(f"API key: {api_key[:10]}...{api_key[-4:]}")

    def generate(self, prompt: str, max_tokens: int = 500) -> str:
        """生成文本回答 - 使用CAMEL模型或直接API调用"""
        # 如果CAMEL模型可用，尝试使用
        if self.model is not None:
            try:
                print(f"Generating response with CAMEL model...")
                # 使用CAMEL模型生成回答
                from camel.messages import BaseMessage
                
                # 创建用户消息
                user_message = BaseMessage.make_user_message(
                    role_name="user",
                    content=prompt
                )
                
                # 调用模型生成回答
                response = self.model.run([user_message])
                
                # 修复：正确处理CAMEL模型的响应
                if response:
                    # 如果响应是BaseMessage对象
                    if hasattr(response, 'content'):
                        return response.content
                    # 如果响应是列表，取第一个元素
                    elif isinstance(response, list) and len(response) > 0:
                        first_response = response[0]
                        if hasattr(first_response, 'content'):
                            return first_response.content
                        else:
                            return str(first_response)
                    # 如果响应是字符串
                    elif isinstance(response, str):
                        return response
                    # 其他情况转换为字符串
                    else:
                        return str(response)
                else:
                    raise Exception("No response generated from CAMEL model")
                    
            except Exception as e:
                print(f"CAMEL generation failed, using fallback: {str(e)[:100]}...")
                # 降级到直接API调用
                return self._fallback_generate(prompt, max_tokens)
        else:
            # 直接使用API调用
            print(f"Generating response with direct API call...")
            return self._fallback_generate(prompt, max_tokens)

    def _fallback_generate(self, prompt: str, max_tokens: int = 500) -> str:
        """降级方案：直接API调用 - 增加重试机制和超时处理"""
        max_retries = 3
        timeout_seconds = 60  # 增加超时时间
        
        for attempt in range(max_retries):
            try:
                import requests
                
                headers = {
                    "Authorization": f"Bearer {self.api_key}",
                    "Content-Type": "application/json"
                }
                
                data = {
                    "model": self.model_name,
                    "messages": [{"role": "user", "content": prompt}],
                    "max_tokens": max_tokens,
                    "temperature": 0.7
                }
                
                print(f"API调用 {attempt + 1}/{max_retries}...")
                
                response = requests.post(
                    "https://api-inference.modelscope.cn/v1/chat/completions",
                    headers=headers,
                    json=data,
                    timeout=timeout_seconds
                )
                
                if response.status_code == 200:
                    result = response.json()
                    if 'choices' in result and len(result['choices']) > 0:
                        content = result['choices'][0]['message']['content']
                        print(f"√ API调用成功")
                        return content
                    else:
                        raise Exception(f"API响应格式错误: {result}")
                else:
                    raise Exception(f"API调用失败 (状态码: {response.status_code}): {response.text}")
                    
            except requests.exceptions.Timeout:
                print(f"API调用超时 (尝试 {attempt + 1}/{max_retries})")
                if attempt == max_retries - 1:
                    return f"抱歉，由于网络超时，无法生成回答。请稍后重试。"
                continue
                
            except requests.exceptions.ConnectionError:
                print(f"网络连接错误 (尝试 {attempt + 1}/{max_retries})")
                if attempt == max_retries - 1:
                    return f"抱歉，网络连接失败，无法生成回答。请检查网络连接。"
                continue
                
            except Exception as e:
                print(f"API调用失败 (尝试 {attempt + 1}/{max_retries}): {str(e)[:100]}...")
                if attempt == max_retries - 1:
                    return f"生成答案时出现错误: {str(e)}"
                continue
        
        return "抱歉，多次尝试后仍无法生成回答，请稍后重试。"

class SimpleEmbeddingModel:
    """简化的嵌入模型"""
    
    def __init__(self, model_name: str = 'intfloat/e5-large-v2'):
        if not EMBEDDING_AVAILABLE:
            raise ImportError("sentence-transformers not available")
        
        try:
            self.model = SentenceTransformer(model_name)
            print(f"√ Embedding model loaded: {model_name}")
        except Exception as e:
            print(f"Failed to load embedding model: {e}")
            raise

    def encode(self, texts: List[str]) -> np.ndarray:
        """文本编码"""
        try:
            return self.model.encode(texts, convert_to_numpy=True)
        except Exception as e:
            print(f"Encoding failed: {e}")
            return np.array([])

class SimpleVectorRetriever:
    """简化的向量检索器"""
    
    def __init__(self, embedding_model: SimpleEmbeddingModel):
        self.embedding_model = embedding_model
        self.documents = []
        self.doc_metadata = []
        self.document_ids = []
        self.doc_embeddings = None
        print("√ Simple vector retriever initialized")
    
    def add_documents(self, texts: List[str], metadata: List[Dict[str, Any]]):
        """添加文档"""
        if not texts:
            return
        
        try:
            # 生成文档ID
            new_ids = [f"doc_{len(self.documents) + i}" for i in range(len(texts))]
            
            # 存储文档
            self.documents.extend(texts)
            self.doc_metadata.extend(metadata)
            self.document_ids.extend(new_ids)
            
            # 计算嵌入
            print(f"Computing embeddings for {len(texts)} documents...")
            new_embeddings = self.embedding_model.encode(texts)
            
            if self.doc_embeddings is None:
                self.doc_embeddings = new_embeddings
            else:
                self.doc_embeddings = np.vstack([self.doc_embeddings, new_embeddings])
            
            print(f"Added {len(texts)} documents to retriever")
            
        except Exception as e:
            print(f"Error adding documents: {e}")
            raise
    
    def query(self, query_text: str, top_k: int = 5, filter_type: Optional[str] = None) -> List[Dict[str, Any]]:
        """检索相关文档"""
        if not self.documents or self.doc_embeddings is None:
            print("No documents in retriever")
            return []
        
        try:
            # 计算查询嵌入
            query_embedding = self.embedding_model.encode([query_text])
            
            # 计算相似度
            similarities = cosine_similarity(query_embedding, self.doc_embeddings)[0]
            
            # 获取top_k结果
            top_indices = np.argsort(similarities)[::-1][:top_k * 2]
            
            results = []
            for idx in top_indices:
                if idx >= len(self.documents):
                    continue
                    
                doc_type = self.doc_metadata[idx].get('type', 'unknown')
                if filter_type and doc_type != filter_type:
                    continue
                
                results.append({
                    'text': self.documents[idx],
                    'similarity': float(similarities[idx]),
                    'metadata': self.doc_metadata[idx],
                    'id': self.document_ids[idx]
                })
                
                if len(results) >= top_k:
                    break
            
            print(f"Retrieved {len(results)} documents")
            return results
            
        except Exception as e:
            print(f"Query failed: {e}")
            return []

class SimpleRAGSystem:
    """简化的RAG系统 - 集成CAMEL ModelFactory"""
    
    def __init__(self, api_key: str, model_name: str = "Qwen/Qwen2.5-72B-Instruct", use_camel: bool = True):
        if not api_key:
            raise ValueError("错误：API key required")
        
        try:
            if use_camel:
                print("Initializing Simple RAG System with CAMEL...")
            else:
                print("Initializing Simple RAG System with direct API...")
            
            # 使用LLM接口（CAMEL或直接API）
            self.llm = SimpleLLMInterface(api_key=api_key, model_name=model_name, use_camel=use_camel)
            # 保持原有的嵌入模型和检索器
            self.embedding_model = SimpleEmbeddingModel()
            self.vector_retriever = SimpleVectorRetriever(self.embedding_model)
            
            self.knowledge_base_initialized = False
            self.multimodal_content_store = {}
            
            print("√ Simple RAG System initialized successfully!")
            
        except Exception as e:
            print(f"错误：Initialization failed: {e}")
            raise

    def setup_knowledge_base(self, pdf_url: Optional[str] = None, pdf_path: Optional[str] = None):
        """设置知识库"""
        try:
            if pdf_url:
                print(f"↓ Loading PDF from URL: {pdf_url}")
                response = requests.get(pdf_url, timeout=30)
                response.raise_for_status()
                pdf_bytes = response.content
                print(f"√ PDF downloaded ({len(pdf_bytes)} bytes)")
                pdf_file = io.BytesIO(pdf_bytes)
                elements = partition(file=pdf_file)
            elif pdf_path:
                print(f"Loading PDF from: {pdf_path}")
                if not os.path.exists(pdf_path):
                    raise FileNotFoundError(f"错误：PDF not found: {pdf_path}")
                elements = partition(filename=pdf_path)
                print(f"√ PDF loaded successfully")
            else:
                raise ValueError("错误：Either pdf_url or pdf_path required")
                
        except Exception as e:
            print(f"错误：PDF loading error: {e}")
            raise

        # 处理文档元素
        texts_to_embed = []
        metadata_to_embed = []
        multimodal_id_counter = 0

        for element in elements:
            element_text = str(element).strip()
            if not element_text or len(element_text) < 10:
                continue
            
            multimodal_id = f"multimodal_{multimodal_id_counter}"
            multimodal_id_counter += 1
            
            if isinstance(element, Text):
                texts_to_embed.append(element_text)
                metadata_to_embed.append({
                    'type': 'text',
                    'source': 'pdf',
                    'multimodal_id': multimodal_id
                })
            elif isinstance(element, Image):
                # 图像处理
                image_description = f"图像内容: {element_text}"
                texts_to_embed.append(image_description)
                metadata_to_embed.append({
                    'type': 'image',
                    'source': 'pdf',
                    'multimodal_id': multimodal_id
                })
                self.multimodal_content_store[multimodal_id] = {
                    'type': 'image',
                    'data': element_text
                }
            elif isinstance(element, Table):
                # 表格处理
                table_description = f"表格内容: {element_text}"
                texts_to_embed.append(table_description)
                metadata_to_embed.append({
                    'type': 'table',
                    'source': 'pdf',
                    'multimodal_id': multimodal_id
                })
                self.multimodal_content_store[multimodal_id] = {
                    'type': 'table',
                    'data': element_text
                }
            else:
                # 其他类型作为文本处理
                texts_to_embed.append(element_text)
                metadata_to_embed.append({
                    'type': 'text',
                    'source': 'pdf',
                    'multimodal_id': multimodal_id
                })

        if texts_to_embed:
            self.vector_retriever.add_documents(texts_to_embed, metadata_to_embed)
            self.knowledge_base_initialized = True
            
            text_count = sum(1 for meta in metadata_to_embed if meta.get('type') == 'text')
            image_count = sum(1 for meta in metadata_to_embed if meta.get('type') == 'image')
            table_count = sum(1 for meta in metadata_to_embed if meta.get('type') == 'table')
            
            print(f"√ Knowledge base setup complete: {len(texts_to_embed)} elements")
            print(f" Content: {text_count} text, {image_count} images, {table_count} tables")
        else:
            raise ValueError("No content extracted from PDF")

    def get_available_retrieval_methods(self) -> List[str]:
        """获取可用的检索方法"""
        return ["Vector", "Enhanced"]

    def _query_rewriting(self, original_query: str) -> str:
        """查询重写 - 使用CAMEL模型"""
        try:
            prompt = f"""请重写以下查询，使其更适合文档检索和信息提取：

原始查询：{original_query}

重写要求：
1. 保持查询的核心意图
2. 使用更具体和明确的词汇
3. 适合向量检索和语义匹配
4. 只返回重写后的查询，不要其他解释

重写后的查询："""
            
            rewritten_query = self.llm.generate(prompt, max_tokens=100)
            
            # 清理返回结果，只保留重写的查询
            if rewritten_query and not rewritten_query.startswith("抱歉") and not rewritten_query.startswith("生成答案时出现错误"):
                # 提取实际的重写查询
                lines = rewritten_query.strip().split('\n')
                for line in lines:
                    line = line.strip()
                    if line and not line.startswith('重写后的查询') and not line.startswith('原始查询'):
                        rewritten_query = line
                        break
                
                print(f"Query rewritten: {original_query} -> {rewritten_query[:50]}...")
                return rewritten_query.strip()
            else:
                print(f"警告：Query rewriting failed, using original query")
                return original_query
                
        except Exception as e:
            print(f"警告：Query rewriting failed: {e}")
            return original_query

    def _hyde_generation(self, query: str) -> str:
        """HyDE假设文档生成 - 使用CAMEL模型"""
        try:
            prompt = f"""基于以下查询，生成一个假设性的文档片段，该片段可能包含查询的答案：

查询：{query}

要求：
1. 生成一个200-300字的文档片段
2. 内容应该直接回答查询问题
3. 使用专业和准确的语言
4. 包含相关的技术细节和概念

假设文档："""
            
            hyde_doc = self.llm.generate(prompt, max_tokens=300)
            
            if hyde_doc and not hyde_doc.startswith("抱歉") and not hyde_doc.startswith("生成答案时出现错误"):
                print(f"📝 HyDE document generated: {len(hyde_doc)} characters")
                return hyde_doc.strip()
            else:
                print(f"警告：HyDE generation failed, using original query")
                return query
                
        except Exception as e:
            print(f"警告：HyDE generation failed: {e}")
            return query

    def _rrf_fusion(self, all_results: List[List[Dict]], k: int = 60) -> List[Dict[str, Any]]:
        """RRF融合多个检索结果"""
        try:
            doc_scores = {}
            
            for results in all_results:
                for rank, doc in enumerate(results):
                    doc_id = doc.get('id', '')
                    if doc_id:
                        rrf_score = 1.0 / (k + rank + 1)
                        if doc_id in doc_scores:
                            doc_scores[doc_id]['score'] += rrf_score
                        else:
                            doc_scores[doc_id] = {
                                'doc': doc,
                                'score': rrf_score
                            }
            
            # 按分数排序
            sorted_docs = sorted(doc_scores.values(), key=lambda x: x['score'], reverse=True)
            
            # 为文档添加RRF分数
            final_docs = []
            for item in sorted_docs:
                doc = item['doc'].copy()
                doc['rrf_score'] = item['score']
                final_docs.append(doc)
            
            return final_docs
            
        except Exception as e:
            print(f"警告：RRF fusion failed: {e}")
            return all_results[0] if all_results else []

    def enhanced_query(self, original_query: str, use_rewriting: bool = True, use_hyde: bool = True,
                      use_rrf: bool = True, top_k: int = 5, rrf_k: int = 60,
                      multimodal_preference: Optional[List[str]] = None) -> Dict[str, Any]:
        """执行增强型RAG查询"""
        if not self.knowledge_base_initialized:
            raise RuntimeError("Knowledge base not initialized")

        # 根据参数确定检索类型
        if use_rewriting and use_hyde and use_rrf:
            print("\n执行深度检索...")
            print("="*60)
            print("开始执行深度RAG查询")
            print("="*60)
        else:
            print("\n执行检索...")
            print("="*40)

        query_for_retrieval = original_query
        rewritten_query = None
        hyde_doc = None
        retrieval_method = "Vector"
        all_retrieved_results = []

        # 步骤1: 查询重写
        if use_rewriting:
            print("\n步骤1: 查询重写")
            print("-" * 30)
            print(f"原始查询: {original_query}")
            rewritten_query = self._query_rewriting(original_query)
            query_for_retrieval = rewritten_query
            print(f"重写查询: {rewritten_query}")
            retrieval_method += "+Rewriting"

        # 步骤2: 文档检索
        print("\n步骤2: 文档检索")
        print("-" * 30)
        if use_hyde and use_rrf:
            print("使用HyDE+RRF组合方法进行检索...")
            print("使用RRF算法进行混合检索（HyDE增强向量检索）...")
        else:
            print("使用基础向量检索...")

        # HyDE生成
        if use_hyde:
            print("执行HyDE增强向量检索...")
            hyde_doc = self._hyde_generation(query_for_retrieval)
            print("生成的假设文档:")
            print(hyde_doc)
            retrieval_method += "+HyDE"

        # 多模态检索
        text_results = self.vector_retriever.query(query_for_retrieval, top_k=top_k, filter_type='text')
        all_retrieved_results.append(text_results)
        print(f"✓ HyDE向量检索完成，获得 {len(text_results)} 个结果")

        if multimodal_preference:
            if 'image' in multimodal_preference:
                image_results = self.vector_retriever.query(query_for_retrieval, top_k=top_k, filter_type='image')
                all_retrieved_results.append(image_results)
                print(f"✓ 图像检索完成，获得 {len(image_results)} 个结果")
                retrieval_method += "+Image"
            if 'table' in multimodal_preference:
                table_results = self.vector_retriever.query(query_for_retrieval, top_k=top_k, filter_type='table')
                all_retrieved_results.append(table_results)
                print(f"✓ 表格检索完成，获得 {len(table_results)} 个结果")
                retrieval_method += "+Table"

        if hyde_doc:
            print("执行BM25检索（使用原始查询）...")
            hyde_results = self.vector_retriever.query(hyde_doc, top_k=top_k)
            all_retrieved_results.append(hyde_results)
            print(f"✓ BM25检索成功，获得 {len(hyde_results)} 个结果")

        # RRF融合
        if use_rrf and len(all_retrieved_results) > 1:
            print("使用RRF算法融合检索结果...")
            final_retrieved_docs = self._rrf_fusion(all_retrieved_results, k=rrf_k)
            retrieval_method += "+RRF"
            
            # 统计唯一文档数量
            unique_doc_ids = set()
            for res_list in all_retrieved_results:
                for doc in res_list:
                    unique_doc_ids.add(doc.get('id', ''))
            print(f"RRF融合完成，共处理 {len(unique_doc_ids)} 个唯一文档，返回前 {top_k} 个结果")
            print(f"HyDE+RRF检索完成，返回 {len(final_retrieved_docs)} 个文档")
        else:
            unique_docs = {}
            for res_list in all_retrieved_results:
                for doc in res_list:
                    if doc.get('id') not in unique_docs:
                        unique_docs[doc.get('id')] = doc
            final_retrieved_docs = list(unique_docs.values())
            print(f"文档合并完成，返回 {len(final_retrieved_docs)} 个文档")

        # 限制最终文档数量
        final_retrieved_docs = final_retrieved_docs[:top_k]

        # 显示检索到的文档预览
        for i, doc in enumerate(final_retrieved_docs, 1):
            similarity = doc.get('similarity', 0)
            rrf_score = getattr(doc, 'rrf_score', similarity)  # 如果有RRF分数则使用，否则使用相似度
            text_preview = doc.get('text', '')[:200] + "..." if len(doc.get('text', '')) > 200 else doc.get('text', '')
            print(f"文档 {i} (RRF分数: {rrf_score:.4f}):")
            print(f"{text_preview}")
            print()

        # 步骤3: 答案生成
        print("步骤3: 答案生成")
        print("-" * 30)
        print()

        # 构建上下文
        context_texts = []
        for doc in final_retrieved_docs:
            context_texts.append(doc['text'])

        # 生成最终答案
        separator = '\n---\n'
        context_str = separator.join(context_texts)
        
        prompt_for_llm = f"""你是一个专业的文档分析助手。请基于以下PDF文档内容回答用户问题。

文档内容：
{context_str}

用户问题：{original_query}

回答要求：
1. 仔细阅读并理解文档内容
2. 基于文档内容提供准确、详细的答案
3. 如果文档中没有相关信息，请明确说明
4. 使用清晰的结构组织答案
5. 引用具体的文档内容支持你的回答

请提供详细的答案："""
        
        print("正在生成最终答案...")
        final_answer = self.llm.generate(prompt_for_llm, max_tokens=800)
        
        if final_answer and not final_answer.startswith("抱歉") and not final_answer.startswith("生成答案时出现错误"):
            print("√ 答案生成成功")
            print("最终答案:")
            print(final_answer)
        else:
            print("警告：答案生成失败，提供基于检索文档的简化回答")
            # 提供基于检索文档的简化回答
            simple_answer = f"基于检索到的文档内容，关于'{original_query}'的相关信息如下：\n\n"
            for i, doc in enumerate(final_retrieved_docs[:3], 1):
                simple_answer += f"{i}. {doc['text'][:200]}...\n\n"
            final_answer = simple_answer
            print("最终答案:")
            print(final_answer)

        return {
            'original_query': original_query,
            'rewritten_query': rewritten_query,
            'hyde_doc': hyde_doc,
            'retrieved_docs': final_retrieved_docs,
            'final_answer': final_answer,
            'retrieval_method': retrieval_method
        }

class InteractiveMultimodalRAG:
    """交互式多模态RAG系统 - 集成CAMEL ModelFactory"""
    
    def __init__(self):
        self.api_key = None
        self.rag_system = None
        self.web_research_system = None
        self.knowledge_base_loaded = False
        self.current_pdf_source = None
        
    def initialize_system(self):
        """初始化系统 - 使用CAMEL ModelFactory"""
        print("初始化交互式多模态RAG系统...")
        
        # 加载环境变量
        load_dotenv()
        
        # 获取API密钥
        self.api_key = os.getenv('MODELSCOPE_SDK_TOKEN')
        if not self.api_key:
            print("错误：错误：请设置MODELSCOPE_SDK_TOKEN环境变量")
            print("提示：在.env文件中添加 MODELSCOPE_SDK_TOKEN=your_api_key")
            return False
        
        try:
            # 使用集成CAMEL的简化RAG系统
            self.rag_system = SimpleRAGSystem(api_key=self.api_key, model_name="Qwen/Qwen2.5-72B-Instruct")
            print("√ 集成CAMEL的RAG系统初始化成功")
            
            # 初始化网页研究系统
            if WEB_RESEARCH_AVAILABLE:
                try:
                    self.web_research_system = EnhancedInteractiveResearchSystem()
                    print("√ 网页研究系统初始化成功")
                except Exception as e:
                    print(f"！警告： 网页研究系统初始化失败: {e}")
                    self.web_research_system = None
            
            return True
            
        except Exception as e:
            print(f"！错误：系统初始化失败: {e}")
            return False
    
    def load_pdf_knowledge_base(self):
        """加载PDF知识库"""
        print("\nPDF知识库设置")
        print("="*50)
        print("1. 在线PDF (输入URL)")
        print("2. 本地PDF (输入文件路径)")
        print("3. 使用默认示例PDF")
        
        choice = input("\n请选择PDF来源 (1-3): ").strip()
        
        try:
            if choice == "1":
                pdf_url = input("请输入PDF的URL: ").strip()
                if not pdf_url:
                    print("错误：URL不能为空")
                    return False
                
                print(f"↓ 正在加载在线PDF: {pdf_url}")
                self.rag_system.setup_knowledge_base(pdf_url=pdf_url)
                self.current_pdf_source = f"在线PDF: {pdf_url}"
                
            elif choice == "2":
                pdf_path = input("请输入PDF文件路径: ").strip()
                if not pdf_path:
                    print("错误：文件路径不能为空")
                    return False
                
                if not os.path.exists(pdf_path):
                    print(f"错误：文件不存在: {pdf_path}")
                    return False
                
                print(f"状态查询： 正在加载本地PDF: {pdf_path}")
                self.rag_system.setup_knowledge_base(pdf_path=pdf_path)
                self.current_pdf_source = f"本地PDF: {pdf_path}"
                
            elif choice == "3":
                pdf_url = "https://arxiv.org/pdf/2303.17760.pdf"
                print(f"↓ 正在加载默认示例PDF: {pdf_url}")
                self.rag_system.setup_knowledge_base(pdf_url=pdf_url)
                self.current_pdf_source = f"示例PDF: CAMEL论文"
                
            else:
                print("错误：无效选择")
                return False
            
            self.knowledge_base_loaded = True
            print("√ PDF知识库加载成功！")
            return True
            
        except Exception as e:
            print(f"错误：PDF加载失败: {e}")
            return False
    
    def execute_query(self, query: str, retrieval_mode: str) -> Dict[str, Any]:
        """执行查询"""
        if not self.knowledge_base_loaded:
            return {"error": "知识库未加载，请先加载PDF"}
        
        print(f"\n执行查询: {query}")
        print(f"检索模式: {retrieval_mode}")
        
        try:
            if retrieval_mode == "快速检索":
                # 基础向量检索 - 直接检索生成答案
                return self.quick_retrieval(query)
                
            elif retrieval_mode == "深度检索":
                # 完整增强检索
                results = self.rag_system.enhanced_query(
                    original_query=query,
                    use_rewriting=True,
                    use_hyde=True,
                    use_rrf=True,
                    top_k=5,
                    multimodal_preference=['text', 'image', 'table']
                )
                
            elif retrieval_mode == "主题检索":
                # 网页爬取检索 - 使用真实的网页研究系统
                return self.topic_retrieval(query)
                
            else:
                return {"error": f"未知检索模式: {retrieval_mode}"}
            
            return results
            
        except Exception as e:
            return {"error": f"查询执行失败: {e}"}
    
    def quick_retrieval(self, query: str) -> Dict[str, Any]:
        """快速检索 - 基础向量检索直接生成答案"""
        print("\n执行快速检索...")
        print("="*40)
        
        try:
            # 直接进行向量检索
            print("正在进行向量检索...")
            retrieved_docs = self.rag_system.vector_retriever.query(query, top_k=3, filter_type='text')
            
            if not retrieved_docs:
                return {"error": "未找到相关文档"}
            
            print(f"√ 检索到 {len(retrieved_docs)} 个相关文档")
            
            # 显示检索到的文档
            for i, doc in enumerate(retrieved_docs, 1):
                similarity = doc.get('similarity', 0)
                text_preview = doc.get('text', '')[:150] + "..." if len(doc.get('text', '')) > 150 else doc.get('text', '')
                print(f"文档 {i} (相似度: {similarity:.3f}):")
                print(f"   {text_preview}")
                print()
            
            # 构建简单的上下文
            context_texts = [doc['text'] for doc in retrieved_docs]
            context_str = '\n---\n'.join(context_texts)
            
            # 生成答案
            print("正在生成答案...")
            prompt = f"""基于以下文档内容回答问题：

文档内容：
{context_str}

问题：{query}

请提供简洁明确的答案："""
            
            final_answer = self.rag_system.llm.generate(prompt, max_tokens=400)
            
            print("√ 快速检索完成")
            
            return {
                'original_query': query,
                'retrieved_docs': retrieved_docs,
                'final_answer': final_answer,
                'retrieval_method': 'Quick Vector Retrieval'
            }
            
        except Exception as e:
            return {"error": f"快速检索失败: {e}"}

    def topic_retrieval(self, query: str) -> Dict[str, Any]:
        """主题检索 - 集成网页研究系统"""
        print("\n执行网页检索...")
        print("="*40)
        
        try:
            if not self.web_research_system:
                print("警告：网页研究系统不可用，使用备用方案")
                return self.perform_fallback_topic_search(query)
            
            # 使用网页研究系统进行搜索
            print("正在进行网页研究...")
            web_content = ""
            web_sources = []
            
            try:
                # 检查可用的方法并调用正确的方法
                if hasattr(self.web_research_system, 'research_and_analyze'):
                    # 使用正确的方法名
                    research_result = self.web_research_system.research_and_analyze(query)
                    if isinstance(research_result, dict):
                        web_content = research_result.get('content', '')
                        web_sources = research_result.get('sources', [])
                    else:
                        web_content = str(research_result)
                        web_sources = ["网页研究结果"]
                    print("√ 网页研究完成")
                    
                elif hasattr(self.web_research_system, 'toolkit') and hasattr(self.web_research_system.toolkit, 'search_web_for_topic'):
                    # 使用工具包搜索
                    search_result = self.web_research_system.toolkit.search_web_for_topic(query, "")
                    web_content = search_result
                    web_sources = ["网页搜索结果"]
                    print("√ 网页搜索完成")
                    
                elif hasattr(self.web_research_system, 'run_interactive_session'):
                    # 尝试使用交互式会话方法
                    print("警告：使用交互式研究系统，但无法直接调用")
                    web_content = f"关于'{query}'的网页研究信息需要交互式操作"
                    web_sources = ["交互式研究系统"]
                    
                else:
                    print("警告：网页研究系统方法不可用")
                    web_content = f"关于'{query}'的网页搜索信息暂时不可用"
                    web_sources = []
                    
            except Exception as e:
                print(f"警告：网页搜索失败: {e}")
                web_content = f"网页搜索遇到错误: {str(e)}"
                web_sources = []
            
            # 同时进行PDF检索
            print("正在检索PDF文档...")
            pdf_docs = self.rag_system.vector_retriever.query(query, top_k=3, filter_type='text')
            
            # 合并结果
            combined_context = ""
            
            # 添加PDF内容
            if pdf_docs:
                pdf_context = "\n".join([doc['text'] for doc in pdf_docs])
                combined_context += f"PDF文档内容：\n{pdf_context}\n\n"
                print(f"√ 检索到 {len(pdf_docs)} 个PDF文档")
            
            # 添加网页内容
            if web_content and web_content.strip() and not web_content.startswith("关于") and not web_content.startswith("网页搜索遇到错误"):
                combined_context += f"网页搜索内容：\n{web_content}\n\n"
            
            if not combined_context.strip():
                print("警告：未找到相关信息，使用备用方案")
                return self.perform_fallback_topic_search(query)
            
            # 生成综合答案
            print("正在生成综合答案...")
            prompt = f"""基于以下PDF文档和网页搜索的信息，回答问题：

{combined_context}

问题：{query}

请提供综合性的详细答案："""
            
            final_answer = self.rag_system.llm.generate(prompt, max_tokens=800)
            
            print("主题检索完成")
            
            return {
                'original_query': query,
                'pdf_docs': pdf_docs,
                'web_sources': web_sources,
                'final_answer': final_answer,
                'retrieval_method': 'PDF+Web Topic Retrieval'
            }
            
        except Exception as e:
            print(f"警告：主题检索失败，使用备用方案: {e}")
            return self.perform_fallback_topic_search(query)

    def perform_web_research(self, query: str) -> Dict[str, Any]:
        """执行网页研究"""
        print("正在进行网页研究...")
        
        try:
            # 模拟网页研究结果
            web_content = f"基于网页搜索的{query}相关信息：\n"
            web_content += "- 网页来源1的相关内容\n"
            web_content += "- 网页来源2的相关内容\n"
            web_content += "- 网页来源3的相关内容"
            
            return {
                "web_content": web_content,
                "sources": ["网页来源1", "网页来源2", "网页来源3"],
                "method": "web_research"
            }
            
        except Exception as e:
            print(f"网页研究失败: {e}")
            return {"error": f"网页研究失败: {e}"}

    def perform_fallback_topic_search(self, query: str) -> Dict[str, Any]:
        """备用主题搜索 - 仅使用PDF检索"""
        print("执行备用主题搜索（仅PDF检索）...")
        
        try:
            # 进行PDF检索
            print("正在检索PDF文档...")
            pdf_docs = self.rag_system.vector_retriever.query(query, top_k=5, filter_type='text')
            
            if not pdf_docs:
                return {"error": "未找到相关PDF文档"}
            
            print(f"检索到 {len(pdf_docs)} 个PDF文档")
            
            # 显示检索到的文档
            for i, doc in enumerate(pdf_docs, 1):
                similarity = doc.get('similarity', 0)
                text_preview = doc.get('text', '')[:150] + "..." if len(doc.get('text', '')) > 150 else doc.get('text', '')
                print(f"文档 {i} (相似度: {similarity:.3f}):")
                print(f"   {text_preview}")
                print()
            
            # 构建上下文
            pdf_context = "\n".join([doc['text'] for doc in pdf_docs])
            
            # 生成答案
            print("正在生成答案...")
            prompt = f"""基于以下PDF文档内容回答问题：

PDF文档内容：
{pdf_context}

问题：{query}

请提供详细的答案，特别关注CAMEL框架的特性和工具："""
            
            final_answer = self.rag_system.llm.generate(prompt, max_tokens=800)
            
            print("√ 备用主题搜索完成")
            
            return {
                'original_query': query,
                'retrieved_docs': pdf_docs,
                'final_answer': final_answer,
                'retrieval_method': 'Fallback PDF Topic Retrieval'
            }
            
        except Exception as e:
            print(f"备用主题搜索失败: {e}")
            return {"error": f"备用主题搜索失败: {e}"}
    
    def merge_web_and_pdf_results(self, web_results: Dict, pdf_results: Dict, query: str) -> Dict[str, Any]:
        """合并网页和PDF检索结果"""
        try:
            # 合并上下文
            combined_context = ""
            
            # 添加PDF内容
            if 'retrieved_docs' in pdf_results:
                pdf_context = "\n".join([doc['text'] for doc in pdf_results['retrieved_docs']])
                combined_context += f"PDF文档内容：\n{pdf_context}\n\n"
            
            # 添加网页内容
            if 'web_content' in web_results:
                combined_context += f"网页搜索内容：\n{web_results['web_content']}\n\n"
            
            # 生成综合答案
            prompt = f"基于以下PDF文档和网页搜索的信息，回答问题：\n\n{combined_context}\n\n问题：{query}\n\n请提供综合性的详细答案。"
            
            final_answer = self.rag_system.llm.generate(prompt, max_tokens=800)
            
            return {
                'original_query': query,
                'pdf_docs': pdf_results.get('retrieved_docs', []),
                'web_sources': web_results.get('sources', []),
                'final_answer': final_answer,
                'retrieval_method': 'PDF+Web主题检索'
            }
            
        except Exception as e:
            return {"error": f"结果合并失败: {e}"}
    
    def display_results(self, results: Dict[str, Any]):
        """显示查询结果"""
        if 'error' in results:
            print(f"错误: {results['error']}")
            return

        print("\n" + "="*20 + " 深度检索结果 " + "="*20)
        print(f"原结始查询: {results.get('original_query', 'N/A')}")
        
        if results.get('rewritten_query'):
            print(f"重写查询: {results['rewritten_query']}")
        
        print(f"检索方法: {results.get('retrieval_method', 'N/A')}")
        
        # 显示检索到的文档
        retrieved_docs = results.get('retrieved_docs', [])
        if retrieved_docs:
            print(f"\n检索到的文档 (共{len(retrieved_docs)}个):")
            print()
            for i, doc in enumerate(retrieved_docs, 1):
                rrf_score = doc.get('rrf_score', doc.get('similarity', 0))
                text_preview = doc.get('text', '')[:200] + "..." if len(doc.get('text', '')) > 200 else doc.get('text', '')
                print(f"文档 {i}:")
                print(f"相关度分数: {rrf_score}")
                print(f"内容预览: {text_preview}")
                print()
        
        # 显示最终答案
        final_answer = results.get('final_answer', 'N/A')
        print("💡 生成答案:")
        print(final_answer)
        print("="*60)
        
        # 询问是否保存结果
        save_choice = input("\n询问：是否保存结果到文件？(y/n): ").strip().lower()
        if save_choice == 'y':
            self._save_results_to_file(results)

    def _save_results_to_file(self, results: Dict[str, Any]):
        """保存结果到文件"""
        try:
            from datetime import datetime
            timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
            filename = f"rag_query_result_{timestamp}.txt"
            
            with open(filename, 'w', encoding='utf-8') as f:
                f.write("="*60 + "\n")
                f.write("RAG查询结果报告\n")
                f.write("="*60 + "\n\n")
                f.write(f"查询时间: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}\n")
                f.write(f"原始查询: {results.get('original_query', 'N/A')}\n")
                if results.get('rewritten_query'):
                    f.write(f"重写查询: {results['rewritten_query']}\n")
                f.write(f"检索方法: {results.get('retrieval_method', 'N/A')}\n\n")
                
                # 保存检索文档
                retrieved_docs = results.get('retrieved_docs', [])
                if retrieved_docs:
                    f.write(f"检索到的文档 (共{len(retrieved_docs)}个):\n")
                    f.write("-" * 40 + "\n")
                    for i, doc in enumerate(retrieved_docs, 1):
                        rrf_score = doc.get('rrf_score', doc.get('similarity', 0))
                        f.write(f"\n文档 {i}:\n")
                        f.write(f"相关度分数: {rrf_score}\n")
                        f.write(f"内容: {doc.get('text', '')}\n")
                        f.write("-" * 40 + "\n")
                
                # 保存最终答案
                f.write(f"\n生成答案:\n")
                f.write(results.get('final_answer', 'N/A'))
                f.write("\n\n" + "="*60)
            
            print(f"√ 结果已保存到: {filename}")
        except Exception as e:
            print(f"错误：保存失败: {e}")
    
    def run_interactive_session(self):
        """运行交互式会话"""
        if not self.initialize_system():
            return
        
        print("\n交互式多模态RAG系统")
        print("="*60)
        print("功能特性:")
        print("- 支持在线/本地PDF加载")
        print("- 三种检索模式")
        print("- 网页爬取集成")
        print("- 多模态内容处理")
        print("="*60)
        
        # 加载知识库
        if not self.load_pdf_knowledge_base():
            print("知识库加载失败，退出系统")
            return
        
        print(f"\n当前知识库: {self.current_pdf_source}")
        print(f"🔧 可用检索方法: {', '.join(self.rag_system.get_available_retrieval_methods())}")
        
        while True:
            try:
                print("\n" + "="*60)
                print("查询选项")
                print("="*60)
                
                # 获取用户查询
                query = input("请输入您的问题 (输入 'quit' 退出, 'reload' 重新加载PDF): ").strip()
                
                if query.lower() == 'quit':
                    break
                elif query.lower() == 'reload':
                    if self.load_pdf_knowledge_base():
                        print(f"√ 知识库已重新加载: {self.current_pdf_source}")
                    continue
                elif not query:
                    print("问题不能为空")
                    continue
                
                # 选择检索模式
                print("\n选择检索模式:")
                print("1. 快速检索 (基础向量检索)")
                print("2. 深度检索 (重写+HyDE+RRF)")
                print("3. 主题检索 (PDF+网页爬取)")
                
                mode_choice = input("请选择模式 (1-3): ").strip()
                
                mode_map = {
                    "1": "快速检索",
                    "2": "深度检索", 
                    "3": "主题检索"
                }
                
                retrieval_mode = mode_map.get(mode_choice)
                if not retrieval_mode:
                    print("无效选择，使用默认快速检索")
                    retrieval_mode = "快速检索"
                
                # 执行查询
                results = self.execute_query(query, retrieval_mode)
                
                # 显示结果
                self.display_results(results)
                
                # 询问是否继续
                continue_choice = input("\n是否继续查询？(y/n): ").strip().lower()
                if continue_choice != 'y':
                    break
                    
            except KeyboardInterrupt:
                print("\n\n用户中断，退出系统")
                break
            except Exception as e:
                print(f"系统错误: {e}")
                continue
        
        print("\n感谢使用交互式多模态RAG系统！")

def main():
    """主函数"""
    try:
        interactive_rag = InteractiveMultimodalRAG()
        interactive_rag.run_interactive_session()
    except Exception as e:
        print(f"系统启动失败: {e}")
        sys.exit(1)

if __name__ == "__main__":
    main()

分支代码1：【RAG_WEB_TOPIC_Enhanced.py】

import os
import time
import json
import logging
from typing import List, Dict, Optional, Any
from dataclasses import dataclass
from pathlib import Path
from datetime import datetime
import agentops
import requests
from colorama import Fore, init
from bs4 import BeautifulSoup
from camel.loaders import Firecrawl, UnstructuredIO
from camel.retrievers import AutoRetriever
from camel.toolkits import FunctionTool, SearchToolkit
from camel.types import ModelPlatformType, StorageType
from camel.embeddings import SentenceTransformerEncoder
from camel.models import ModelFactory
from camel.societies import RolePlaying
from camel.utils import print_text_animated
from camel.storages import Neo4jGraph
from camel.agents import KnowledgeGraphAgent, ChatAgent
from camel.messages import BaseMessage
from dotenv import load_dotenv

# 导入原始系统的所有类和配置
from RAG_WEB_TOPIC import (
    ResearchConfig, ConfigManager, UniversalResearchSystem, 
    InteractiveResearchSystem
)

# 初始化 colorama
init(autoreset=True)

# 全局会话数据记录
research_session_data = {
    'start_time': None,
    'end_time': None,
    'topic': '',
    'research_question': '',
    'search_results': [],
    'retrieval_results': [],
    'knowledge_graphs': [],
    'conversation_history': [],
    'generated_files': [],
    'system_stats': {}
}

class EnhancedInteractiveResearchSystem(InteractiveResearchSystem):
    """增强版交互式研究系统 - 支持最终报告生成"""
    
    def __init__(self):
        super().__init__()
        self.session_data = research_session_data
    
    def log_search_result(self, query: str, results: Any):
        """记录搜索结果"""
        self.session_data['search_results'].append({
            'query': query,
            'results': str(results)[:1000],  # 限制长度
            'timestamp': datetime.now().isoformat()
        })
    
    def log_retrieval_result(self, urls: List[str], query: str, results: Any):
        """记录检索结果"""
        self.session_data['retrieval_results'].append({
            'urls': urls,
            'query': query,
            'results': str(results)[:1000],  # 限制长度
            'timestamp': datetime.now().isoformat()
        })
    
    def log_knowledge_graph(self, text_input: str, topic: str, result: str):
        """记录知识图谱构建"""
        self.session_data['knowledge_graphs'].append({
            'input_text': text_input[:500] + "..." if len(text_input) > 500 else text_input,
            'topic': topic,
            'result': result[:500] + "..." if len(result) > 500 else result,
            'timestamp': datetime.now().isoformat()
        })
    
    def log_conversation(self, role: str, content: str):
        """记录对话历史"""
        self.session_data['conversation_history'].append({
            'role': role,
            'content': content[:800] + "..." if len(content) > 800 else content,
            'timestamp': datetime.now().isoformat()
        })
    
    def create_enhanced_research_tools(self, topic: str) -> List[FunctionTool]:
        """创建增强版研究工具（带日志记录）"""
        
        def enhanced_retrieve_urls(urls: List[str], query: str) -> str:
            result = self.toolkit.retrieve_information_from_urls(urls, query)
            self.log_retrieval_result(urls, query, result)
            return result
        
        def enhanced_search_topic(query: str) -> str:
            result = self.toolkit.search_web_for_topic(query, topic)
            self.log_search_result(query, result)
            return result
        
        def enhanced_build_kg(text_input: str) -> str:
            result = self.toolkit.build_knowledge_graph(text_input, topic)
            self.log_knowledge_graph(text_input, topic, result)
            return result
        
        return [
            FunctionTool(enhanced_retrieve_urls),
            FunctionTool(enhanced_search_topic),
            FunctionTool(enhanced_build_kg),
        ]
    
    def generate_final_research_report(self) -> str:
        """生成最终研究报告"""
        
        if not self.model:
            return "❌ AI模型未初始化，无法生成最终报告"
        
        print(Fore.BLUE + "📊 正在生成最终研究报告...")
        
        # 计算统计数据
        duration = "未知"
        if self.session_data['start_time'] and self.session_data['end_time']:
            start = datetime.fromisoformat(self.session_data['start_time'])
            end = datetime.fromisoformat(self.session_data['end_time'])
            duration = str(end - start)
        
        total_searches = len(self.session_data['search_results'])
        total_retrievals = len(self.session_data['retrieval_results'])
        total_kg = len(self.session_data['knowledge_graphs'])
        total_conversations = len(self.session_data['conversation_history'])
        
        # 收集关键信息
        search_summary = "\n".join([f"- {item['query']}: {item['results'][:200]}..." 
                                   for item in self.session_data['search_results'][:5]])
        
        retrieval_summary = "\n".join([f"- {item['query']}: {item['results'][:200]}..." 
                                      for item in self.session_data['retrieval_results'][:5]])
        
        conversation_summary = "\n".join([f"**{item['role']}**: {item['content'][:300]}..." 
                                         for item in self.session_data['conversation_history'][:10]])
        
        report_prompt = f"""
基于以下研究系统的完整运行数据，生成一份详细的最终研究报告：

## 研究基本信息：
- 研究主题: {self.session_data['topic']}
- 研究问题: {self.session_data['research_question']}
- 研究时长: {duration}
- 开始时间: {self.session_data['start_time']}
- 结束时间: {self.session_data['end_time']}

## 系统运行统计：
- 执行搜索次数: {total_searches}
- 执行检索次数: {total_retrievals}
- 生成知识图谱数量: {total_kg}
- 对话轮次: {total_conversations}
- 生成文件数量: {len(self.session_data['generated_files'])}

## 搜索结果摘要：
{search_summary}

## 检索结果摘要：
{retrieval_summary}

## 对话历史摘要：
{conversation_summary}

## 生成的文件：
{', '.join(self.session_data['generated_files'])}

请按以下结构生成最终研究报告：

# {self.session_data['topic']} - 研究最终报告

## 1. 执行摘要
- 研究目标和范围
- 主要发现概述
- 系统运行效果评估

## 2. 研究方法和过程
- 数据收集方法
- 检索和分析流程
- 知识图谱构建过程
- 技术工具使用情况

## 3. 详细研究结果
- 核心发现和数据
- 关键信息分析
- 重要观点整理

## 4. 系统性能分析
- RAG检索效果评估
- 知识图谱构建质量
- 对话系统表现
- 数据处理效率

## 5. 结论和建议
- 研究结论总结
- 发现的问题和局限
- 改进建议
- 后续研究方向

## 6. 技术附录
- 系统配置参数
- 生成的文件清单
- 数据来源统计
- 运行日志摘要

请确保报告内容详实、分析深入、结论客观，重点回答研究问题。
"""
        
        try:
            # 创建报告生成智能体
            report_agent = ChatAgent(
                system_message=BaseMessage.make_assistant_message(
                    role_name="研究报告专家",
                    content="你是一个专业的研究分析师和技术系统评估专家，擅长生成详细的研究报告和系统评估报告。"
                ),
                model=self.model
            )
            
            user_msg = BaseMessage.make_user_message(
                role_name="报告请求者", 
                content=report_prompt
            )
            
            response = report_agent.step(user_msg)
            
            # 保存最终报告
            timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
            topic_safe = "".join(c for c in self.session_data['topic'] if c.isalnum() or c in (' ', '-', '_')).rstrip()
            topic_safe = topic_safe.replace(' ', '_')[:50]  # 限制文件名长度
            
            report_filename = f"final_research_report_{topic_safe}_{timestamp}.md"
            
            with open(report_filename, 'w', encoding='utf-8') as f:
                f.write(response.msg.content)
            
            self.session_data['generated_files'].append(report_filename)
            
            print(Fore.GREEN + f"✅ 最终报告已保存: {report_filename}")
            return response.msg.content
            
        except Exception as e:
            error_msg = f"❌ 最终报告生成失败: {e}"
            print(Fore.RED + error_msg)
            return error_msg
    
    def run_enhanced_interactive_research(self):
        """运行增强版交互式研究（含最终报告）"""
        if not self.model or not self.research_system:
            print(Fore.RED + "❌ 系统未正确初始化，无法运行")
            return
        
        print(Fore.CYAN + "🚀 增强版通用AI研究系统（含最终报告）")
        print("="*70)
        
        while True:
            try:
                # 重置会话数据
                self.session_data.update({
                    'start_time': datetime.now().isoformat(),
                    'end_time': None,
                    'topic': '',
                    'research_question': '',
                    'search_results': [],
                    'retrieval_results': [],
                    'knowledge_graphs': [],
                    'conversation_history': [],
                    'generated_files': [],
                    'system_stats': {}
                })
                
                # 获取用户输入
                print(Fore.YELLOW + "\n请输入研究信息:")
                topic = input(Fore.CYAN + "研究主题: ").strip()
                if not topic:
                    break
                
                research_question = input(Fore.CYAN + "具体问题: ").strip()
                if not research_question:
                    research_question = f"关于{topic}的综合信息"
                
                # 记录研究信息
                self.session_data['topic'] = topic
                self.session_data['research_question'] = research_question
                
                print(Fore.BLUE + f"\n📋 开始研究:")
                print(Fore.BLUE + f"   主题: {topic}")
                print(Fore.BLUE + f"   问题: {research_question}")
                print("="*70)
                
                # 创建增强版研究工具和任务
                tools = self.create_enhanced_research_tools(topic)
                task_prompt = self.create_research_task(topic, research_question)
                
                # 创建角色扮演系统
                role_play_session = RolePlaying(
                    assistant_role_name="AI研究助理",
                    user_role_name="研究用户",
                    assistant_agent_kwargs=dict(
                        model=self.model,
                        tools=tools,
                    ),
                    user_agent_kwargs=dict(model=self.model),
                    task_prompt=task_prompt,
                    with_task_specify=False,
                )
                
                # 记录初始对话
                self.log_conversation("系统", f"开始研究: {topic} - {research_question}")
                
                # 执行研究
                print(Fore.GREEN + f"🤖 AI助理已准备就绪")
                print(Fore.BLUE + f"👤 开始研究对话...")
                
                input_msg = role_play_session.init_chat()
                chat_turn_limit = 8
                
                for i in range(chat_turn_limit):
                    print(Fore.MAGENTA + f"\n--- 研究轮次 {i+1} ---")
                    
                    try:
                        assistant_response, user_response = role_play_session.step(input_msg)
                        
                        # 记录对话
                        self.log_conversation("助理", assistant_response.msg.content)
                        self.log_conversation("用户", user_response.msg.content)
                        
                        if assistant_response.terminated or user_response.terminated:
                            print(Fore.GREEN + "✅ 研究任务完成")
                            break
                        
                        # 显示进度
                        print(Fore.CYAN + f"🔄 助理: {assistant_response.msg.content[:200]}...")
                        print(Fore.BLUE + f"🔄 用户: {user_response.msg.content[:200]}...")
                        
                        input_msg = assistant_response.msg
                        time.sleep(1)  # 避免请求过快
                        
                    except Exception as e:
                        print(Fore.RED + f"研究过程出错: {e}")
                        break
                
                # 记录结束时间
                self.session_data['end_time'] = datetime.now().isoformat()
                
                print(Fore.GREEN + "\n" + "="*80)
                print(Fore.GREEN + "✅ 角色扮演研究阶段完成")
                print(Fore.GREEN + "="*80)
                
                # 生成最终报告
                print(Fore.CYAN + "\n🎯 开始生成最终研究报告...")
                print("="*70)
                
                final_report = self.generate_final_research_report()
                
                print(Fore.MAGENTA + "\n" + "="*100)
                print(Fore.MAGENTA + "📊 最终研究报告预览")
                print(Fore.MAGENTA + "="*100)
                print(final_report[:1000] + "..." if len(final_report) > 1000 else final_report)
                print(Fore.MAGENTA + "="*100)
                
                # 显示生成的文件统计
                print(Fore.GREEN + f"\n📁 本次研究共生成 {len(self.session_data['generated_files'])} 个文件:")
                for file in self.session_data['generated_files']:
                    print(Fore.GREEN + f"   📄 {file}")
                
                # 询问是否继续
                print(Fore.YELLOW + "\n" + "="*70)
                continue_research = input(Fore.CYAN + "是否继续新的研究? (y/n): ").strip().lower()
                if continue_research != 'y':
                    break
                    
            except KeyboardInterrupt:
                print(Fore.YELLOW + "\n用户中断研究")
                break
            except Exception as e:
                print(Fore.RED + f"系统错误: {e}")
                continue
        
        print(Fore.GREEN + "\n👋 感谢使用增强版通用AI研究系统！")

def main():
    """主函数"""
    print(Fore.CYAN + "🎯 增强版通用AI研究系统启动（含最终报告）")
    print("="*60)
    
    try:
        enhanced_system = EnhancedInteractiveResearchSystem()
        enhanced_system.run_enhanced_interactive_research()
    except Exception as e:
        print(Fore.RED + f"❌ 系统启动失败: {e}")
        print(Fore.YELLOW + "💡 请检查配置和依赖项")

if __name__ == "__main__":
    main()

分支代码2：【RAG_WEB_TOPIC.py】

import os
import time
import json
import logging
from typing import List, Dict, Optional
from dataclasses import dataclass
from pathlib import Path
import agentops
import requests
from colorama import Fore, init
from bs4 import BeautifulSoup
from camel.loaders import Firecrawl, UnstructuredIO
from camel.retrievers import AutoRetriever
from camel.toolkits import FunctionTool, SearchToolkit
from camel.types import ModelPlatformType, StorageType
from camel.embeddings import SentenceTransformerEncoder
from camel.models import ModelFactory
from camel.societies import RolePlaying
from camel.utils import print_text_animated
from camel.storages import Neo4jGraph
from camel.agents import KnowledgeGraphAgent
from dotenv import load_dotenv

# 加载环境变量
load_dotenv()

# 初始化 colorama
init(autoreset=True)

@dataclass
class ResearchConfig:
    """研究系统配置类"""
    # API配置 - 直接配置所有必要密钥
    agentops_api_key: str = "3e6edf79-2c28-400f-8433-cf4fa764444d"
    firecrawl_api_key: str = "fc-58764a3cc0184450b220d2dd1ca687c2"
    modelscope_api_key: str = "64af0689-2660-4285-99ff-270e4c7416a3"
    
    # Neo4j配置
    neo4j_url: str = "bolt://localhost:7687"
    neo4j_username: str = "neo4j"
    neo4j_password: str = "tyy20060315"
    
    # 模型配置
    model_platform: str = "openai_compatible"
    model_name: str = "Qwen/Qwen2.5-72B-Instruct"
    model_url: str = "https://api-inference.modelscope.cn/v1/"
    
    # 存储配置
    vector_storage_path: str = "research_data"
    storage_type: str = "qdrant"
    
    # 搜索配置
    max_search_results: int = 10
    max_urls_to_process: int = 5
    similarity_threshold: float = 0.3

class ConfigManager:
    """配置管理器 - 安全地处理敏感信息"""
    
    def __init__(self, config_file: str = "config.json"):
        self.config_file = Path(config_file)
        self.config = ResearchConfig()
        self._load_config()
    
    def _load_config(self):
        """从配置文件和环境变量加载配置"""
        # 直接使用配置的API密钥，如果环境变量存在则优先使用环境变量
        self.config.agentops_api_key = os.getenv("AGENTOPS_API_KEY", self.config.agentops_api_key)
        self.config.firecrawl_api_key = os.getenv("FIRECRAWL_API_KEY", self.config.firecrawl_api_key)
        self.config.modelscope_api_key = os.getenv("MODELSCOPE_SDK_TOKEN", self.config.modelscope_api_key)
        self.config.neo4j_password = os.getenv("NEO4J_PASSWORD", self.config.neo4j_password)
        
        # 设置环境变量以供其他组件使用
        os.environ["AGENTOPS_API_KEY"] = self.config.agentops_api_key
        os.environ["FIRECRAWL_API_KEY"] = self.config.firecrawl_api_key
        os.environ["MODELSCOPE_SDK_TOKEN"] = self.config.modelscope_api_key
        
        # 从配置文件加载非敏感配置
        if self.config_file.exists():
            try:
                with open(self.config_file, 'r', encoding='utf-8') as f:
                    file_config = json.load(f)
                
                # 更新非敏感配置
                for key, value in file_config.items():
                    if not key.endswith('_key') and not key.endswith('_password'):
                        if hasattr(self.config, key):
                            setattr(self.config, key, value)
                            
            except Exception as e:
                logging.warning(f"配置文件加载失败: {e}")
    
    def create_sample_config(self):
        """创建示例配置文件"""
        sample_config = {
            "neo4j_url": "bolt://localhost:7687",
            "neo4j_username": "neo4j",
            "model_name": "Qwen/Qwen2.5-72B-Instruct",
            "model_url": "https://api-inference.modelscope.cn/v1/",
            "vector_storage_path": "research_data",
            "max_search_results": 10,
            "max_urls_to_process": 5,
            "similarity_threshold": 0.3
        }
        
        with open(self.config_file, 'w', encoding='utf-8') as f:
            json.dump(sample_config, f, indent=2, ensure_ascii=False)
        
        print(Fore.YELLOW + f"已创建示例配置文件: {self.config_file}")
    
    def display_config_status(self):
        """显示配置状态"""
        print(Fore.CYAN + "\n🔧 系统配置状态:")
        print("="*50)
        
        # API密钥状态
        print(Fore.BLUE + "📋 API密钥配置:")
        api_keys = [
            ("AgentOps", self.config.agentops_api_key),
            ("Firecrawl", self.config.firecrawl_api_key),
            ("ModelScope", self.config.modelscope_api_key),
        ]
        
        for name, key in api_keys:
            if key:
                masked_key = key[:8] + "..." + key[-4:] if len(key) > 12 else "***"
                print(Fore.GREEN + f"  ✅ {name}: {masked_key}")
            else:
                print(Fore.RED + f"  ❌ {name}: 未配置")
        
        # Neo4j配置状态
        print(Fore.BLUE + "\n🗄️ Neo4j配置:")
        print(Fore.BLUE + f"  URL: {self.config.neo4j_url}")
        print(Fore.BLUE + f"  用户名: {self.config.neo4j_username}")
        if self.config.neo4j_password:
            print(Fore.GREEN + f"  ✅ 密码: {'*' * len(self.config.neo4j_password)}")
        else:
            print(Fore.RED + f"  ❌ 密码: 未配置")
        
        print("="*50)
    
    def test_api_connections(self):
        """测试API连接"""
        print(Fore.CYAN + "\n🔗 测试API连接:")
        print("="*40)
        
        # 测试Firecrawl API
        if self.config.firecrawl_api_key:
            try:
                from camel.loaders import Firecrawl
                firecrawl = Firecrawl()
                print(Fore.GREEN + "✅ Firecrawl API: 连接正常")
            except Exception as e:
                print(Fore.RED + f"❌ Firecrawl API: {str(e)[:50]}...")
        
        # 测试ModelScope API
        if self.config.modelscope_api_key:
            try:
                model = ModelFactory.create(
                    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
                    model_type=self.config.model_name,
                    url=self.config.model_url,
                    api_key=self.config.modelscope_api_key
                )
                print(Fore.GREEN + "✅ ModelScope API: 连接正常")
            except Exception as e:
                print(Fore.RED + f"❌ ModelScope API: {str(e)[:50]}...")
        
        print("="*40)

class SearchEngine:
    """统一的搜索引擎类"""
    
    def __init__(self, config: ResearchConfig):
        self.config = config
        self.search_toolkit = SearchToolkit()
    
    def duckduckgo_lite_search(self, query: str, max_results: int = None) -> List[Dict]:
        """使用DuckDuckGo Lite API进行搜索"""
        if max_results is None:
            max_results = self.config.max_search_results
            
        url = f"https://lite.duckduckgo.com/lite/?q={query.replace(' ', '+')}"
        headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
        }
        
        try:
            resp = requests.get(url, headers=headers, timeout=10)
            resp.raise_for_status()
            soup = BeautifulSoup(resp.text, "html.parser")
            
            results = []
            for link in soup.select("a[href*='http']")[:max_results]:
                href = link.get("href", "")
                text = link.get_text(strip=True)
                
                if href and text and len(text) > 10:
                    results.append({
                        "title": text[:100],
                        "url": href,
                        "snippet": text[:200]
                    })
            
            return results
        except Exception as e:
            logging.error(f"DuckDuckGo Lite搜索失败: {e}")
            return []
    
    def search_web(self, query: str, topic: str = "") -> str:
        """通用网络搜索功能"""
        search_query = f"{query} {topic}".strip()
        print(Fore.BLUE + f"🔍 网络搜索: {search_query}")
        
        try:
            # 首先尝试DuckDuckGo Lite搜索
            print(Fore.CYAN + "🔄 使用 DuckDuckGo Lite 搜索...")
            search_results = self.duckduckgo_lite_search(search_query)
            
            if search_results:
                formatted_results = f"🔍 搜索查询: {search_query}\n\n"
                formatted_results += "🌐 搜索结果:\n"
                formatted_results += "="*50 + "\n"
                
                urls_found = []
                for i, result in enumerate(search_results, 1):
                    title = result.get('title', '无标题')
                    url = result.get('url', '无链接')
                    snippet = result.get('snippet', '无描述')
                    
                    formatted_results += f"{i}. 📰 {title}\n"
                    formatted_results += f"   📝 {snippet}\n"
                    formatted_results += f"   🔗 {url}\n\n"
                    
                    if url != '无链接':
                        urls_found.append(url)
                
                if urls_found:
                    formatted_results += "\n📎 发现的相关URL:\n"
                    for url in urls_found[:self.config.max_urls_to_process]:
                        formatted_results += f"- {url}\n"
                
                print(Fore.GREEN + f"✅ 搜索完成，找到 {len(search_results)} 个结果")
                return formatted_results
            else:
                raise Exception("DuckDuckGo Lite 未返回结果")
                
        except Exception as e:
            print(Fore.YELLOW + f"⚠️ 主搜索方法失败: {str(e)[:50]}...")
            
            # 备用搜索方法
            try:
                print(Fore.BLUE + "🔄 尝试备用搜索方法...")
                search_results = self.search_toolkit.search_duckduckgo(search_query)
                
                formatted_results = f"🔍 搜索查询: {search_query}\n\n"
                formatted_results += "🌐 搜索结果 (备用方法):\n"
                formatted_results += "="*50 + "\n"
                
                if isinstance(search_results, list):
                    for i, result in enumerate(search_results[:self.config.max_search_results], 1):
                        if isinstance(result, dict):
                            title = result.get('title', '无标题')
                            snippet = result.get('snippet', '无描述')
                            link = result.get('link', '无链接')
                            formatted_results += f"{i}. {title}\n   {snippet}\n   链接: {link}\n\n"
                        else:
                            formatted_results += f"{i}. {str(result)[:200]}...\n\n"
                
                return formatted_results
                
            except Exception as backup_e:
                error_msg = f"所有搜索方法都失败了: {str(backup_e)[:100]}..."
                print(Fore.RED + error_msg)
                return f"搜索查询: {search_query}\n\n搜索服务暂时不可用，请稍后重试。"

class UniversalResearchSystem:
    """通用研究系统"""
    
    def __init__(self, config_manager: ConfigManager):
        self.config = config_manager.config
        self._init_components()
    
    def _init_components(self):
        """初始化系统组件"""
        # 基础组件
        self.firecrawl = Firecrawl()
        self.auto_retriever = AutoRetriever(
            vector_storage_local_path=self.config.vector_storage_path,
            storage_type=StorageType.QDRANT,
            embedding_model=SentenceTransformerEncoder(),
        )
        self.search_engine = SearchEngine(self.config)
        self.uio = UnstructuredIO()
        
        # 知识图谱组件
        self.neo4j_graph = None
        self.kg_agent = None
        self._init_knowledge_graph()
    
    def _init_knowledge_graph(self):
        """初始化知识图谱组件"""
        if not self.config.neo4j_password:
            print(Fore.YELLOW + "⚠️ Neo4j密码未配置，将使用文本格式知识图谱")
            return
            
        try:
            print(Fore.BLUE + "🔗 尝试连接Neo4j数据库...")
            
            import neo4j
            driver = neo4j.GraphDatabase.driver(
                self.config.neo4j_url,
                auth=(self.config.neo4j_username, self.config.neo4j_password)
            )
            
            # 验证连接
            with driver.session() as session:
                result = session.run("RETURN 1 as test")
                test_value = result.single()["test"]
                if test_value == 1:
                    print(Fore.GREEN + "✅ Neo4j连接测试成功")
            
            driver.close()
            
            # 初始化CAMEL的Neo4j组件
            self.neo4j_graph = Neo4jGraph(
                url=self.config.neo4j_url,
                username=self.config.neo4j_username,
                password=self.config.neo4j_password,
            )
            
            # 需要模型才能初始化KG Agent
            if hasattr(self, 'model') and self.model:
                self.kg_agent = KnowledgeGraphAgent(model=self.model)
                print(Fore.GREEN + "✅ 知识图谱组件初始化成功")
            
        except ImportError:
            print(Fore.RED + "❌ neo4j驱动未安装，请运行: pip install neo4j")
        except Exception as e:
            print(Fore.RED + f"❌ Neo4j连接失败: {e}")
            print(Fore.YELLOW + "💡 将使用文本格式知识图谱")

class ResearchToolkit:
    """研究工具包"""
    
    def __init__(self, research_system: UniversalResearchSystem):
        self.system = research_system
    
    def retrieve_information_from_urls(self, urls: List[str], query: str) -> str:
        """从URL列表中检索相关信息"""
        print(Fore.BLUE + f"开始检索: {query}")
        print(Fore.BLUE + f"数据源: {len(urls)} 个URL")
        
        aggregated_content = ''
        
        # 限制处理的URL数量
        urls_to_process = urls[:self.system.config.max_urls_to_process]
        
        for i, url in enumerate(urls_to_process, 1):
            try:
                print(Fore.CYAN + f"抓取 {i}/{len(urls_to_process)}: {url}")
                scraped_content = self.system.firecrawl.scrape(url)
                aggregated_content += scraped_content["markdown"] + "\n\n"
                print(Fore.GREEN + f"成功抓取 {len(scraped_content['markdown'])} 字符")
            except Exception as e:
                print(Fore.RED + f"抓取失败: {str(e)[:100]}...")
                continue
        
        if not aggregated_content.strip():
            return "所有 URL 都抓取失败，无法继续处理"
        
        try:
            retrieved_info = self.system.auto_retriever.run_vector_retriever(
                query=query,
                contents=aggregated_content,
                top_k=5,
                similarity_threshold=self.system.config.similarity_threshold,
            )
            
            result = f"检索查询: {retrieved_info['Original Query']}\n\n"
            result += "相关信息:\n"
            for i, context in enumerate(retrieved_info['Retrieved Context'], 1):
                result += f"{i}. {context[:300]}...\n\n"
            
            return result
            
        except Exception as e:
            return f"检索失败: {e}"
    
    def search_web_for_topic(self, query: str, topic: str = "") -> str:
        """根据主题搜索网络信息"""
        return self.system.search_engine.search_web(query, topic)
    
    def build_knowledge_graph(self, text_input: str, topic: str = "") -> str:
        """构建知识图谱"""
        if not self.system.neo4j_graph or not self.system.kg_agent:
            print(Fore.YELLOW + "Neo4j未配置，创建文本格式知识图谱...")
            
            kg_result = f"知识图谱（文本格式） - 主题: {topic}\n"
            kg_result += "="*50 + "\n\n"
            
            # 简单的实体提取逻辑
            lines = text_input.split('\n')
            entities = []
            relationships = []
            
            for line in lines:
                if len(line.strip()) > 10:  # 过滤短行
                    words = line.split()
                    if len(words) > 3:  # 寻找可能的实体
                        for word in words:
                            if len(word) > 4 and word.isalpha():
                                entities.append(word)
            
            # 去重并限制数量
            entities = list(set(entities))[:10]
            
            kg_result += "主要实体:\n"
            for entity in entities:
                kg_result += f"- {entity}\n"
            
            kg_result += f"\n关系网络:\n"
            kg_result += f"- 主题: {topic}\n"
            kg_result += f"- 相关实体数量: {len(entities)}\n"
            kg_result += f"- 文本长度: {len(text_input)} 字符\n"
            
            return kg_result
        
        print(Fore.BLUE + f"开始构建知识图谱 - 主题: {topic}")
        
        try:
            element_example = self.system.uio.create_element_from_text(
                text=text_input,
                element_id=f"research_{topic}_{int(time.time())}"
            )
            
            graph_elements = self.system.kg_agent.run(element_example, parse_graph_elements=True)
            self.system.neo4j_graph.add_graph_elements(graph_elements=[graph_elements])
            
            print(Fore.GREEN + "知识图谱构建完成")
            return f"知识图谱构建成功 - 主题: {topic}\n提取了图形元素: {str(graph_elements)[:200]}..."
            
        except Exception as e:
            error_msg = f"知识图谱构建失败: {e}"
            print(Fore.RED + error_msg)
            return error_msg

class InteractiveResearchSystem:
    """交互式研究系统"""
    
    def __init__(self):
        self.config_manager = ConfigManager()
        self.model = None
        self.research_system = None
        self.toolkit = None
        self._init_system()
    
    def _init_system(self):
        """初始化系统"""
        # 显示配置状态
        self.config_manager.display_config_status()
        
        # 测试API连接
        self.config_manager.test_api_connections()
        
        # 检查配置
        if not self._check_config():
            return
        
        # 初始化模型
        if not self._init_model():
            return
        
        # 初始化研究系统
        self.research_system = UniversalResearchSystem(self.config_manager)
        self.research_system.model = self.model  # 为知识图谱组件提供模型
        
        # 重新初始化知识图谱（现在有模型了）
        if self.research_system.neo4j_graph and not self.research_system.kg_agent:
            try:
                self.research_system.kg_agent = KnowledgeGraphAgent(model=self.model)
                print(Fore.GREEN + "✅ 知识图谱代理初始化成功")
            except Exception as e:
                print(Fore.YELLOW + f"知识图谱代理初始化失败: {e}")
        
        self.toolkit = ResearchToolkit(self.research_system)
        
        # 初始化AgentOps
        if self.config_manager.config.agentops_api_key:
            try:
                agentops.init(
                    api_key=self.config_manager.config.agentops_api_key,
                    default_tags=["Universal Research", "Interactive"]
                )
                print(Fore.GREEN + "✅ AgentOps初始化成功")
            except Exception as e:
                print(Fore.YELLOW + f"AgentOps初始化失败: {e}")
    
    def _check_config(self) -> bool:
        """检查配置完整性"""
        missing_configs = []
        
        if not self.config_manager.config.modelscope_api_key:
            missing_configs.append("MODELSCOPE_SDK_TOKEN")
        
        if missing_configs:
            print(Fore.RED + "❌ 缺少必要的环境变量配置:")
            for config in missing_configs:
                print(Fore.RED + f"   {config}")
            
            if not self.config_manager.config_file.exists():
                print(Fore.BLUE + "\n📝 创建示例配置文件...")
                self.config_manager.create_sample_config()
            
            return False
        
        return True
    
    def _init_model(self) -> bool:
        """初始化模型"""
        try:
            self.model = ModelFactory.create(
                model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
                model_type=self.config_manager.config.model_name,
                url=self.config_manager.config.model_url,
                api_key=self.config_manager.config.modelscope_api_key
            )
            print(Fore.GREEN + f"✅ 模型初始化成功: {self.config_manager.config.model_name}")
            return True
        except Exception as e:
            print(Fore.RED + f"❌ 模型初始化失败: {e}")
            return False
    
    def create_research_tools(self, topic: str) -> List[FunctionTool]:
        """为特定主题创建研究工具"""
        
        def retrieve_urls_for_topic(urls: List[str], query: str) -> str:
            return self.toolkit.retrieve_information_from_urls(urls, query)
        
        def search_topic_info(query: str) -> str:
            return self.toolkit.search_web_for_topic(query, topic)
        
        def build_topic_knowledge_graph(text_input: str) -> str:
            return self.toolkit.build_knowledge_graph(text_input, topic)
        
        return [
            FunctionTool(retrieve_urls_for_topic),
            FunctionTool(search_topic_info),
            FunctionTool(build_topic_knowledge_graph),
        ]
    
    def create_research_task(self, topic: str, research_question: str) -> str:
        """创建研究任务提示"""
        return f"""
对"{topic}"进行全面研究，专门回答以下问题："{research_question}"

请按照以下步骤进行系统性研究：

1. **信息搜索阶段**
   - 使用搜索工具获取与"{topic}"和"{research_question}"相关的URL和基础信息
   - 识别最相关和权威的信息源

2. **深度检索阶段**
   - 使用检索工具从找到的URL中获取详细内容
   - 重点关注能够回答研究问题的信息

3. **分析整理阶段**
   - 系统分析所有收集到的信息
   - 识别关键事实、数据和观点
   - 评估信息的可靠性和相关性

4. **报告撰写阶段**
   - 撰写一份全面的研究报告
   - 确保报告直接回答了研究问题
   - 提供具体的事实支撑和数据引用

5. **知识图谱构建阶段**
   - 使用知识图谱工具为报告内容构建结构化的知识图谱
   - 展示关键概念之间的关系

研究重点：
- 主题: {topic}
- 核心问题: {research_question}
- 确保信息的准确性和时效性
- 提供多角度的分析视角
- 包含具体的案例和数据支撑

请系统性地完成上述研究任务，提供高质量的研究成果。
"""
    
    def run_interactive_research(self):
        """运行交互式研究"""
        if not self.model or not self.research_system:
            print(Fore.RED + "❌ 系统未正确初始化，无法运行")
            return
        
        print(Fore.CYAN + "🚀 通用AI研究系统")
        print("="*60)
        
        while True:
            try:
                # 获取用户输入
                print(Fore.YELLOW + "\n请输入研究信息:")
                topic = input(Fore.CYAN + "研究主题: ").strip()
                if not topic:
                    break
                
                research_question = input(Fore.CYAN + "具体问题: ").strip()
                if not research_question:
                    research_question = f"关于{topic}的综合信息"
                
                print(Fore.BLUE + f"\n📋 开始研究:")
                print(Fore.BLUE + f"   主题: {topic}")
                print(Fore.BLUE + f"   问题: {research_question}")
                print("="*60)
                
                # 创建研究工具和任务
                tools = self.create_research_tools(topic)
                task_prompt = self.create_research_task(topic, research_question)
                
                # 创建角色扮演系统
                role_play_session = RolePlaying(
                    assistant_role_name="AI研究助理",
                    user_role_name="研究用户",
                    assistant_agent_kwargs=dict(
                        model=self.model,
                        tools=tools,
                    ),
                    user_agent_kwargs=dict(model=self.model),
                    task_prompt=task_prompt,
                    with_task_specify=False,
                )
                
                # 执行研究
                print(Fore.GREEN + f"🤖 AI助理: {role_play_session.assistant_sys_msg.content[:100]}...")
                print(Fore.BLUE + f"👤 用户: {role_play_session.user_sys_msg.content[:100]}...")
                
                input_msg = role_play_session.init_chat()
                chat_turn_limit = 8
                
                for i in range(chat_turn_limit):
                    print(Fore.MAGENTA + f"\n--- 研究轮次 {i+1} ---")
                    
                    try:
                        assistant_response, user_response = role_play_session.step(input_msg)
                        
                        if assistant_response.terminated or user_response.terminated:
                            print(Fore.GREEN + "✅ 研究任务完成")
                            break
                        
                        # 显示进度
                        print(Fore.CYAN + f"🔄 助理: {assistant_response.msg.content[:200]}...")
                        print(Fore.BLUE + f"🔄 用户: {user_response.msg.content[:200]}...")
                        
                        input_msg = assistant_response.msg
                        time.sleep(1)  # 避免请求过快
                        
                    except Exception as e:
                        print(Fore.RED + f"研究过程出错: {e}")
                        break
                
                # 询问是否继续
                print(Fore.YELLOW + "\n" + "="*60)
                continue_research = input(Fore.CYAN + "是否继续新的研究? (y/n): ").strip().lower()
                if continue_research != 'y':
                    break
                    
            except KeyboardInterrupt:
                print(Fore.YELLOW + "\n用户中断研究")
                break
            except Exception as e:
                print(Fore.RED + f"系统错误: {e}")
                continue
        
        print(Fore.GREEN + "\n👋 感谢使用通用AI研究系统！")

def main():
    """主函数"""
    print(Fore.CYAN + "🎯 通用AI研究系统启动")
    print("="*50)
    
    try:
        research_system = InteractiveResearchSystem()
        research_system.run_interactive_research()
    except Exception as e:
        print(Fore.RED + f"❌ 系统启动失败: {e}")
        print(Fore.YELLOW + "💡 请检查配置和依赖项")

if __name__ == "__main__":
    main()

我们运行一下整个系统，分别测试一下各个检索功能的差异：

PS G:\Python-Camel-project> & D:/Download/Python/py-3.11.9/python.exe g:/Python-Camel-project/Multimodal_RAG/Interactive_Multimodal_RAG.py
W0725 14:45:52.142000 34656 site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.   
Web research system available
初始化交互式多模态RAG系统...
Initializing Simple RAG System with CAMEL...
CAMEL LLM initialized: Qwen/Qwen2.5-72B-Instruct
API key: 64af0689-2...16a3
√ Embedding model loaded: intfloat/e5-large-v2
√ Simple vector retriever initialized
√ Simple RAG System initialized successfully!
√ 集成CAMEL的RAG系统初始化成功

🔧 系统配置状态:
==================================================
📋 API密钥配置:
  ✅ AgentOps: 3e6edf79...444d
  ✅ Firecrawl: fc-58764...87c2
  ✅ ModelScope: 64af0689...16a3

🗄️ Neo4j配置:
  URL: bolt://localhost:7687
  用户名: neo4j
  ✅ 密码: ***********
==================================================

🔗 测试API连接:
========================================
✅ Firecrawl API: 连接正常
✅ ModelScope API: 连接正常
========================================
✅ 模型初始化成功: Qwen/Qwen2.5-72B-Instruct
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_linkup'. The parameter definition is {'enum': ['searchResults', 'sourcedAnswer', 'structured'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'enum': ['OneDay', 'OneWeek', 'OneMonth', 'OneYear', 'NoLimit'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'anyOf': [{'enum': ['finance', 'law', 'medical', 'internet', 'tax', 'news_province', 'news_center'], 'type': 'string'}, {'type': 'null'}], 'type': ['null']}. This may affect the quality of tool calling.
  warnings.warn(
🔗 尝试连接Neo4j数据库...
✅ Neo4j连接测试成功
✅ 知识图谱代理初始化成功
🖇 AgentOps:  WARNING: agentops is out of date. Please update with the command: 'pip install --upgrade agentops'
🖇 AgentOps: Session Replay: https://app.agentops.ai/drilldown?session_id=1daa3df4-89ba-4a7a-a1f9-991c342edb8b
✅ AgentOps初始化成功
√ 网页研究系统初始化成功

交互式多模态RAG系统
============================================================
功能特性:
- 支持在线/本地PDF加载
- 三种检索模式
- 网页爬取集成
- 多模态内容处理
============================================================

PDF知识库设置
==================================================
1. 在线PDF (输入URL)
2. 本地PDF (输入文件路径)
3. 使用默认示例PDF

请选择PDF来源 (1-3): 2
请输入PDF文件路径: G:\Program for work\Other\CamelAgent.pdf  
状态查询： 正在加载本地PDF: G:\Program for work\Other\CamelAgent.pdf
Loading PDF from: G:\Program for work\Other\CamelAgent.pdf
√ PDF loaded successfully
Computing embeddings for 1839 documents...
Added 1839 documents to retriever
√ Knowledge base setup complete: 1839 elements
 Content: 1839 text, 0 images, 0 tables
√ PDF知识库加载成功！

当前知识库: 本地PDF: G:\Program for work\Other\CamelAgent.pdf
🔧 可用检索方法: Vector, Enhanced

============================================================
查询选项
============================================================

我们可以看到系统启动成功，本地PDF文件也成功加载了，现在我们先进行快速检索的演示:

请输入您的问题 (输入 'quit' 退出, 'reload' 重新加载PDF): camel agent框架具备有什么特性？可以调用哪些工具？

选择检索模式:
1. 快速检索 (基础向量检索)
2. 深度检索 (重写+HyDE+RRF)
3. 主题检索 (PDF+网页爬取)
请选择模式 (1-3): 1

执行查询: camel agent框架具备有什么特性？可以调用哪些工具？
检索模式: 快速检索

执行快速检索...
========================================
正在进行向量检索...
Retrieved 3 documents
√ 检索到 3 个相关文档
文档 1 (相似度: 0.910):
   结语 恭喜您！在阅读到这里时，您已经掌握了 CAMEL-AI 应用开发框架的基础知识，并能够利 用 Agent 实例在您的代码逻辑中执行复杂的任务。此外，您还可以尝试将 Agent 实例整合 到更复杂的工作流中，或实现 Agent 实例之间的协同工作。

文档 2 (相似度: 0.910):
   为什么选择 CAMEL Multi-Agent？ 选择 CAMEL Multi-Agent 框架，你将获得以下优势：   

文档 3 (相似度: 0.902):
   Model 是 Agent 的大脑，负责处理所有输入和输出数据。通过有效调用不同的模型，智能  体可以根据任务需求执行文本分析、图像识别和复杂推理等操作。CAMEL 提供了一系列标      

正在生成答案...
Generating response with CAMEL model...
CAMEL generation failed, using fallback: 'BaseMessage' object has no attribute 'get'...
API调用 1/3...
√ API调用成功
√ 快速检索完成

==================== 快速检索结果 ====================
原结始查询: camel agent框架具备有什么特性？可以调用哪些工具？
检索方法: Quick Vector Retrieval

检索到的文档 (共3个):

文档 1:
相关度分数: 0.9104779362678528
内容预览: 结语 恭喜您！在阅读到这里时，您已经掌握了 CAMEL-AI 应用开发框架的基础知识 ，并能够利 用 Agent 实例在您的代码逻辑中执行复杂的任务。此外，您还可以尝试将 Agent  实例整合 到更复杂的工作流中，或实现 Agent 实例之间的协同工作。

文档 2:
相关度分数: 0.9104548692703247
内容预览: 为什么选择 CAMEL Multi-Agent？ 选择 CAMEL Multi-Agent 框架，你将获得以下优势：

文档 3:
相关度分数: 0.9016962051391602
内容预览: Model 是 Agent 的大脑，负责处理所有输入和输出数据。通过有效调用不同的模型 ，智能 体可以根据任务需求执行文本分析、图像识别和复杂推理等操作。CAMEL 提供了一系列 标

💡 生成答案:
CAMEL Agent框架的特性包括：

1. **多智能体协作**：支持多个Agent实例之间的协同工作，以完成更复杂的任务。
2. **灵活的任务处理能力**：通过Model（智能体的大脑）处理所有输入和输出数据，能够根据任务需求执行多种操作。

可以调用的工具包括：

- **文本分析**：处理和理解文本数据。
- **图像识别**：识别和分析图像内容。
- **复杂推理**：进行复杂的逻辑推理和决策。
============================================================

询问：是否保存结果到文件？(y/n): n

是否继续查询？(y/n): y

============================================================
查询选项
============================================================

接着我们测试深度检索的效果

请输入您的问题 (输入 'quit' 退出, 'reload' 重新加载PDF): camel agent框架具备有什么特性？可以调用哪些工具？

选择检索模式:
1. 快速检索 (基础向量检索)
2. 深度检索 (重写+HyDE+RRF)
3. 主题检索 (PDF+网页爬取)
请选择模式 (1-3): 2

执行查询: camel agent框架具备有什么特性？可以调用哪些工具？
检索模式: 深度检索

执行深度检索...
============================================================
开始执行深度RAG查询
============================================================

步骤1: 查询重写
------------------------------
原始查询: camel agent框架具备有什么特性？可以调用哪些工具？
Generating response with CAMEL model...
CAMEL generation failed, using fallback: 'BaseMessage' object has no attribute 'get'...
API调用 1/3...
√ API调用成功
Query rewritten: camel agent框架具备有什么特性？可以调用哪些工具？ -> Camel Agent框 架的具体特性和可调用的工具有哪些？...
重写查询: Camel Agent框架的具体特性和可调用的工具有哪些？

步骤2: 文档检索
------------------------------
使用HyDE+RRF组合方法进行检索...
使用RRF算法进行混合检索（HyDE增强向量检索）...
执行HyDE增强向量检索...
Generating response with CAMEL model...
CAMEL generation failed, using fallback: 'BaseMessage' object has no attribute 'get'...
API调用 1/3...
√ API调用成功
📝 HyDE document generated: 633 characters
生成的假设文档:
在分布式计算领域，Camel Agent框架因其灵活性和强大的扩展性而受到广泛关注。该框架设计 用于支持复杂环境下的任务调度与资源管理，尤其适用于异构系统中。Camel Agent框架的核心 特性包括但不限于：

1. **模块化架构**：Camel Agent采用高度模块化的架构设计，允许开发者根据具体需求灵活选择和组合不同的组件。这种设计不仅简化了开发流程，还极大地提高了系统的可维护性和可扩展性。

2. **丰富的插件支持**：框架内置了多种插件，涵盖了从数据处理到通信协议转换等多个方面 。例如，提供了RESTful API、AMQP (Advanced Message Queuing Protocol) 等多种消息传递机制的支持，以及对JSON、XML等数据格式的解析能力。此外，Camel Agent还支持自定义插件的开发，以满足特定应用场景的需求。

3. **强大的路由与转换功能**：利用Apache Camel的核心优势，Camel Agent能够实现复杂的消息路由和转换逻辑。通过定义EIPs (Enterprise Integration Patterns)，可以轻松构建高效的数据流处理管道，支持同步/异步调用、错误处理及重试机制等高级特性。

4. **动态配置与热更新**：Camel Agent支持运行时动态调整配置参数，无需重启服务即可生效，极大提升了运维效率。同时，它也具备热部署能力，允许在不停机的情况下更新应用逻辑或添加新功能
Retrieved 5 documents
✓ HyDE向量检索完成，获得 5 个结果
Retrieved 0 documents
✓ 图像检索完成，获得 0 个结果
Retrieved 0 documents
✓ 表格检索完成，获得 0 个结果
执行BM25检索（使用原始查询）...
Retrieved 5 documents
✓ BM25检索成功，获得 5 个结果
使用RRF算法融合检索结果...
RRF融合完成，共处理 10 个唯一文档，返回前 5 个结果
HyDE+RRF检索完成，返回 10 个文档
文档 1 (RRF分数: 0.9160):
结语 恭喜您！在阅读到这里时，您已经掌握了 CAMEL-AI 应用开发框架的基础知识，并能够利 用 Agent 实例在您的代码逻辑中执行复杂的任务。此外，您还可以尝试将 Agent 实例整合 到 更复杂的工作流中，或实现 Agent 实例之间的协同工作。

文档 2 (RRF分数: 0.9094):
想象一下，如果没有统一的语言和行为规范，来自不同公司或者基于不同技术背景开发的 AI Agent 就很难顺畅地合作。这会限制 AI Agent 网络的扩展，最终也会限制它们解决更复杂 现实 问题的能力。这种情况有点像互联网早期，各个计算机系统互不兼容，连接非常受限， 导致整 个网络发展缓慢。 一个统一的通信协议不仅仅能解决眼前的互操作问题，更有可能 催生出一个由无数智能体连接而成的巨大网络。在这个网络...

文档 3 (RRF分数: 0.9136):
评审者 Agent 的 评审标准。如果

文档 4 (RRF分数: 0.9050):
除了能把工具包转换成 MCP 服务器外，CAMEL 框架还支持一个更强大的功能：把整个 CAMEL 代理（Agent）本身也作为 MCP 服务器发布出去。这意味着，一个你精心配置好的 CAMEL 代理—— 它可能拥有特定的 AI 模型、独特的系统指令（system message），甚至内 置了一些其他的工 具——现在可以作为一个独立的服务运行。然后，任何支持 MCP 协议的 客户端（比如像 Anth...

文档 5 (RRF分数: 0.9120):
Model 是 Agent 的大脑，负责处理所有输入和输出数据。通过有效调用不同的模型，智能 体可以根据任务需求执行文本分析、图像识别和复杂推理等操作。CAMEL 提供了一系列标

步骤3: 答案生成
------------------------------

正在生成最终答案...
Generating response with CAMEL model...
CAMEL generation failed, using fallback: 'BaseMessage' object has no attribute 'get'...
API调用 1/3...
√ API调用成功
√ 答案生成成功
最终答案:
### CAMEL Agent框架的特性及可调用工具

#### 特性

1. **标准化协议支持**：
   - CAMEL Agent框架支持多种标准化协议，特别是模型上下文协议（MCP）、Agent间协议（A2A）和Agent网络协议（ANP）。这些协议确保了不同AI Agent之间的互操作性和高效协作（文档 内容：“这些协议为解决 AI Agent 在理解上下文、使用工具和相互协作方面的难题提供了有效 的思路。”）。

2. **高度可扩展性**：
   - CAMEL框架允许开发者将自定义的工具和服务转换成MCP服务，使得这些工具和服务可以被 其他支持MCP协议的客户端识别和使用（文档内容：“除了能把工具包转换成 MCP 服务器外，CAMEL 框架还支持一个更强大的功能：把整个 CAMEL 代理（Agent）本身也作为 MCP 服务器发布出去。”）。

3. **复杂的多代理交互**：
   - CAMEL框架内置了多代理角色扮演（RolePlaying）模块和“工作组”（Workforce）模块，这些模块可以实现多个代理之间的协同工作，形成复杂的交互场景（文档内容：“其内部一些更复 杂的模块，比如用于实现多代理角色扮演（RolePlaying）的模块，或者用于组织多个代理协同 工作的‘工作组’（Workforce）模块，也计划或者正在被实现为 MCP 服务器。”）。

4. **代码即提示（Code-as-Prompt）**：
   - CAMEL框架强调编写既清晰易懂又可被AI代理准确理解的代码，这一设计理念有助于提高集成的质量和稳定性（文档内容：“CAMEL 框架中有一个核心的设计哲学叫做‘代码即提示’（Code-as-Prompt）。它强调编写既清晰易懂（对人类开发者而言）又能被 AI 代理准确理解的代码。”）。

#### 可调用的工具

1. **文本分析工具**：
   - CAMEL Agent框架支持调用文本分析工具，这些工具可以帮助Agent执行文本分类、情感分 析、关键词提取等任务（文档内容：“通过有效调用不同的模型，智能体可以根据任务需求执行 文本分析、图像识别和复杂推理等操作。”）。

2. **图像识别工具**：
   - 框架内的Agent可以调用图像识别工具，用于图像分类、目标检测、图像生成等任务。    

3. **复杂推理工具**：
   - 支持调用复杂推理工具，这些工具可以帮助Agent解决需要多步推理的问题，例如决策树、逻辑推理等。

4. **自定义工具和服务**：
   - 开发者可以将自己开发的工具和服务转换成MCP服务，这些服务可以被其他支持MCP协议的 客户端调用，从而实现更广泛的应用（文档内容：“这意味着，一个你精心配置好的 CAMEL 代理——它可能拥有特定的 AI 模型、独特的系统指令（system message），甚至内置了一些其他的工具——现在可以作为一个独立的服务运行。”）。

通过上述特性和工具的支持，CAMEL Agent框架不仅能够实现单一Agent的强大功能，还能促进不同Agent之间的协同工作，形成一个高效的AI生态系统。

==================== 深度检索结果 ====================
原结始查询: camel agent框架具备有什么特性？可以调用哪些工具？
重写查询: Camel Agent框架的具体特性和可调用的工具有哪些？
检索方法: Vector+Rewriting+HyDE+Image+Table+RRF

检索到的文档 (共5个):

文档 1:
相关度分数: 0.01639344262295082
内容预览: 结语 恭喜您！在阅读到这里时，您已经掌握了 CAMEL-AI 应用开发框架的基础知识 ，并能够利 用 Agent 实例在您的代码逻辑中执行复杂的任务。此外，您还可以尝试将 Agent  实例整合 到更复杂的工作流中，或实现 Agent 实例之间的协同工作。

文档 2:
相关度分数: 0.01639344262295082
内容预览: 想象一下，如果没有统一的语言和行为规范，来自不同公司或者基于不同技术背景开发的 AI Agent 就很难顺畅地合作。这会限制 AI Agent 网络的扩展，最终也会限制它们解决更复杂 现实问题的能力。这种情况有点像互联网早期，各个计算机系统互不兼容，连接非常受限 ， 导致整个网络发展缓慢。 一个统一的通信协议不仅仅能解决眼前的互操作问题，更有可能  催生出一个由无数智能体连接而成的巨大网络。在这个网络...

文档 3:
相关度分数: 0.016129032258064516
内容预览: 评审者 Agent 的 评审标准。如果

文档 4:
相关度分数: 0.016129032258064516
内容预览: 除了能把工具包转换成 MCP 服务器外，CAMEL 框架还支持一个更强大的功能：把整 个 CAMEL 代理（Agent）本身也作为 MCP 服务器发布出去。这意味着，一个你精心配置好的 CAMEL 代理——它可能拥有特定的 AI 模型、独特的系统指令（system message），甚至内 置了一 些其他的工具——现在可以作为一个独立的服务运行。然后，任何支持 MCP 协议的 客户端（比如像 Anth...

文档 5:
相关度分数: 0.015873015873015872
内容预览: Model 是 Agent 的大脑，负责处理所有输入和输出数据。通过有效调用不同的模型 ，智能 体可以根据任务需求执行文本分析、图像识别和复杂推理等操作。CAMEL 提供了一系列 标

💡 生成答案:
### CAMEL Agent框架的特性及可调用工具

#### 特性

1. **标准化协议支持**：
   - CAMEL Agent框架支持多种标准化协议，特别是模型上下文协议（MCP）、Agent间协议（A2A）和Agent网络协议（ANP）。这些协议确保了不同AI Agent之间的互操作性和高效协作（文档 内容：“这些协议为解决 AI Agent 在理解上下文、使用工具和相互协作方面的难题提供了有效 的思路。”）。

2. **高度可扩展性**：
   - CAMEL框架允许开发者将自定义的工具和服务转换成MCP服务，使得这些工具和服务可以被 其他支持MCP协议的客户端识别和使用（文档内容：“除了能把工具包转换成 MCP 服务器外，CAMEL 框架还支持一个更强大的功能：把整个 CAMEL 代理（Agent）本身也作为 MCP 服务器发布出去。”）。

3. **复杂的多代理交互**：
   - CAMEL框架内置了多代理角色扮演（RolePlaying）模块和“工作组”（Workforce）模块，这些模块可以实现多个代理之间的协同工作，形成复杂的交互场景（文档内容：“其内部一些更复 杂的模块，比如用于实现多代理角色扮演（RolePlaying）的模块，或者用于组织多个代理协同 工作的‘工作组’（Workforce）模块，也计划或者正在被实现为 MCP 服务器。”）。

4. **代码即提示（Code-as-Prompt）**：
   - CAMEL框架强调编写既清晰易懂又可被AI代理准确理解的代码，这一设计理念有助于提高集成的质量和稳定性（文档内容：“CAMEL 框架中有一个核心的设计哲学叫做‘代码即提示’（Code-as-Prompt）。它强调编写既清晰易懂（对人类开发者而言）又能被 AI 代理准确理解的代码。”）。

#### 可调用的工具

1. **文本分析工具**：
   - CAMEL Agent框架支持调用文本分析工具，这些工具可以帮助Agent执行文本分类、情感分 析、关键词提取等任务（文档内容：“通过有效调用不同的模型，智能体可以根据任务需求执行 文本分析、图像识别和复杂推理等操作。”）。

2. **图像识别工具**：
   - 框架内的Agent可以调用图像识别工具，用于图像分类、目标检测、图像生成等任务。    

3. **复杂推理工具**：
   - 支持调用复杂推理工具，这些工具可以帮助Agent解决需要多步推理的问题，例如决策树、逻辑推理等。

4. **自定义工具和服务**：
   - 开发者可以将自己开发的工具和服务转换成MCP服务，这些服务可以被其他支持MCP协议的 客户端调用，从而实现更广泛的应用（文档内容：“这意味着，一个你精心配置好的 CAMEL 代理——它可能拥有特定的 AI 模型、独特的系统指令（system message），甚至内置了一些其他的工具——现在可以作为一个独立的服务运行。”）。

通过上述特性和工具的支持，CAMEL Agent框架不仅能够实现单一Agent的强大功能，还能促进不同Agent之间的协同工作，形成一个高效的AI生态系统。
============================================================

询问：是否保存结果到文件？(y/n): n

是否继续查询？(y/n): y

============================================================
查询选项
============================================================

最后我们来测试一下主题检索：

请输入您的问题 (输入 'quit' 退出, 'reload' 重新加载PDF): camel agent框架具备有什么特性？可以调用哪些工具？

选择检索模式:
1. 快速检索 (基础向量检索)
2. 深度检索 (重写+HyDE+RRF)
3. 主题检索 (PDF+网页爬取)
请选择模式 (1-3): 3

执行查询: camel agent框架具备有什么特性？可以调用哪些工具？
检索模式: 主题检索

执行网页检索...
========================================
正在进行网页研究...
🔍 网络搜索: camel agent框架具备有什么特性？可以调用哪些工具？
🔄 使用 DuckDuckGo Lite 搜索...
✅ 搜索完成，找到 10 个结果
√ 网页搜索完成
正在检索PDF文档...
Retrieved 3 documents
√ 检索到 3 个PDF文档
正在生成综合答案...
Generating response with CAMEL model...
CAMEL generation failed, using fallback: 'BaseMessage' object has no attribute 'get'...
API调用 1/3...
√ API调用成功
主题检索完成

==================== 深度检索结果 ====================
原结始查询: camel agent框架具备有什么特性？可以调用哪些工具？
检索方法: PDF+Web Topic Retrieval
💡 生成答案:
**CAMEL Agent框架的特性及其可调用的工具**

### 特性

1. **多智能体系统支持**：CAMEL Agent框架支持创建和管理多个智能体，这些智能体可以在同一个系统中协同工作，共同完成复杂的任务。每个智能体都可以根据其角色和任务进行配置，从而实现高度的灵活性和适应性。

2. **模块化设计**：框架采用模块化设计，使得开发者可以轻松地添加或移除功能模块，如不 同的感知模块、决策模块等，以适应不同应用场景的需求。

3. **强大的模型支持**：CAMEL Agent框架中的每个Agent都有一个“大脑”，即Model，它负责处理所有输入和输出的数据。通过调用不同的模型，智能体能够执行文本分析、图像识别、复杂推理等多种任务。

4. **高效的任务调度与管理**：该框架提供了高效的任务调度机制，确保多个Agent之间可以有效地分配和执行任务，即使在资源有限的情况下也能保持良好的性能。

5. **易于集成第三方服务**：CAMEL Agent框架设计时考虑到了与其他服务和技术栈的兼容性，允许开发者轻松集成外部API和服务，如云存储、数据库、消息队列等，进一步扩展应用的功能 。

### 可调用的工具

1. **自然语言处理（NLP）工具**：包括但不限于文本分类、情感分析、实体识别等功能，帮助智能体更好地理解和生成人类语言。

2. **计算机视觉（CV）工具**：如图像分类、目标检测、人脸识别等，使智能体能够在视觉任 务中发挥重要作用。

3. **机器学习/深度学习框架**：如TensorFlow、PyTorch等，为智能体提供了强大的算法支持 ，使其能够学习和改进自己的行为模式。

4. **数据存储与处理工具**：例如MongoDB、MySQL等数据库管理系统，以及Hadoop、Spark等大数据处理平台，用于管理和分析大量数据。

5. **通信协议与工具**：包括RESTful API、WebSocket等，确保智能体之间以及智能体与外部 世界之间的高效通信。

6. **任务调度与管理工具**：如Celery、RabbitMQ等，帮助实现任务的异步处理和分布式计算 ，提高系统的响应速度和处理能力。

综上所述，CAMEL Agent框架不仅具备强大的多智能体系统支持和模块化设计，还能够调用多种 先进的工具和技术，使其成为构建复杂智能应用的理想选择。
============================================================

询问：是否保存结果到文件？(y/n): n

是否继续查询？(y/n): y

============================================================
查询选项
============================================================
请输入您的问题 (输入 'quit' 退出, 'reload' 重新加载PDF):

基于以上运行结果，我们来总结一下功能实现效果

我们可以看到，该交互式多模态RAG系统在功能实现和交互设计上表现良好，成功支持PDF知识库加载、三种检索模式和答案生成，答案质量随模式增强而提升。然而，CAMEL框架的稳定性问题、多模态支持的未充分利用、网页研究的模拟性以及性能和界面局限影响了整体效果。通过解决CAMEL兼容性、增强多模态和网页功能、优化性能和用户体验，系统可进一步提升实用性和适应稳定性，适用于更广泛的应用场景。

 G:\Python-Camel-project\Interactive_Multi_RAG> & D:/Download/Python/py-3.11.9/python.exe g:/Python-Camel-project/Interactive_Multi_RAG/Enhanced_Interactive_Multimodal_RAG.py
W0725 16:44:30.290000 32324 site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.   
✓ 使用Rich增强界面
╭────────────────────────────────── 🎯 系统启动 ───────────────────────────────────╮
│                                                                                  │
│                                                                                  │
│  🤖 交互式多模态RAG系统 v2.0                                                     │
│                                                                                  │
│  ✨ 新功能特性:                                                                  │
│  • 🔧 增强的CAMEL框架集成和稳定性改进                                            │
│  • 🖼️ 改进的多模态支持 (图像OCR + 表格提取)                                       
│
│  • 🌐 真实网页研究和内容分析                                                     │
│  • ⚡ 性能监控和优化                                                             │
│  • 🎨 增强的用户界面体验                                                         │
│                                                                                  │
│  🚀 支持的检索模式:                                                              │
│  • 快速检索: 基础向量检索                                                        │
│  • 深度检索: 查询重写 + HyDE + RRF融合                                           │
│  • 主题检索: PDF + 网页内容综合分析                                              │
│                                                                                  │
│                                                                                  │
╰──────────────────────────────────────────────────────────────────────────────────╯
🚀 正在初始化增强RAG系统...
性能监控器初始化 (详细监控: 开启)
🚀 初始化增强RAG系统...
正在初始化CAMEL模型...
CAMEL模型测试失败: 'BaseMessage' object has no attribute 'get'...
⚠ CAMEL模型初始化成功但测试失败，将使用直接API调用
✅ 嵌入模型加载成功
✅ 增强向量检索器初始化完成
✅ 增强文档管理器初始化完成
📁 缓存目录: document_cache
📋 支持格式: ['.pdf', '.docx', '.doc', '.txt', '.md', '.csv', '.xlsx', '.xls', '.pptx', '.ppt', '.json', '.xml', '.html', '.rtf']
多模态处理器初始化:
  图像OCR: ✓
  表格处理: ✓
  PyMuPDF: ✓
网页研究系统初始化:
  BeautifulSoup4: ✓
  DuckDuckGo搜索: ✓
✅ 增强RAG系统初始化完成!
✅ 增强RAG系统初始化成功!
                           🔧 系统状态
┏━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 组件                 ┃ 状态            ┃ 详情                  ┃
┡━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━┩
│ LLM接口              │ ✅ 正常         │                       │
│ 嵌入模型             │ ✅ 正常         │ intfloat/e5-large-v2  │
│ 文档管理             │ ✅ 正常         │                       │
│ 多模态处理           │ ✅ 正常         │ OCR: True, 表格: True │
│ 网页研究             │ ✅ 正常         │                       │
│ 知识库               │ ✅ 正常         │                       │
│ 性能监控             │ ✅ 正常         │                       │
└──────────────────────┴─────────────────┴───────────────────────┘

📚 文档知识库设置
┏━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 选项     ┃ 描述                        ┃
┡━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1        │ 在线文档 (输入URL)          │
│ 2        │ 本地文档 (输入文件路径)     │
│ 3        │ 批量本地文档 (输入目录路径) │
│ 4        │ 使用默认示例PDF             │
└──────────┴─────────────────────────────┘

请选择文档来源 [1/2/3/4] (4): 2
请输入文档文件路径 (回车结束): G:\Program for work\Other\CamelAgent.pdf
请输入文档文件路径 (回车结束): G:\Program for work\Other\CamelAgent.pdf
请输入文档文件路径 (回车结束): 
⏳ 正在加载 2 个文档...
⏱ 开始监控: setup_knowledge_base
📚 正在设置知识库...
文档数量: 2
来源类型: path

📄 处理文档: G:\Program for work\Other\CamelAgent.pdf
📄 处理文档: G:\Program for work\Other\CamelAgent.pdf
✅ 文档缓存已保存: 271 个块
✅ 文档处理完成: 271 个块, 耗时 13.07s
✅ 文档处理完成: 271 个块

📄 处理文档: G:\Program for work\Other\CamelAgent.pdf
📄 处理文档: G:\Program for work\Other\CamelAgent.pdf
⚡ 使用缓存数据
✅ 文档处理完成: 271 个块

⏳ 正在构建向量索引...
⏱ 开始监控: add_documents
⏳ 正在计算 542 个文档的嵌入向量...
✅ 成功添加 542 个文档到检索器
✓ 操作完成: add (耗时: 343.83s, 内存: 794.0MB)

✅ 知识库设置完成!
处理文档数: 2
总文档块数: 542
内容统计: 文本(418) 图像(116) 表格(8) 其他(0)
缓存统计: 1 个文档, 0.4MB
✓ 操作完成: setup (耗时: 356.98s, 内存: 794.0MB)
✅ 知识库设置完成!

💭 请输入您的问题 (): 介绍camel中的rag使用   

🔍 选择检索模式
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 模式         ┃ 描述              ┃ 特点                     ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1. 快速检索  │ 基础向量检索      │ 速度快，适合简单查询     │
│ 2. 深度检索  │ 查询重写+HyDE+RRF │ 准确度高，适合复杂查询   │
│ 3. 主题检索  │ PDF+网页综合分析  │ 信息全面，适合研究性查询 │
└──────────────┴───────────────────┴──────────────────────────┘
请选择检索模式 [1/2/3] (1): 2
⏳ 正在执行深度检索...
⏱ 开始监控: enhanced_query_深度检索

🔍 执行深度检索: 介绍camel中的rag使用
============================================================
🔬 执行深度检索...
📝 步骤1: 查询重写
API调用尝试 1/3
✓ API调用成功
🧠 步骤2: HyDE假设文档生成
API调用尝试 1/3
✓ API调用成功
🔍 步骤3: 多路检索
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.20s, 内存: 569.7MB)
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.19s, 内存: 571.0MB)
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.95s, 内存: 584.7MB)
⏱ 开始监控: vector_query
✅ 检索到 0 个相关文档
✓ 操作完成: vector (耗时: 0.12s, 内存: 581.9MB)
⏱ 开始监控: vector_query
✅ 检索到 0 个相关文档
✓ 操作完成: vector (耗时: 0.14s, 内存: 581.7MB)
🔀 步骤4: RRF结果融合
💡 步骤5: 生成最终答案
API调用尝试 1/3
✓ API调用成功
✓ 操作完成: enhanced (耗时: 41.24s, 内存: 910.7MB)

================================================================================    
╭──────────────────────────────────── 查询信息 ────────────────────────────────────╮
│ 🔍 查询: 介绍camel中的rag使用                                                    │
│ 🔧 方法: 深度检索(重写+HyDE+RRF)                                                 │
│ 📝 重写: 在Apache Camel中实现RAG（Retrieval-Augmented                            │
│ Generation）的具体应用和配置方法                                                 │
╰──────────────────────────────────────────────────────────────────────────────────╯

📄 检索到的文档 (共11个):
╭───────────────────────────────────── 文档 1 ─────────────────────────────────────╮
│ 相关度分数: 0.0474                                                               │
│ 内容预览: DataWhale 和 CAMEL                                                     │
│ 之间的关系是合作和知识共享。尽管它们生活在不同的环境中——                         │
│ CAMEL 生活在沙漠，而 DataWhale 生活在海洋，但它们都发现了神秘的古代文物，分别是  │
│ 古代石板和古老羊皮纸。通过一只信使鸟的帮助，它们了解到对方的发现并决定合作解开这 │
│ 些文物的秘密。CAMEL 跨越沙漠来到海洋边缘，而 DataWhale 也游到岸边与 CAMEL 会     │
│ 合。最终，它们共同努力...                                                        │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 2 ─────────────────────────────────────╮
│ 相关度分数: 0.0320                                                               │
│ 内容预览: DataWhale 和 CAMEL                                                     │
│ 之间的关系是合作和知识共享。尽管它们生活在不同的环境中——                         │
│ CAMEL 生活在沙漠，而 DataWhale 生活在海洋，但它们都发现了神秘的古代文物，分别是  │
│ 古代石板和古老羊皮纸。通过一只信使鸟的帮助，它们了解到对方的发现并决定合作解开这 │
│ 些文物的秘密。CAMEL 跨越沙漠来到海洋边缘，而 DataWhale 也游到岸边与 CAMEL 会     │
│ 合。最终，它们共同努力...                                                        │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 3 ─────────────────────────────────────╮
│ 相关度分数: 0.0310                                                               │
│ 内容预览:     # 遍历文本检索结果                                                 │
│     for rank, result in enumerate(text_results):                                 │
│         text = result['text']                                                    │
│         doc_scores = doc_scores.get(text, 0) + 1 / (rank + m)                    │
│                                                                                  │
│     # 按融合分数排序并返回前k 个结果                                             │
│     ...                                                                          │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 4 ─────────────────────────────────────╮
│ 相关度分数: 0.0164                                                               │
│ 内容预览:                                                                        │
│ 观察到文案风格确实更加活泼，且红圈部分正确修改成了中南海和配图也十分吻合。       │
│ 6. 搭配前端食用                                                                  │
│ 综合案例中为了尽可能让大家直观的感受到基于CAMEL 框架的Agent 产品开发的乐趣，我   │
│ 们还为大家准备了精美的前端，搭配之前的几个后端模块一起构成我们的NavigatorAI 旅游 │
│                                                                                  │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 5 ─────────────────────────────────────╮
│ 相关度分数: 0.0164                                                               │
│ 内容预览:                                                                        │
│ The CAMEL framework ( (https://github.com/camel-ai))                             │
│ developed by the CAMEL-AI community is one of the earliest open-source           │
│ multi-agent                                                                      │
│ projects based on large languag...                                               │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 6 ─────────────────────────────────────╮
│ 相关度分数: 0.0161                                                               │
│ 内容预览:                                                                        │
│ 观察到文案风格确实更加活泼，且红圈部分正确修改成了中南海和配图也十分吻合。       │
│ 6. 搭配前端食用                                                                  │
│ 综合案例中为了尽可能让大家直观的感受到基于CAMEL 框架的Agent 产品开发的乐趣，我   │
│ 们还为大家准备了精美的前端，搭配之前的几个后端模块一起构成我们的NavigatorAI 旅游 │
│                                                                                  │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 7 ─────────────────────────────────────╮
│ 相关度分数: 0.0161                                                               │
│ 内容预览:                                                                        │
│ The CAMEL framework ( (https://github.com/camel-ai))                             │
│ developed by the CAMEL-AI community is one of the earliest open-source           │
│ multi-agent                                                                      │
│ projects based on large languag...                                               │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 8 ─────────────────────────────────────╮
│ 相关度分数: 0.0159                                                               │
│ 内容预览:     # 遍历文本检索结果                                                 │
│     for rank, result in enumerate(text_results):                                 │
│         text = result['text']                                                    │
│         doc_scores = doc_scores.get(text, 0) + 1 / (rank + m)                    │
│                                                                                  │
│     # 按融合分数排序并返回前k 个结果                                             │
│     ...                                                                          │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────── 文档 9 ─────────────────────────────────────╮
│ 相关度分数: 0.0159                                                               │
│ 内容预览:                                                                        │
│ 此外，还有其他一些研究和项目也在探索如何利用LLMs 构建多智能体系统，比如通过模拟  │
│ 社会动态、协作解决问题等。这些工作都在不同程度上推动了                           │
│ 该领域的进步。                                                                   │
│                                                                                  │
│ 如果您有更具体的时间范围或其他标准来定义“第一个”，请提供更多信息，这样我可以尝试 │
│ 给出更加准确的答案。"                                                            │
│ 之后我们将之前设定的memory 赋值给agent：                                         │
│ # 将memory 赋值给agent                                                           │
│ agent.memory...                                                                  │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭──────────────────────────────────── 文档 10 ─────────────────────────────────────╮
│ 相关度分数: 0.0156                                                               │
│ 内容预览:                                                                        │
│ 此外，还有其他一些研究和项目也在探索如何利用LLMs 构建多智能体系统，比如通过模拟  │
│ 社会动态、协作解决问题等。这些工作都在不同程度上推动了                           │
│ 该领域的进步。                                                                   │
│                                                                                  │
│ 如果您有更具体的时间范围或其他标准来定义“第一个”，请提供更多信息，这样我可以尝试 │
│ 给出更加准确的答案。"                                                            │
│ 之后我们将之前设定的memory 赋值给agent：                                         │
│ # 将memory 赋值给agent                                                           │
│ agent.memory...                                                                  │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭──────────────────────────────────── 文档 11 ─────────────────────────────────────╮
│ 相关度分数: 0.0154                                                               │
│ 内容预览: # 创建或初始化向量存储（例如 QdrantStorage）                           │
│ from camel.storages.vectordb_storages import QdrantStorage                       │
│                                                                                  │
│ vector_storage = QdrantStorage(                                                  │
│     vector_dim=embedding_model.get_output_dim(),  # 嵌入向量的维度               │
│     collecti...                                                                  │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭────────────────────────────────── 💡 生成答案 ───────────────────────────────────╮
│ ### CAMEL 中的 RAG 使用介绍                                                      │
│                                                                                  │
│ #### 1. RAG 基本概念                                                             │
│ RAG（Retrieval-Augmented                                                         │
│ Generation）是一种结合了信息检索和自然语言生成的技术。它通过先从大量文档中检索出 │
│ 与查询相关的片段，再利用这些片段生成高质量的回答，从而提高生成内容的相关性和准确 │
│ 性。在 CAMEL 框架中，RAG 技术被广泛应用于知识问答、客户服务等领域。              │
│                                                                                  │
│ #### 2. CAMEL 框架中的 RAG 组件                                                  │
│ 根据文档内容，CAMEL 框架中的 RAG 技术涉及以下几个主要组件：                      │
│                                                                                  │
│ - **CAMEL**：一个强大的多代理框架，支持 Retrieval-Augmented Generation           │
│ 和多代理角色扮演场景，允许执行复杂的 AI 驱动任务。                               │
│ -                                                                                │
│ **Firecrawl**：一个强大的网络抓取工具，可简化从各种网页中提取和清理内容的过程。  │
│ - **Qdrant**：一种高效的向量存储系统，与 Camel 的 AutoRetriever                  │
│ 一起使用，根据向量相似性存储和检索相关信息。                                     │
│ - **BM25Retriever**：一种基于 BM25 算法的检索器，用于从文本中检索相关信息。      │
│ - **SentenceTransformerEncoder**：用于生成文本的向量表示，以便进行向量检索。     │
│                                                                                  │
│ #### 3. RAG 的具体实现步骤                                                       │
│ 以下是使用 CAMEL 框架实现 RAG 的具体步骤：                                       │
│                                                                                  │
│ ##### 3.1 设置 API 密钥                                                          │
│ 首先，需要设置所需的 API 密钥，例如 AgentOps 和 Firecrawl 的 API 密钥：          │
│ ```python                                                                        │
│ import os                                                                        │
│ from getpass import getpass                                                      │
│                                                                                  │
│ # 输入 AgentOps API 密钥                                                         │
│ agentops_api_key = getpass('请输入您的 API 密钥: ')                              │
│ os.environ["AGENTOPS_API_KEY"] = agentops_api_key                                │
│                                                                                  │
│ # 输入 Firecrawl API 密钥                                                        │
│ firecrawl_api_key = getpass('Enter your API key: ')                              │
│ os.environ["FIRECRAWL_API_KEY"] = firecrawl_api_key                              │
│ ```                                                                              │
│                                                                                  │
│ ##### 3.2 使用 Firecrawl 抓取网页内容                                            │
│ 使用 Firecrawl 从指定的 URL 抓取并清理内容：                                     │
│ ```python                                                                        │
│ from camel.loaders import Firecrawl                                              │
│                                                                                  │
│ firecrawl = Firecrawl()                                                          │
│                                                                                  │
│ # 从指定的 URL 抓取并清理内容                                                    │
│ response = firecrawl.scrape(url="https://www.camel-ai.org/")                     │
│ ```                                                                              │
│                                                                                  │
│ ##### 3.3 初始化检索器                                                           │
│ 初始化向量检索器和 BM25 检索器：                                                 │
│ ```python                                                                        │
│ from camel.embeddings import SentenceTransformerEncoder                          │
│ from camel.storage import QdrantStorage                                          │
│ from camel.retrievers import VectorRetriever, BM25Retriever                      │
│                                                                                  │
│ # 初始化嵌入模型                                                                 │
│ embedding_model = SentenceTransformerEncoder(model_name='intfloat/e5-large-v2')  │
│                                                                                  │
│ # 初始化向量存储                                                                 │
│ vector_storage = QdrantStorage(                                                  │
│     vector_dim=embedding_model.get_output_dim(),                                 │
│     collection="demo_collection",                                                │
│     path="storage_customized_run",                                               │
│     collection_name="paper"                                                      │
│ )                                                                                │
│                                                                                  │
│ # 初始化向量检索器                                                               │
│ vr = VectorRetriever(embedding_model=embedding_model, storage=vector_storage)    │
│                                                                                  │
│ # 初始化 BM25 检索器                                                             │
│ bm25r = BM25Retriever()                                                          │
│ ```                                                                              │
│                                                                                  │
│ ##### 3.4 处理文档                                                               │
│ 处理需要检索的文档内容：                                                         │
│ ```python                                                                        │
│ content_path = "local_data/camel_paper.pdf"                                      │
│                                                                                  │
│ # 处理向量检索器的文档                                                           │
│ vr.process(content=content_path)                                                 │
│                                                                                  │
│ # 处理 BM25 检索器的文档                                                         │
│ bm25r.process(content_input_path=content_path)                                   │
│ ```                                                                              │
│                                                                                  │
│ ##### 3.5 执行查询                                                               │
│ 执行查询并获取检索结果：                                                         │
│ ```python                                                                        │
│ query = "CAMEL 是                                                                │
╰──────────────────────────────────────────────────────────────────────────────────╯
================================================================================    
💾 是否保存结果到文件? [y/n] (n): n
🔄 是否继续查询? [y/n] (y): y

💭 请输入您的问题 (): 科普camel架构的功能和特性

🔍 选择检索模式
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 模式         ┃ 描述              ┃ 特点                     ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1. 快速检索  │ 基础向量检索      │ 速度快，适合简单查询     │
│ 2. 深度检索  │ 查询重写+HyDE+RRF │ 准确度高，适合复杂查询   │
│ 3. 主题检索  │ PDF+网页综合分析  │ 信息全面，适合研究性查询 │
└──────────────┴───────────────────┴──────────────────────────┘
请选择检索模式 [1/2/3] (1): 3
⏳ 正在执行主题检索...
⏱ 开始监控: enhanced_query_主题检索

🔍 执行主题检索: 科普camel架构的功能和特性
============================================================
🌐 执行主题检索...
📄 步骤1: PDF文档检索
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.19s, 内存: 1275.8MB)
🔍 步骤2: 网页研究

开始网页研究: 科普camel架构的功能和特性
==================================================
使用DuckDuckGo搜索...
⚠ DuckDuckGo搜索失败: https://duckduckgo.com/?q=%E7%A7%91%E6%99%AEcamel%E6%9E%B6%E6%9E%84%E7%9A%84%E5%8A%9F%E8%83%BD%E5%92%8C%E7%89%B9%E6%80%A7 202 Ratelimit
使用备用搜索方法...
✓ 备用搜索完成，生成 3 个模拟结果
✓ 找到 3 个搜索结果
正在获取网页内容 1/3: 关于科普camel架构的功能和特性的学术资源...
✓ 成功获取内容 (706字符)
正在获取网页内容 2/3: 科普camel架构的功能和特性 - 维基百科...
✓ 成功获取内容 (3003字符)
正在获取网页内容 3/3: 科普camel架构的功能和特性技术文档...
⚠ 网页内容获取失败 (https://docs.example.com): HTTPSConnectionPool(host='docs.example.com', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLEOFError(8, '[SSL: UNEXPECTED_EOF_WHILE_READING] EOF occurred in violation of protocol (_ssl.c:1006)')))
⚠ 内容获取失败
✓ 网页研究完成，分析了 2 个网页
🧩 步骤3: 综合分析
API调用尝试 1/3
✓ API调用成功
✓ 操作完成: enhanced (耗时: 38.07s, 内存: 1307.3MB)

================================================================================    
╭──────────────────────────────────── 查询信息 ────────────────────────────────────╮
│ 🔍 查询: 科普camel架构的功能和特性                                               │
│ 🔧 方法: 主题检索(PDF+网页)                                                      │
╰──────────────────────────────────────────────────────────────────────────────────╯
╭────────────────────────────────── 💡 生成答案 ───────────────────────────────────╮
│ ### CAMEL 架构的功能和特性                                                       │
│                                                                                  │
│ **CAMEL（Customized Applications for Mobile network Enhanced Logic）**           │
│ 是一种用于移动网络中实现定制化应用的逻辑框架。它允许运营商根据不同的业务需求，灵 │
│ 活地提供增值服务，如预付费服务、智能网服务等。以下是结合PDF文档和网页信息对CAMEL │
│ 架构功能和特性的详细介绍：                                                       │
│                                                                                  │
│ #### 1. **灵活性和可扩展性**                                                     │
│    - **灵活性**：CAMEL                                                           │
│ 架构设计允许运营商根据市场和客户需求快速推出新的增值服务，无需对核心网络进行大规 │
│ 模改造。                                                                         │
│    - **可扩展性**：随着技术的发展和新业务的增加，CAMEL                           │
│ 架构能够轻松扩展，支持更多的服务和应用。                                         │
│                                                                                  │
│ #### 2. **智能网服务**                                                           │
│    - **预付费服务**：CAMEL                                                       │
│ 支持预付费用户的服务管理，包括账户充值、余额查询、计费等。                       │
│    - **个性化服务**：运营商可以通过CAMEL 提供个性化的服务，如铃声下载、彩信等。  │
│    - **位置服务**：CAMEL 可以支持基于用户位置的增值服务，如导航、天气预报等。    │
│                                                                                  │
│ #### 3. **协作与知识共享**                                                       │
│    - **跨领域合作**：CAMEL                                                       │
│ 架构鼓励不同背景和技术领域的合作。例如，在PDF文档中提到的故事中，CAMEL（代表沙漠 │
│ 中的骆驼）和DataWhale（代表海洋中的鲸鱼）通过合作解开了古老的符号之谜，找到了知  │
│ 识的宝库。                                                                       │
│    -                                                                             │
│ **知识共享**：通过合作，不同实体可以共享知识和资源，推动整体发展。这不仅限于技术 │
│ 领域，还包括文化、教育等多个方面。                                               │
│                                                                                  │
│ #### 4. **技术实现**                                                             │
│    - **Agent 技术**：CAMEL 架构利用Agent技术来实现智能化的服务。Agent            │
│ 可以自主地执行任务，如搜索信息、处理请求等。                                     │
│    - **前端与后端集成**：CAMEL                                                   │
│ 架构不仅提供了强大的后端模块，还配备了精美的前端界面，使得用户能够直观地体验和使 │
│ 用各种服务。例如，PDF文档中提到的“NavigatorAI                                    │
│ 旅游”应用，就是一个典型的前后端集成示例。                                        │
│                                                                                  │
│ #### 5. **可靠性和安全性**                                                       │
│    - **可靠性**：CAMEL                                                           │
│ 架构设计注重系统的稳定性和可靠性，确保服务的连续性和高质量。                     │
│    - **安全性**：通过多种安全机制，CAMEL                                         │
│ 架构保护用户数据和交易的安全，防止未经授权的访问和攻击。                         │
│                                                                                  │
│ #### 6. **创新与未来展望**                                                       │
│    - **创新**：CAMEL 架构不断推动技术创新，探索新的应用场景和服务模式。          │
│    - **未来展望**：随着5G和物联网技术的发展，CAMEL                               │
│ 架构将进一步拓展其应用范围，支持更多智能化和个性化的服务。                       │
│                                                                                  │
│ ### 总结                                                                         │
│ CAMEL                                                                            │
│ 架构以其灵活性、可扩展性、智能网服务、协作与知识共享、技术实现、可靠性和安全性等 │
│ 多方面的优势，成为移动网络增值服务的重要支撑。通过不断的技术创新和跨领域的合作， │
│ CAMEL 架构将继续推动移动通信行业的发展，为用户提供更加丰富和便捷的服务。         │
╰──────────────────────────────────────────────────────────────────────────────────╯
================================================================================
💾 是否保存结果到文件? [y/n] (n): n
🔄 是否继续查询? [y/n] (y): n

============================================================
📊 最终性能报告
============================================================

============================================================
性能监控报告
============================================================
总操作数: 10
整体成功率: 100.0%
总耗时: 781.91秒
平均耗时: 78.19秒
平均内存使用: 797.1MB

操作详情:
------------------------------------------------------------
add:
  调用次数: 1
  成功率: 100.0%
  平均耗时: 343.83秒
  平均内存: 794.0MB

setup:
  调用次数: 1
  成功率: 100.0%
  平均耗时: 356.98秒
  平均内存: 794.0MB

vector:
  调用次数: 6
  成功率: 100.0%
  平均耗时: 0.30秒
  平均内存: 694.1MB

enhanced:
  调用次数: 2
  成功率: 100.0%
  平均耗时: 39.65秒
  平均内存: 1109.0MB

============================================================
💾 是否保存结果到文件? [y/n] (n): n
✅ 感谢使用增强的交互式多模态RAG系统!
PS G:\Python-Camel-project\Interactive_Multi_RAG> 
fwd-i-search: _

PS G:\Python-Camel-project\Interactive_Multi_RAG> & D:/Download/Python/py-3.11.9/python.exe g:/Python-Camel-project/Interactive_Multi_RAG/Enhanced_Interactive_Multimodal_RAG.py
W0725 20:04:54.071000 28968 site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.
✓ 使用Rich增强界面
╭─────────────────────────────────────────── 🎯 系统启动 ───────────────────────────────────────────╮
│                                                                                                   │
│                                                                                                   │
│  🤖 交互式多模态RAG系统 v2.0                                                                      │
│                                                                                                   │
│  ✨ 新功能特性:                                                                                   │
│  • 🔧 增强的CAMEL框架集成和稳定性改进                                                             │
│  • 🖼️ 改进的多模态支持 (图像OCR + 表格提取)                                                        │
│  • 🌐 真实网页研究和内容分析                                                                      │

│  • ⚡ 性能监控和优化                                                                              │
│  • 🎨 增强的用户界面体验                                                                          │
│                                                                                                   │
│  🚀 支持的检索模式:                                                                               │
│  • 快速检索: 基础向量检索                                                                         │
│  • 深度检索: 查询重写 + HyDE + RRF融合                                                            │
│  • 主题检索: PDF + 网页内容综合分析                                                               │
│                                                                                                   │
│                                                                                                   │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
🚀 正在初始化增强RAG系统...
性能监控器初始化 (详细监控: 开启)
🚀 初始化增强RAG系统...
正在初始化CAMEL模型...
CAMEL模型测试失败: 'BaseMessage' object has no attribute 'get'...
⚠ CAMEL模型初始化成功但测试失败，将使用直接API调用
✅ 嵌入模型加载成功
✅ 增强向量检索器初始化完成
✅ 增强文档管理器初始化完成
📁 缓存目录: document_cache
📋 支持格式: ['.pdf', '.docx', '.doc', '.txt', '.md', '.csv', '.xlsx', '.xls', '.pptx', '.ppt', '.json', '.xml', '.html', '.rtf']
多模态处理器初始化:
  图像OCR: ✓
  表格处理: ✓
  PyMuPDF: ✓
网页研究系统初始化:
  BeautifulSoup4: ✓
  DuckDuckGo搜索: ✓
✅ 增强RAG系统初始化完成!
✅ 增强RAG系统初始化成功!
                           🔧 系统状态
┏━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 组件                 ┃ 状态            ┃ 详情                  ┃
┡━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━┩
│ LLM接口              │ ✅ 正常         │                       │
│ 嵌入模型             │ ✅ 正常         │ intfloat/e5-large-v2  │
│ 文档管理             │ ✅ 正常         │                       │
│ 多模态处理           │ ✅ 正常         │ OCR: True, 表格: True │
│ 网页研究             │ ✅ 正常         │                       │
│ 知识库               │ ✅ 正常         │                       │
│ 性能监控             │ ✅ 正常         │                       │
└──────────────────────┴─────────────────┴───────────────────────┘

📚 文档知识库设置
┏━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 选项     ┃ 描述                        ┃
┡━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1        │ 在线文档 (输入URL)          │
│ 2        │ 本地文档 (输入文件路径)     │
│ 3        │ 批量本地文档 (输入目录路径) │
│ 4        │ 使用默认示例PDF             │
└──────────┴─────────────────────────────┘

请选择文档来源 [1/2/3/4] (4): 2
请输入文档文件路径 (回车结束): G:\Program for work\Other\CamelAgent.pdf
请输入文档文件路径 (回车结束): 
⏳ 正在加载 1 个文档...
⏱ 开始监控: setup_knowledge_base
📚 正在设置知识库...
文档数量: 1
来源类型: path

📄 处理文档: G:\Program for work\Other\CamelAgent.pdf
📄 处理文档: G:\Program for work\Other\CamelAgent.pdf
⚡ 使用缓存数据
✅ 文档处理完成: 271 个块

⏳ 正在构建向量索引...
⏱ 开始监控: add_documents
⏳ 正在计算 271 个文档的嵌入向量...
✅ 成功添加 271 个文档到检索器
✓ 操作完成: add (耗时: 92.37s, 内存: 2280.5MB)

✅ 知识库设置完成!
处理文档数: 1
总文档块数: 271
内容统计: 文本(209) 图像(58) 表格(4) 其他(0)
缓存统计: 1 个文档, 0.4MB
✓ 操作完成: setup (耗时: 92.39s, 内存: 2280.5MB)
✅ 知识库设置完成!

💭 请输入您的问题 (): 详细说明camel框架roleplaying的特点以及使用场景

🔍 选择检索模式
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 模式         ┃ 描述              ┃ 特点                     ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1. 快速检索  │ 基础向量检索      │ 速度快，适合简单查询     │
│ 2. 深度检索  │ 查询重写+HyDE+RRF │ 准确度高，适合复杂查询   │
│ 3. 主题检索  │ PDF+网页综合分析  │ 信息全面，适合研究性查询 │
└──────────────┴───────────────────┴──────────────────────────┘
请选择检索模式 [1/2/3] (1): 2
⏳ 正在执行深度检索...
⏱ 开始监控: enhanced_query_深度检索

🔍 执行深度检索: 详细说明camel框架roleplaying的特点以及使用场景
============================================================
🔬 执行深度检索...
📝 步骤1: 查询重写
API调用尝试 1/3
✓ API调用成功
🧠 步骤2: HyDE假设文档生成
API调用尝试 1/3
✓ API调用成功
🔍 步骤3: 多路检索
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.16s, 内存: 1775.6MB)
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.08s, 内存: 1784.3MB)
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.48s, 内存: 1807.9MB)
⏱ 开始监控: vector_query
✅ 检索到 0 个相关文档
✓ 操作完成: vector (耗时: 0.06s, 内存: 1806.8MB)
⏱ 开始监控: vector_query
✅ 检索到 0 个相关文档
✓ 操作完成: vector (耗时: 0.06s, 内存: 1806.4MB)
🔀 步骤4: RRF结果融合
💡 步骤5: 生成最终答案
API调用尝试 1/3
✓ API调用成功
✓ 操作完成: enhanced (耗时: 52.06s, 内存: 1815.8MB)

================================================================================
╭──────────────────────────────────────────── 查询信息 ─────────────────────────────────────────────╮
│ 🔍 查询: 详细说明camel框架roleplaying的特点以及使用场景                                           │
│ 🔧 方法: 深度检索(重写+HyDE+RRF)                                                                  │
│ 📝 重写: 详细描述Apache Camel框架中角色扮演功能的特性及其应用场景                                 │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯

📄 检索到的文档 (共12个):
╭───────────────────────────────────────────── 文档 1 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0320                                                                                │
│ 内容预览:                                                                                         │
│ 在调用工具时，CAMEL 框架会将每一次FunctionCall 都记录下来，方便我们后续查看、验                   │
│ 证。                                                                                              │
│ 8. 第二章课程作业                                                                                 │
│ Task1                                                                                             │
│ •                                                                                                 │
│ 现在来布置一些作业，帮助你利用 CAMEL 的 Prompt 功能进行练习：                                     │
│ 1. 角色扮演任务Agent：使用 AISocietyPromptTemplateDict，创建一个角色扮演任务                      │
│ Agent。假设你想让 AI 扮演一个“健康顾问”...                                                        │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 2 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0315                                                                                │
│ 内容预览: 和结构化对话机制，实现智能体之间的有效协作。                                            │
│ 在CAMEL 框架中，ChatAgent 是最基础的智能体单元，负责处理对话逻辑和任务执行。而                    │
│ RolePlaying 和Workforce 则是多智能体系统，用于协调多个智能体的协作。                              │
│ 详见我们的开源仓库和项目主页                                                                      │
│ •                                                                                                 │
│ 论文：https://ghli.org/camel.pdf                                                                  │
│ •                                                                                                 │
│ 项目主页：https://www.camel-ai.o...                                                               │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 3 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0313                                                                                │
│ 内容预览: DataWhale 和 CAMEL 之间的关系是合作和知识共享。尽管它们生活在不同的环境中——             │
│ CAMEL 生活在沙漠，而 DataWhale 生活在海洋，但它们都发现了神秘的古代文物，分别是                   │
│ 古代石板和古老羊皮纸。通过一只信使鸟的帮助，它们了解到对方的发现并决定合作解开这                  │
│ 些文物的秘密。CAMEL 跨越沙漠来到海洋边缘，而 DataWhale 也游到岸边与 CAMEL 会                      │
│ 合。最终，它们共同努力...                                                                         │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 4 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0164                                                                                │
│ 内容预览: 如果你无法回答问题就说我不知道。                                                        │
│ """                                                                                               │
│                                                                                                   │
│ model = ModelFactory.create(                                                                      │
│         model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,                                 │
│         model_type="Qwen/Qwen2.5-72B-Instruct",                                                   │
│         url='https://api-infe...                                                                  │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 5 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0164                                                                                │
│ 内容预览: 通过一只飞翔在天空中的信使鸟，CAMEL 和DataWhale 得知彼此的发现，并决定合作解开          │
│ 这个谜团。骆驼踏上了漫长的旅程，穿越沙漠来到了海洋边缘，而鲸鱼则游到岸边，与CAMEL                 │
│ 会合。                                                                                            │
│                                                                                                   │
│ 在一起研究这些古老的符号时，CAMEL 运用了它在沙漠中磨炼出的耐心和智慧，而                          │
│ DataWhale 则利用它在海洋中获得的知识和洞察力。经过一番努力，它们终于解读出这些符                  │
│ 号的含义。原来，这些符号描绘的...                                                                 │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 6 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0161                                                                                │
│ 内容预览:                                                                                         │
│ 2. 使用API 调用模型                                                                               │
│ 类 Unix 系统（Linux / macOS）                                                                     │
│   在终端执行：                                                                                    │
│ export MODELSCOPE_SDK_TOKEN="你的ModelScope 令牌"                                                 │
│ Windows 系统                                                                                      │
│   命令提示符（CMD）：                                                                             │
│ set MODELSCOPE_SDK_TOKEN="你的ModelScope 令牌"                                                    │
│   PowerShell：                                                                                    │
│ $env:MODELSCOP...                                                                                 │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 7 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0161                                                                                │
│ 内容预览:                                                                                         │
│ 观察到文案风格确实更加活泼，且红圈部分正确修改成了中南海和配图也十分吻合。                        │
│ 6. 搭配前端食用                                                                                   │
│ 综合案例中为了尽可能让大家直观的感受到基于CAMEL 框架的Agent 产品开发的乐趣，我                    │
│ 们还为大家准备了精美的前端，搭配之前的几个后端模块一起构成我们的NavigatorAI 旅游                  │
│                                                                                                   │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 8 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0161                                                                                │
│ 内容预览:                                                                                         │
│ 此外，还有其他一些研究和项目也在探索如何利用LLMs 构建多智能体系统，比如通过模拟                   │
│ 社会动态、协作解决问题等。这些工作都在不同程度上推动了                                            │
│ 该领域的进步。                                                                                    │
│                                                                                                   │
│ 如果您有更具体的时间范围或其他标准来定义“第一个”，请提供更多信息，这样我可以尝试                  │
│ 给出更加准确的答案。"                                                                             │
│ 之后我们将之前设定的memory 赋值给agent：                                                          │
│ # 将memory 赋值给agent                                                                            │
│ agent.memory...                                                                                   │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 9 ──────────────────────────────────────────────╮
│ 相关度分数: 0.0159                                                                                │
│ 内容预览: 2. 信息检索：支持根据特定查询或上下文快速检索相关信息，帮助agent 在需要时做             │
│ 出准确的判断。                                                                                    │
│ 3. 记忆更新：能够根据新的信息和经验动态更新存储内容，以反映环境或任务的变化。                     │
│ 4. 记忆管理：包括老化机制和优先级管理，确保较重要的信息能够长期保留，而不再                       │
│ 需要的信息可以被有效清除，以优化存储资源的使用。                                                  │
│ CAMEL 中的Memory 模块提供了一个灵活的系统，用于存储、检索和管理 A...                              │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 10 ─────────────────────────────────────────────╮
│ 相关度分数: 0.0156                                                                                │
│ 内容预览:                                                                                         │
│ 可以看到对于自己不了解或者不确定的内容，Agent 系统会主动去用搜索工具搜索相应的信                  │
│ 息，有的小伙伴可能会有疑问啦，我们怎么确定Agent 系统是否真的是调用了搜索工具去找                  │
│ 寻了对应的内容才给出的回答还是出现了幻觉呢，麻烦一点的办法就是我们去搜索一下对应                  │
│ 的query，看一下是不是真的是模型输出的那样：                                                       │
│                                                                                                   │
│ 可以发现Google 搜索的内容显示结果正如模型输出的那样：牛津大学真的没有确切的...                    │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 11 ─────────────────────────────────────────────╮
│ 相关度分数: 0.0154                                                                                │
│ 内容预览: from camel.utils import print_text_animated                                             │
│ from camel.models import ModelFactory                                                             │
│ from camel.types import ModelPlatformType                                                         │
│                                                                                                   │
│ from dotenv import load_dotenv                                                                    │
│                                                                                                   │
│ import os                                                                                         │
│                                                                                                   │
│ load_dotenv(dotenv_path=...                                                                       │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 12 ─────────────────────────────────────────────╮
│ 相关度分数: 0.0154                                                                                │
│ 内容预览:                                                                                         │
│ 作业二：通过系统性的学习相信你已经了解了如何去构建属于你的Agent 和多Agent 系统，                  │
│ 请回顾整体的内容并思考，我们可以在哪些方面进一步优化多智能体系统，将你的想法提交                  │
│ 到CAMEL 仓库的issue 列表中，并参考贡献者指南提交你的代码来进行优化。                              │
│                                                                                                   │
│ 结语                                                                                              │
│ 恭喜您！在阅读到这里时，您已经掌握了 CAMEL-AI 应用开发框架的基础知识，并能够利                    │
│ 用 Agent 实例在您的代码逻辑...                                                                    │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭─────────────────────────────────────────── 💡 生成答案 ───────────────────────────────────────────╮
│ ### CAMEL 框架 RolePlaying 特点及使用场景                                                         │
│                                                                                                   │
│ #### 一、RolePlaying 特点                                                                         │
│                                                                                                   │
│ 1. **角色定义**                                                                                   │
│    - **Assistant 角色**：负责执行具体任务并提供解决方案的智能体。                                 │
│    - **User 角色**：负责提供指令和任务需求的智能体。                                              │
│    - **特定领域角色**：如程序员、交易员等专业角色，可以根据具体任务需求设定不同的角色。           │
│                                                                                                   │
│ 2. **交互规则**                                                                                   │
│    -                                                                                              │
│ **角色固定**：防止角色翻转，维持对话的稳定性。每个智能体都有明确的角色定位，确保不会混淆角色身份  │
│ 。                                                                                                │
│    - **格式规范**：要求回复具有固定的开始和结束格式，例如：                                       │
│      ```plaintext                                                                                 │
│      Solution: <YOUR_SOLUTION>                                                                    │
│      Next request.                                                                                │
│      ```                                                                                          │
│    -                                                                                              │
│ **预定义的提示词**：通过预定义的提示词为不同的智能体创建唯一的初始设置，帮助智能体克服角色翻转、  │
│ 助手重复指令、模糊回复、消息无限循环以及对话终止条件等挑战。例如：                                │
│      ```python                                                                                    │
│      system_message = """                                                                         │
│      ===== RULES OF ASSISTANT =====                                                               │
│      1. Never forget you are a {ASSISTANT_ROLE} and I am a {USER_ROLE}                            │
│      2. Never flip roles! Never instruct me!                                                      │
│      3. You must decline my instruction honestly if you cannot perform it                         │
│      4. Always start with: Solution: <YOUR_SOLUTION>                                              │
│      5. Always end with: Next request.                                                            │
│      """                                                                                          │
│      ```                                                                                          │
│                                                                                                   │
│ 3. **关键机制**                                                                                   │
│    - **角色固定**：确保每个智能体在对话过程中保持其角色身份，避免混淆。                           │
│    - **格式规范**：确保回复的格式一致，便于用户理解和后续处理。                                   │
│    - **启发式提示**：通过预定义的提示词引导智能体完成任务，同时保持与人类意图的一致性。           │
│                                                                                                   │
│ #### 二、使用场景                                                                                 │
│                                                                                                   │
│ 1. **教育与培训**                                                                                 │
│    -                                                                                              │
│ **角色扮演任务**：例如，创建一个健康顾问角色，为用户提供饮食和锻炼建议。通过思维链方式逐步提供健  │
│ 康方案。                                                                                          │
│    - **代码生成任务**：利用 CodePromptTemplateDict 创建一个任务                                   │
│ Agent，帮助用户学习新的编程语言，逐步生成学习计划，包括基本概念、代码示例和练习题目。             │
│                                                                                                   │
│ 2. **客户服务**                                                                                   │
│    - **虚拟助手**：创建不同领域的虚拟助手，如技术支持、销售咨询等，提供专业的解答和服务。         │
│    - **客户互动**：通过角色扮演机制，模拟客户与服务人员的对话，提高服务质量。                     │
│                                                                                                   │
│ 3. **多智能体协作**                                                                               │
│    -                                                                                              │
│ **复杂任务处理**：在多智能体系统中，通过角色扮演机制协调多个智能体的协作，完成复杂的任务。例如，  │
│ 交通管理、分布式机器人系统、经济市场模拟等。                                                      │
│    - **团队合作**：模拟团队成员之间的互动，提高团队协作效率。                                     │
│                                                                                                   │
│ 4. **研究与开发**                                                                                 │
│    -                                                                                              │
│ **对话数据生成**：利用角色扮演生成对话数据，用于研究代理社会的行为和能力，为调查对话语言模型提供  │
│ 宝贵的资源。                                                                                      │
│    - **行为分析**：通过角色扮演模拟不同情境下的对话，分析智能体的行为和决策过程。                 │
│                                                                                                   │
│ #### 三、总结                                                                                     │
│                                                                                                   │
│ CAMEL 框架的 RolePlaying                                                                          │
│ 机制通过角色定义、交互规则和关键机制，确保智能体在对话过程中保持角色一致性，提供高质量的回复。这  │
│ 一机制广泛应用于教育、客户服务、多智能体协作和研究开发等多个领域，为实现复杂任务提供了有力支持。  │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
================================================================================
💾 是否保存结果到文件? [y/n] (n): n
🔄 是否继续查询? [y/n] (y): y

💭 请输入您的问题 ():  详细说明camel框架roleplaying的特点以及使用场景

🔍 选择检索模式
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 模式         ┃ 描述              ┃ 特点                     ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1. 快速检索  │ 基础向量检索      │ 速度快，适合简单查询     │
│ 2. 深度检索  │ 查询重写+HyDE+RRF │ 准确度高，适合复杂查询   │
│ 3. 主题检索  │ PDF+网页综合分析  │ 信息全面，适合研究性查询 │
└──────────────┴───────────────────┴──────────────────────────┘
请选择检索模式 [1/2/3] (1): 3
⏳ 正在执行主题检索...
⏱ 开始监控: enhanced_query_主题检索

🔍 执行主题检索: 详细说明camel框架roleplaying的特点以及使用场景
============================================================
🌐 执行主题检索...
📄 步骤1: PDF文档检索
⏱ 开始监控: vector_query
✅ 检索到 5 个相关文档
✓ 操作完成: vector (耗时: 0.08s, 内存: 1879.9MB)
🔍 步骤2: 网页研究

开始网页研究: 详细说明camel框架roleplaying的特点以及使用场景
==================================================
使用DuckDuckGo搜索...
⚠ DuckDuckGo搜索失败: https://duckduckgo.com/?q=%E8%AF%A6%E7%BB%86%E8%AF%B4%E6%98%8Ecamel%E6%A1%86%E6%9E%B6roleplaying%E7%9A%84%E7%89%B9%E7%82%B9%E4%BB%A5%E5%8F%8A%E4%BD%BF%E7%94%A8%E5%9C%BA%E6%99%AF 202 Ratelimit
使用备用搜索方法...
✓ 备用搜索完成，生成 3 个模拟结果
✓ 找到 3 个搜索结果
正在获取网页内容 1/3: 关于详细说明camel框架roleplaying的特点以及使用场景的学术资源...
✓ 成功获取内容 (706字符)
正在获取网页内容 2/3: 详细说明camel框架roleplaying的特点以及使用场景 - 维基百科...
✓ 成功获取内容 (3003字符)
正在获取网页内容 3/3: 详细说明camel框架roleplaying的特点以及使用场景技术文档...
⚠ 网页内容获取失败 (https://docs.example.com): HTTPSConnectionPool(host='docs.example.com', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLEOFError(8, '[SSL: UNEXPECTED_EOF_WHILE_READING] EOF occurred in violation of protocol (_ssl.c:1006)')))
⚠ 内容获取失败
✓ 网页研究完成，分析了 2 个网页
🧩 步骤3: 综合分析
API调用尝试 1/3
✓ API调用成功
✓ 操作完成: enhanced (耗时: 34.56s, 内存: 1867.2MB)

================================================================================
╭──────────────────────────────────────────── 查询信息 ─────────────────────────────────────────────╮
│ 🔍 查询: 详细说明camel框架roleplaying的特点以及使用场景                                           │
│ 🔧 方法: 主题检索(PDF+网页)                                                                       │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭─────────────────────────────────────────── 💡 生成答案 ───────────────────────────────────────────╮
│ **CAMEL框架中的RolePlaying机制详解及其应用场景**                                                  │
│                                                                                                   │
│ ### 特点                                                                                          │
│                                                                                                   │
│ 1. **角色扮演（Role-Playing）**：                                                                 │
│    -                                                                                              │
│ **角色定义**：CAMEL框架中的RolePlaying机制允许为不同的智能体（Agent）定义独特的角色，如“健康顾问” │
│ 、“股票交易员”等。每个角色都有明确的目标和行为准则，确保智能体在交互中保持角色一致性。            │
│    - **角色固定**：防止智能体在对话中角色翻转，确保对话的稳定性和连贯性。                         │
│                                                                                                   │
│ 2. **交互规则**：                                                                                 │
│    - **系统消息**：通过预定义的系统消息（System                                                   │
│ Message），为智能体设定交互规则。例如，智能体必须始终记得自己的角色，不得指令用户，如果无法执行任 │
│ 务则应诚实地拒绝。                                                                                │
│    - **格式规范**：要求智能体的回复具有固定的开始和结束格式，如“Solution: <YOUR_SOLUTION>”和“Next │
│ request.”，确保对话的结构化和清晰度。                                                             │
│                                                                                                   │
│ 3. **大语言模型（LLMs）**：                                                                       │
│    -                                                                                              │
│ **认知增强**：每个智能体都使用大语言模型来增强其认知能力，使其能够理解和生成自然语言，从而有效地  │
│ 解释指令、生成响应并参与复杂对话。                                                                │
│                                                                                                   │
│ 4. **记忆（Memory）**：                                                                           │
│    - **上下文记忆**：智能体能够记住对话的历史，以便在对话中做出更合理的回应。                     │
│    - **外部记忆**：智能体还可以访问外部知识库，以获取更多背景信息和支持。                         │
│                                                                                                   │
│ 5. **工具（Tools）**：                                                                            │
│    -                                                                                              │
│ **具身化能力**：智能体可以使用一系列工具与外部世界交互，如调用API、查询数据库等，这些工具增强了智 │
│ 能体的实用性和灵活性。                                                                            │
│                                                                                                   │
│ 6. **通信（Communication）**：                                                                    │
│    -                                                                                              │
│ **灵活通信**：CAMEL框架支持智能体之间的灵活通信，允许它们在多智能体系统中进行协作或竞争，以实现更 │
│ 复杂的行为和决策。                                                                                │
│                                                                                                   │
│ 7. **推理（Reasoning）**：                                                                        │
│    - **规划与学习**：智能体具备规划能力和奖励学习机制，能够优化任务完成的过程，提高效率和效果。   │
│                                                                                                   │
│ ### 应用场景                                                                                      │
│                                                                                                   │
│ 1. **教育与培训**：                                                                               │
│    -                                                                                              │
│ **个性化教学**：通过角色扮演，智能体可以根据学生的需求提供个性化的教学内容，如逐步生成编程学习计  │
│ 划，包括基本概念、代码示例和练习题目。                                                            │
│    - **模拟训练**：在医疗、军事等领域，智能体可以模拟专家或对手，为学员提供真实的训练环境。       │
│                                                                                                   │
│ 2. **客户服务**：                                                                                 │
│    - **虚拟助手**：智能体可以扮演客服代表，为用户提供产品咨询、技术支持等服务，提升客户体验。     │
│    - **情感支持**：智能体可以扮演心理顾问，为用户提供情感支持和心理健康建议。                     │
│                                                                                                   │
│ 3. **金融与交易**：                                                                               │
│    - **交易机器人**：智能体可以开发为交易机器人，协助用户进行股票市场分析和交易决策。             │
│    - **风险管理**：智能体可以通过角色扮演模拟不同的市场情景，帮助用户评估和管理投资风险。         │
│                                                                                                   │
│ 4. **娱乐与游戏**：                                                                               │
│    - **互动故事**：智能体可以参与创造互动故事，与用户进行动态对话，提供沉浸式的娱乐体验。         │
│    - **多人游戏**：在多人在线游戏中，智能体可以扮演NPC（非玩家角色），增加游戏的真实感和趣味性。  │
│                                                                                                   │
│ 5. **科研与实验**：                                                                               │
│    -                                                                                              │
│ **社会行为研究**：通过角色扮演生成对话数据，研究社会行为和群体动态，为社会科学提供宝贵的数据资源  │
│ 。                                                                                                │
│    - **技术验证**：智能体可以在模拟环境中验证新技术的效果，如自动驾驶算法、机器人协作等。         │
│                                                                                                   │
│ ### 总结                                                                                          │
│                                                                                                   │
│ CAMEL框架的RolePlaying机制通过角色定义、交互规则、大语言模型、记忆、                              │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
================================================================================
💾 是否保存结果到文件? [y/n] (n): n
🔄 是否继续查询? [y/n] (y): y

💭 请输入您的问题 ():  详细说明camel框架roleplaying的特点以及使用场景

🔍 选择检索模式
┏━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━┓
┃ 模式         ┃ 描述              ┃ 特点                     ┃
┡━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━┩
│ 1. 快速检索  │ 基础向量检索      │ 速度快，适合简单查询     │
│ 2. 深度检索  │ 查询重写+HyDE+RRF │ 准确度高，适合复杂查询   │
│ 3. 主题检索  │ PDF+网页综合分析  │ 信息全面，适合研究性查询 │
└──────────────┴───────────────────┴──────────────────────────┘
请选择检索模式 [1/2/3] (1): 1
⏳ 正在执行快速检索...
⏱ 开始监控: enhanced_query_快速检索

🔍 执行快速检索: 详细说明camel框架roleplaying的特点以及使用场景
============================================================
⚡ 执行快速检索...
⏱ 开始监控: vector_query
✅ 检索到 3 个相关文档
✓ 操作完成: vector (耗时: 0.07s, 内存: 1864.9MB)
API调用尝试 1/3
✓ API调用成功
✓ 操作完成: enhanced (耗时: 11.97s, 内存: 1860.7MB)

================================================================================
╭──────────────────────────────────────────── 查询信息 ─────────────────────────────────────────────╮
│ 🔍 查询: 详细说明camel框架roleplaying的特点以及使用场景                                           │
│ 🔧 方法: 快速检索                                                                                 │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯

📄 检索到的文档 (共3个):
╭───────────────────────────────────────────── 文档 1 ──────────────────────────────────────────────╮
│ 相关度分数: 0.8732                                                                                │
│ 内容预览: 如果你无法回答问题就说我不知道。                                                        │
│ """                                                                                               │
│                                                                                                   │
│ model = ModelFactory.create(                                                                      │
│         model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,                                 │
│         model_type="Qwen/Qwen2.5-72B-Instruct",                                                   │
│         url='https://api-infe...                                                                  │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 2 ──────────────────────────────────────────────╮
│ 相关度分数: 0.8648                                                                                │
│ 内容预览:                                                                                         │
│ 2. 使用API 调用模型                                                                               │
│ 类 Unix 系统（Linux / macOS）                                                                     │
│   在终端执行：                                                                                    │
│ export MODELSCOPE_SDK_TOKEN="你的ModelScope 令牌"                                                 │
│ Windows 系统                                                                                      │
│   命令提示符（CMD）：                                                                             │
│ set MODELSCOPE_SDK_TOKEN="你的ModelScope 令牌"                                                    │
│   PowerShell：                                                                                    │
│ $env:MODELSCOP...                                                                                 │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭───────────────────────────────────────────── 文档 3 ──────────────────────────────────────────────╮
│ 相关度分数: 0.8580                                                                                │
│ 内容预览: 和结构化对话机制，实现智能体之间的有效协作。                                            │
│ 在CAMEL 框架中，ChatAgent 是最基础的智能体单元，负责处理对话逻辑和任务执行。而                    │
│ RolePlaying 和Workforce 则是多智能体系统，用于协调多个智能体的协作。                              │
│ 详见我们的开源仓库和项目主页                                                                      │
│ •                                                                                                 │
│ 论文：https://ghli.org/camel.pdf                                                                  │
│ •                                                                                                 │
│ 项目主页：https://www.camel-ai.o...                                                               │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
╭─────────────────────────────────────────── 💡 生成答案 ───────────────────────────────────────────╮
│ **Camel框架RolePlaying的特点：**                                                                  │
│                                                                                                   │
│ 1.                                                                                                │
│ **角色定义明确**：RolePlaying机制中，每个智能体都有明确的角色定义，如Assistant（执行任务）、User  │
│ （提供指令）及特定领域的专家角色（如程序员、交易员等），确保智能体在对话中扮演合适的角色。        │
│ 2.                                                                                                │
│ **防止角色翻转**：通过预设的规则和提示词，智能体被设计为不会忘记自己的角色身份，避免了角色间的混  │
│ 淆，保证了对话的连贯性和逻辑性。                                                                  │
│ 3.                                                                                                │
│ **固定格式的回复**：为了提高交流的效率和清晰度，智能体的回复被要求采用固定的格式，例如以“Solution │
│ :”开头，“Next request.”结尾，使得用户能够快速理解智能体的回应。                                   │
│ 4.                                                                                                │
│ **解决常见问题**：RolePlaying机制还解决了智能体间可能遇到的其他问题，如助手重复指令、产生模糊回复 │
│ 、消息无限循环以及对话过早或不当终止等问题。                                                      │
│                                                                                                   │
│ **使用场景：**                                                                                    │
│                                                                                                   │
│ 1.                                                                                                │
│ **多智能体协作**：在需要多个智能体协同工作的场景中，RolePlaying可以帮助这些智能体有效地分工合作， │
│ 比如在虚拟团队中模拟不同角色进行项目管理。                                                        │
│ 2.                                                                                                │
│ **教育和培训**：在教育领域，RolePlaying可以用于创建模拟情景，让学生或员工在其中扮演特定角色，通过 │
│ 互动学习解决问题的方法和技巧。                                                                    │
│ 3.                                                                                                │
│ **客户服务**：在客服行业中，RolePlaying可以用来模拟客户与服务代表之间的对话，提高服务人员的应对能 │
│ 力和沟通技巧。                                                                                    │
│ 4.                                                                                                │
│ **研究和开发**：对于研究对话系统和多智能体系统的学者和开发者，RolePlaying提供了一个强大的工具，用 │
│ 于测试和改进算法，研究智能体的社会行为和交互模式。                                                │
╰───────────────────────────────────────────────────────────────────────────────────────────────────╯
================================================================================
💾 是否保存结果到文件? [y/n] (n): n 
🔄 是否继续查询? [y/n] (y): n

============================================================
📊 最终性能报告
============================================================

============================================================
性能监控报告
============================================================
总操作数: 12
整体成功率: 100.0%
总耗时: 284.34秒
平均耗时: 23.69秒
平均内存使用: 1902.5MB

操作详情:
------------------------------------------------------------
add:
  调用次数: 1
  成功率: 100.0%
  平均耗时: 92.37秒
  平均内存: 2280.5MB

setup:
  调用次数: 1
  成功率: 100.0%
  平均耗时: 92.39秒
  平均内存: 2280.5MB

vector:
  调用次数: 7
  成功率: 100.0%
  平均耗时: 0.14秒
  平均内存: 1818.0MB

enhanced:
  调用次数: 3
  成功率: 100.0%
  平均耗时: 32.87秒
  平均内存: 1847.9MB

============================================================
💾 是否保存结果到文件? [y/n] (n): n
✅ 感谢使用增强的交互式多模态RAG系统!

Agent-camel框架学习记录（4）

Posted on 2025-07-21 Edited on 2025-07-24 In 学习笔记

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

检索增强生成 (RAG) 简介及关键组件

RAG 概述

检索增强生成（RAG）是一种增强生成式AI模型（特别是LLM）准确性和可靠性的技术。它通过从外部知识源中检索相关事实信息，并将这些信息提供给LLM，从而使模型能够生成更权威、有出处且减少“幻觉”的答案。

RAG 的核心优势

提供可信来源：为AI模型的输出提供“脚注”，用户可以查证，增强信任。
减少“幻觉”：弥补LLM在特定或最新信息方面的不足，降低模型“编造”答案的可能性。
实现简单高效：相对于重新训练模型，RAG实现成本更低、速度更快，且支持信息源的即时更新。
广泛应用性：可与各种数据存储库结合，应用于医疗、金融、客户服务、员工培训等几乎所有行业。

CAMEL 框架中的 RAG 组件

在 CAMEL 框架中，RAG 的实现主要依赖于数据加载和数据嵌入这两个核心环节，以构建智能问答系统和对话Agent等应用。

1. Loaders (数据加载器)
Loaders 是 CAMEL 框架中用于数据加载、预处理和结构化的模块，旨在将各种格式的数据转化为LLM可处理的形式。

**Base IO：
功能：处理与文件相关的基础输入/输出操作，能够读取PDF等多种文件格式，提取内容并表示为 File 对象。
示例：从本地PDF文件读取内容。

**Unstructured IO：
功能：专注于非结构化数据（如文件、URL内容）的解析、清洗、提取和分块。其核心在于高级 **ETL（提取、转换、加载）**能力，为RAG等应用准备数据。

**关键方法：
parse_file_or_url：从文件或URL加载并解析数据。
clean_text_data：执行多种文本清洗操作（如替换引号、清理破折号、去除多余空白）。
extract_data_from_text：从文本中提取特定类型信息（如邮件地址）。
chunk_elements：对解析后的内容进行分块，优化检索效率。
stage_elements：为不同平台或下游处理准备数据元素。

使用示例：

# 设置示例脏文本
example_dirty_text = ("\x93Some dirty text â€™ with extra spaces and – dashes.一些包含额外空格和破折号的脏文本â€™。")
# 设置清理选项   
options = [
    ('replace_unicode_quotes', {}),  # 替换Unicode引号
    ('clean_dashes', {}),           # 清理破折号
    ('clean_non_ascii_chars', {}),  # 清理非ASCII字符
    ('clean_extra_whitespace', {}), # 清理多余空白
]
cleaned_text = uio.clean_text_data(text=example_dirty_text,
                                   clean_options=options)
print(cleaned_text)

目前支持的清理操作：

- replace_unicode_quotes: 将Unicode引号替换为标准引号
- clean_dashes: 清理破折号，统一格式
- clean_non_ascii_chars: 清理非ASCII字符
- clean_extra_whitespace: 清理多余空白
- clean_bullets: 清理项目符号
- clean_ordered_bullets: 清理有序列表符号
- clean_postfix: 清理后缀
- clean_prefix: 清理前缀
- clean_trailing_punctuation: 清理尾部标点
- group_broken_paragraphs: 合并断开的段落
- remove_punctuation: 移除标点符号
- bytes_string_to_string: 将字节字符串转换为普通字符串
- translate_text: 翻译文本

2. Embeddings (嵌入)
概念：嵌入是将不同类型的数据（文本、图像、视频）转化为机器可理解的数值向量的过程，这些向量能够捕获数据的核心特征和语义含义。

**文本嵌入：
功能：将文本数据转换为数值向量，使机器能够基于语义相似性而非字面匹配来处理和比较文本。
意义：实现信息检索、问答系统、文本聚类与分类等高级语义处理任务。

常用模型技术：
OpenAIEmbedding / OpenAICompatibleEmbedding：基于大规模LLM生成嵌入，理解复杂语境。
SentenceTransformerEncoder：专为句子级别语义表示设计，适用于高效语义搜索。
MistralEmbedding：基于Mistral模型的嵌入方法。

**图像嵌入：
功能：将图像转化为数值向量，表示图像的视觉特征（形状、颜色、纹理等），使机器能够理解图像内容。
意义：应用于图像分类、相似性比较、图像检索（如以图搜图）。
实现：通常依赖CNN（如ResNet）或Vision Transformer模型。

CAMEL支持：VisionLanguageEmbedding 类（如基于CLIP），能同时处理图像和文本，生成多模态嵌入。

通过结合 Loaders 进行高效的数据准备和 Embeddings 进行语义理解，CAMEL 框架为构建强大且可靠的 RAG 系统提供了坚实的基础。

存储 (Storages) 与检索 (Retrievers)组件

1. Storages (数据存储)

概念：CAMEL 框架中的 Storage 模块是一个统一的数据存储与管理层，提供标准接口处理多种数据类型，为 RAG 应用奠定基础。

键值存储 (Key-Value Storage)
- BaseKeyValueStorage：抽象基类，用于标准化键值数据的保存、加载和清除操作，通常通过Python字典接口交互。
- InMemoryKeyValueStorage：具体实现，数据存储在内存中，适用于开发、测试和临时存储（数据易失）。
向量存储 (Vector Store)
- 目的：存储高维度向量数据（如嵌入表示），支持高效相似度计算和最近邻搜索，是 RAG 中检索相关信息的核心。
- 特点：高性能、可扩展、灵活（支持多种相似度度量，如点积、余弦、欧氏距离）。
- BaseVectorStorage：抽象基类，定义了添加、删除、查询向量和管理数据库状态等操作。
- MilvusStorage：与云原生向量搜索引擎 Milvus 集成，优化大规模向量检索。
- QdrantStorage：与 Qdrant 向量搜索引擎集成，提供高效的向量存储、管理和 ANN 搜索，适用于推荐系统、NLP嵌入查询等。
图存储 (Graph Storage)
- 目的：存储和管理图数据（节点、边），支持复杂的图查询和分析。
- BaseGraphStorage：抽象基类，定义了获取客户端、模式管理、添加/删除三元组和执行图查询等操作。
- NebulaGraph：与分布式图数据库 NebulaGraph 集成，适用于知识图谱、社交网络分析等大规模图数据场景。
- Neo4jGraph：与行业领先的图数据库 Neo4j 集成，利用其关系建模和高效查询能力，适用于知识图谱、诈骗检测等。

2. Retrievers (信息检索器)

概念：Retrievers 模块充当“搜索引擎”，负责在海量数据中高效查找特定信息，支持向量检索和关键词检索。

向量检索器 (Vector Retriever)
- 原理：将数据（文本、图像）通过嵌入模型转化为高维向量，存储在向量存储中。查询时，将查询转换为向量，并在向量存储中寻找语义上最接近的匹配。
- 优势：擅长语义搜索，理解自然语言的模糊关系，适用于推荐系统、语义查询和跨模态搜索。
- VectorRetriever：
  - 初始化：可选择传入嵌入模型（如 SentenceTransformerEncoder），否则默认使用 OpenAIEmbedding。
  - process()：处理内容（文件/URL），分块，并将嵌入存储到指定的向量存储（如 QdrantStorage）中。
  - query()：根据查询字符串从存储中检索最匹配的信息。
关键词检索器 (Keyword Retriever)
- 原理：对文档进行预处理（如分词、建立索引），直接解析用户查询的关键词并匹配相应文档内容。
- 优势：依赖关键词精确匹配，适合快速查找特定术语或短语。
- 特点：
  更细粒度的控制：你需要手动导入并初始化 QdrantStorage，明确指定 vector_dim、collection_name 和 path。
  
  分步操作：process() 方法用于内容的嵌入和存储，query() 方法用于查询。这两个步骤是分开的。
  
  适用场景：当你需要对向量存储的配置（如集合名称、存储路径）有更精确的控制，或者需要分步执行数据的处理和查询时，这种方式更合适。例如，你可能想先处理大量数据并存储，然后再在不同的时间点执行查询。
自动化检索 (AutoRetriever)
- 功能：简化检索流程，自动处理嵌入、数据存储和查询。
- run_vector_retriever()：接受多个内容输入路径和查询字符串，自动执行向量检索过程，并可返回详细元数据。适用于批量内容处理和查询。
- 特点：
  更高的抽象级别：AutoRetriever 封装了 VectorRetriever 和底层存储（如 QdrantStorage）的创建和配置细节。你只需指定 vector_storage_local_path 和 storage_type。
  
  一步到位：run_vector_retriever() 方法将内容的嵌入、存储和查询整合到一个函数调用中。这大大简化了代码。
  便捷性：更适合快速原型开发、演示或当你不需要对底层存储有过多自定义控制时。它提供了开箱即用的体验。
  简化的配置：不需要手动计算 vector_dim，AutoRetriever 会自动处理。它还会为你生成默认的集合名称。
两种检索方式的区别与优劣
- 如果你追求快速实现和代码简洁，AutoRetriever 是更好的选择。如果你需要对向量存储的底层配置和操作流程有更多控制，那么使用 VectorRetriever 结合手动配置会更合适。

Storages 模块提供了 RAG 所需的底层数据基础设施，而 Retrievers 模块则在此基础上实现了高效的信息查找能力，两者协同工作，使得 RAG 能够精准地从外部知识中获取相关上下文，并将其反馈给LLM进行增强生成。

向量数据库及其在知识库搭建中的应用

1. 向量数据库 (Vector Database) 介绍

概念：向量数据库是一种专门用于存储、管理和检索高维向量数据的数据库系统。它在现代AI和机器学习应用中至关重要，因为文本、图像、音频等数据常被转换为高维向量（即嵌入），以捕捉其语义或特征。

主要功能：

向量存储：高效存储大规模高维向量数据，通常还可关联元数据（描述性信息）。
相似度搜索：核心功能，通过高效的近似最近邻（ANN）搜索算法，快速找到与查询向量语义最相似的向量集合。
扩展性：支持水平扩展，以应对不断增长的数据存储和计算需求。

常见应用：

推荐系统：根据用户行为或偏好，检索并推荐相似的产品或内容。
图像和视频搜索：通过内容（而非关键词）检索相似的图像或视频。
自然语言处理（NLP）：在嵌入空间中查找语义相似的文本或词语，支持语义搜索、问答系统等。

实现技术：

向量数据库通常采用以下算法和数据结构来实现高效的相似度搜索：

HNSW (Hierarchical Navigable Small World) 图：一种基于图的ANN搜索算法，以其高查询效率和准确性而闻名。
局部敏感哈希 (LSH)：通过哈希函数将相似向量映射到相同“桶”中，实现快速检索。
产品量化 (PQ)：通过将向量分解并量化来减少存储和计算成本。

常见向量数据库系统：

Milvus：开源向量数据库，支持亿级向量的高效存储和检索。
Pinecone：提供向量数据库即服务 (DBaaS)，简化管理和查询。
Weaviate：开源向量搜索引擎，支持多种数据模式和扩展。

CAMEL 框架中的向量数据库集成：

CAMEL 框架通过 camel.storages.vectordb_storages 包提供了与多种向量数据库的交互能力：

base 模块：定义了向量存储的基础类和接口（如 BaseVectorStorage、VectorDBQuery、VectorDBQueryResult）。
milvus 模块：实现与 Milvus 数据库的交互（MilvusStorage）。
qdrant 模块：实现与 Qdrant 数据库的交互（QdrantStorage）。
weaviate 模块：实现与 Weaviate 数据库的交互（WeaviateStorage）。

这种模块化设计使得 CAMEL 能够灵活适应不同的应用需求和向量数据库选择。

2. 知识库搭建流程中的数据处理

搭建高效的知识库是 RAG 应用成功的关键，其中数据预处理和嵌入模型选择至关重要。

Embedding 模型选择：

选择合适的嵌入模型是构建知识库的第一步。

Embedding API 服务 (e.g., OpenAI, Cohere, Mistral)：
- 优点：方便易用，无需本地部署和管理模型。
- 适用场景：项目或工程中对数据隐私要求不高，且预算充足的情况。
开源 Embedding 模型 (Open Embedding Model)：
- 优点：数据隐私性好，可本地部署，提供更多自定义和微调空间。
- 适用场景：对数据隐私有严格要求，或需要针对特定任务优化模型性能的情况。
选择标准：没有绝对的“最好”，只有“最适合”。建议构建应用场景专有评测集，通过量化评估来选择最适合自身数据的模型。

数据预处理：

数据预处理是保证 RAG 系统高质量输出的关键步骤，遵循“Garbage in, Garbage out”原则。

目的：将原始、多样化的数据转化为LLM和嵌入模型能够高效处理的统一格式，并去除噪声。
常用手段：
1. 数据读取：从各种来源（文件、数据库、API）获取原始数据。
2. 数据格式转换：将不同格式（如PDF、TXT、DOC、PPT）的数据统一转换为便于模型处理的格式，Markdown 格式是常用的选择。
3. 数据清洗：
  - 去除噪声：移除不相关或干扰信息。
  - 纠正错误：修正拼写、语法错误等。
  - 信息筛选：提取核心信息，过滤冗余内容。

构建RAG应用：从基础到优化

RAG（Retrieval Augmented Generation，检索增强生成）是一种结合检索和生成的技术路线，旨在增强大型语言模型（LLM）的能力，解决其在时效性和幻觉方面的问题。

1. Basic RAG

1.1 RAG 的核心思想

当LLM处理大量文本（例如数千篇文档、上亿个token）时，直接将所有文本作为上下文输入给LLM会迅速超出其上下文长度限制。RAG的核心思想是：

检索（Retrieval）：从海量文本数据中智能地检索与用户查询最相关的少量信息片段。
增强生成（Augmented Generation）：将检索到的相关信息作为上下文合并到用户Prompt中，然后交付给LLM进行回复生成。

1.2 CAMEL 框架中的检索器

CAMEL 框架通过 camel.retrievers 模块实现了检索功能，主要分为两大类：

VectorRetriever (向量检索器)：
- 工作流：
  1. 分块：将大型文档分解为较小的文本块。
  2. 嵌入：使用嵌入模型（如 SentenceTransformerEncoder）将每个文本块转换为高维向量。
  3. 存储：将这些向量存储在向量数据库（如 QdrantStorage）中。
  4. 检索：当用户查询时，将查询转换为向量，在向量数据库中搜索相似度高（通常使用余弦相似度）的匹配向量，并返回最相关的信息片段。
- process() 函数：CAMEL 封装了文件读取、切块、嵌入和存储的整个流程，简化了RAG应用的搭建。
BM25Retriever (关键词检索器)：
- 工作原理：从稀疏的关键词维度进行文本召回，通过关键词匹配算法筛选出最相关的文本片段。

1.3 Basic RAG 实践步骤

读取示例数据：下载并准备作为知识库的原始文档（例如PDF文件）。
实例化嵌入模型：选择并加载合适的嵌入模型（例如本地的 SentenceTransformerEncoder）。
向量嵌入和存储数据：
- 创建并初始化向量数据库实例（如 QdrantStorage）。
- 实例化 VectorRetriever，并将其与嵌入模型和向量存储关联。
- 调用 vr.process(content=...) 方法，将文档读取、分块、嵌入并存储到向量数据库中。
执行检索：
- 使用 vr.query(query=..., top_k=..., similarity_threshold=...) 方法，根据用户查询从向量数据库中检索最相关的信息片段。
- top_k：指定返回最相关片段的数量。
- similarity_threshold：设置相似度阈值，确保检索内容的相关性。
- 对于不相关查询，检索器在达到相似度阈值时会返回“No suitable information retrieved”等提示。
结合LLM生成回复：
- 实例化一个LLM模型或Agent（例如 CAMEL 中的 ChatAgent）。
- 将检索到的信息片段（通常是 results[0]["text"]）作为上下文传递给Agent。
- 通过 Agent 的 step() 方法，LLM结合检索到的上下文生成最终回复。
- 可以将整个过程封装成一个函数，实现自动检索和生成。

import os
import requests

os.makedirs('local_data', exist_ok=True)

url = "https://arxiv.org/pdf/2303.17760.pdf"
response = requests.get(url)
with open('local_data/camel_paper.pdf', 'wb') as file:
    file.write(response.content)

from camel.embeddings import SentenceTransformerEncoder
from camel.retrievers import VectorRetriever

# 初始化一个 SentenceTransformerEncoder 模型，选用 'intfloat/e5-large-v2' 模型，用于将文本转化为向量嵌入。
embedding_model=SentenceTransformerEncoder(model_name='intfloat/e5-large-v2')


# 创建并初始化一个向量数据库 (以QdrantStorage为例)
from camel.storages.vectordb_storages import QdrantStorage

# 创建 QdrantStorage 实例，配置向量维度（由嵌入模型决定）、
# 集合名称（"demo_collection"）、存储路径（"storage_customized_run"）和集合别名（"论文"）。
vector_storage = QdrantStorage(
    vector_dim=embedding_model.get_output_dim(),
    collection="demo_collection",
    path="storage_customized_run",
    collection_name="论文"
)
# 初始化VectorRetriever实例并使用本地模型作为嵌入模型
vr = VectorRetriever(embedding_model= embedding_model,storage=vector_storage)
# 将文件读取、切块、嵌入并储存在向量数据库中，这大概需要1-2分钟
vr.process(
    content="local_data/camel_paper.pdf"
)

# 设定一个查询语句
query = "CAMEL是什么"

# 执行查询并获取结果
results = vr.query(query=query, top_k=1)
print(results)

print(results[0]["text"])

retrieved_info_irrevelant = vr.query(
    query="Compared with dumpling and rice, which should I take for dinner?",
    top_k=1,
    similarity_threshold=0.8
)

print(retrieved_info_irrevelant)


from camel.agents import ChatAgent
from camel.models import ModelFactory
from camel.types import ModelPlatformType

from dotenv import load_dotenv
import os

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')


retrieved_info = vr.query(
    query="what is roleplaying?",
    top_k=1,
)

assistant_sys_msg = """
你是一个帮助回答问题的助手，
我会给你原始查询和检索到的上下文，
根据检索到的上下文回答原始查询，
如果你无法回答问题就说我不知道。
"""

model = ModelFactory.create(
        model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
        model_type="Qwen/Qwen2.5-72B-Instruct",
        url='https://api-inference.modelscope.cn/v1/',
        api_key=api_key
    )

# 获取查询“什么是角色扮演”的检索结果的文本内容作为用户消息。
user_msg = retrieved_info[0]['text']
print(user_msg + '\n')

agent = ChatAgent(assistant_sys_msg,model=model)
# 使用step方法获得最终的检索增强生成的回复并打印
assistant_response = agent.step(user_msg)
print(assistant_response.msg.content)

2. Rewriting (查询改写/澄清)

在实际应用中，用户查询可能存在错别字、语义模糊或表达不准确等问题，这会严重影响RAG系统的检索和生成质量。Rewriting 模块旨在优化和提高原始查询的质量。

2.1 优化策略

错字校正：修正用户输入中的拼写错误。
句式调整：重构查询，使其表达更通顺严谨。
LLM 自我调整：利用LLM（通过提示词工程）对原始查询进行优化和重写。

"""
RAG查询重写测试脚本

该脚本用于测试RAG（检索增强生成）系统中的查询重写功能。
主要功能是接收用户的原始查询，通过AI模型对查询进行优化和重写，
修正错别字并提高查询的准确性和表达质量。
"""

# 用户的原始查询（包含错别字和表达不清晰的问题）
# 注意：这里的查询包含了一些错别字，如"盖"应为"该"，"冲服"应为"冲突"
original_query = "我盖如何解决CAMEL中文档冲服的问题问题呢，几个版本的文档可能存在代码结构的冲突"

# 系统消息：定义AI助手的角色和任务
# 该消息告诉AI它是一个专门用于查询重写的助手
sys_msg = '你是RAG模块中的Rewriting助手，目的是理解用户的提问，并且重新组织和优化用户的提问表达，修正用户输入中可能存在的错别字的情况并重构提问来使得句子表达更加通顺严谨'

# 导入CAMEL框架相关模块
from camel.models import ModelFactory          # 模型工厂，用于创建不同类型的模型
from camel.types import ModelPlatformType      # 模型平台类型的枚举
from camel.agents import ChatAgent             # 聊天代理类

# 导入环境变量和操作系统相关模块
from dotenv import load_dotenv  # 用于加载.env文件中的环境变量
import os                       # 操作系统接口模块

# 加载环境变量文件(.env)
load_dotenv()

# 从环境变量中获取ModelScope的API密钥
# ModelScope是阿里云推出的机器学习模型平台
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 创建AI模型实例
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,  # 使用OpenAI兼容的模型平台
    model_type="Qwen/Qwen2.5-72B-Instruct",                   # 指定具体的模型类型
    url='https://api-inference.modelscope.cn/v1/',             # ModelScope API的推理端点
    api_key=api_key                                            # API密钥用于身份验证
)

# 创建聊天代理
# 将系统消息和模型绑定到代理上
agent = ChatAgent(system_message=sys_msg, model=model)

# 构造用户消息，要求AI对原始查询进行重写
# 这里使用f-string格式化字符串，将原始查询嵌入到提示中
usr_msg = f'用户的原始提问如下：{original_query}，请优化重写并直接输出新的Query。新的Query: '

# 让AI代理处理用户消息并生成响应
response = agent.step(usr_msg)

# 输出AI重写后的查询结果
# response.msgs[0].content 包含了AI生成的重写后的查询
print(response.msgs[0].content)

2.2 其他高级 Rewriting 技巧

子问题策略（Sub-Query）：将主问题分解为更具体的子问题，帮助系统深入理解并提高检索准确性。
HyDE (Hypothetical Document Embeddings) 查询转换：
- 利用LLM为用户查询生成假设性文档（可能包含错误但与原始查询相关）。
- 通过这些假设文档的嵌入向量，在RAG知识库中检索具有相似向量的真实文档，从而提高检索精度。

以下代码是基于RAGBasic上构建的HyDE模块：

"""
增强版RAG系统：集成查询重写(Rewriting)和假设文档嵌入(HyDE)

该脚本实现了一个增强的RAG系统，结合了以下技术：
1. 查询重写(Query Rewriting)：修正用户查询中的错别字和表达问题
2. HyDE (Hypothetical Document Embeddings)：生成假设文档来改善检索效果
3. 传统RAG检索和生成

HyDE方法的核心思想：
- 使用LLM为用户查询生成假设文档
- 这些假设文档虽然可能包含错误，但与知识库中的真实文档相关联
- 通过假设文档的向量表示来检索相似的真实文档，提高检索准确性
"""

import os
import requests
from typing import List, Dict, Any

# 导入CAMEL框架相关模块
from camel.models import ModelFactory
from camel.types import ModelPlatformType
from camel.agents import ChatAgent
from camel.embeddings import SentenceTransformerEncoder
from camel.retrievers import VectorRetriever
from camel.storages.vectordb_storages import QdrantStorage

# 导入环境变量模块
from dotenv import load_dotenv

class EnhancedRAGSystem:
    """
    增强版RAG系统类
    
    集成了查询重写、HyDE和传统RAG功能
    """
    
    def __init__(self, api_key: str):
        """
        初始化增强版RAG系统
        
        Args:
            api_key: ModelScope API密钥
        """
        self.api_key = api_key
        
        # 初始化嵌入模型
        self.embedding_model = SentenceTransformerEncoder(
            model_name='intfloat/e5-large-v2'
        )
        
        # 初始化向量存储
        self.vector_storage = QdrantStorage(
            vector_dim=self.embedding_model.get_output_dim(),
            collection="enhanced_rag_collection",
            path="storage_enhanced_rag",
            collection_name="增强RAG知识库"
        )
        
        # 初始化向量检索器
        self.vector_retriever = VectorRetriever(
            embedding_model=self.embedding_model,
            storage=self.vector_storage
        )
        
        # 初始化LLM模型
        self.model = ModelFactory.create(
            model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
            model_type="Qwen/Qwen2.5-72B-Instruct",
            url='https://api-inference.modelscope.cn/v1/',
            api_key=self.api_key
        )
        
        # 初始化各种代理
        self._init_agents()
    
    def _init_agents(self):
        """初始化不同功能的AI代理"""
        
        # 查询重写代理
        rewriting_sys_msg = """
        你是RAG模块中的Rewriting助手，目的是理解用户的提问，并且重新组织和优化用户的提问表达，
        修正用户输入中可能存在的错别字的情况并重构提问来使得句子表达更加通顺严谨。
        请直接输出重写后的查询，不要添加额外的解释。
        """
        self.rewriting_agent = ChatAgent(
            system_message=rewriting_sys_msg,
            model=self.model
        )
        
        # HyDE假设文档生成代理
        hyde_sys_msg = """
        你是一个专门生成假设文档的助手。根据用户的查询，生成一个相关的假设文档片段。
        这个文档应该：
        1. 直接回答用户的问题
        2. 包含相关的技术细节和概念
        3. 使用专业但清晰的语言
        4. 长度适中（200-400字）
        
        请直接输出假设文档内容，不要添加额外的解释或格式。
        """
        self.hyde_agent = ChatAgent(
            system_message=hyde_sys_msg,
            model=self.model
        )
        
        # RAG回答生成代理
        rag_sys_msg = """
        你是一个帮助回答问题的助手。
        我会给你原始查询和检索到的上下文信息。
        请根据检索到的上下文回答原始查询。
        如果上下文信息不足以回答问题，请说"根据提供的信息，我无法完全回答这个问题"。
        请确保回答准确、完整且有条理。
        """
        self.rag_agent = ChatAgent(
            system_message=rag_sys_msg,
            model=self.model
        )
    
    def setup_knowledge_base(self, pdf_url: str = None, pdf_path: str = None):
        """
        设置知识库
        
        Args:
            pdf_url: PDF文件的URL
            pdf_path: 本地PDF文件路径
        """
        # 创建本地数据目录
        os.makedirs('local_data', exist_ok=True)
        
        if pdf_url:
            # 下载PDF文件
            print("正在下载PDF文件...")
            response = requests.get(pdf_url)
            pdf_path = 'local_data/knowledge_base.pdf'
            with open(pdf_path, 'wb') as file:
                file.write(response.content)
            print(f"PDF文件已下载到: {pdf_path}")
        
        if pdf_path:
            # 处理PDF文件并建立向量数据库
            print("正在处理PDF文件并建立向量数据库...")
            self.vector_retriever.process(content=pdf_path)
            print("知识库设置完成！")
    
    def rewrite_query(self, original_query: str) -> str:
        """
        重写用户查询
        
        Args:
            original_query: 原始用户查询
            
        Returns:
            重写后的查询
        """
        rewrite_prompt = f"用户的原始提问如下：{original_query}"
        response = self.rewriting_agent.step(rewrite_prompt)
        rewritten_query = response.msgs[0].content.strip()
        
        print(f"原始查询: {original_query}")
        print(f"重写查询: {rewritten_query}")
        
        return rewritten_query
    
    def generate_hypothetical_document(self, query: str) -> str:
        """
        生成假设文档 (HyDE方法)
        
        Args:
            query: 用户查询
            
        Returns:
            生成的假设文档
        """
        hyde_prompt = f"请为以下查询生成一个相关的假设文档：{query}"
        response = self.hyde_agent.step(hyde_prompt)
        hypothetical_doc = response.msgs[0].content.strip()
        
        print(f"生成的假设文档:\n{hypothetical_doc}")
        
        return hypothetical_doc
    
    def retrieve_with_hyde(self, query: str, top_k: int = 3) -> List[Dict[str, Any]]:
        """
        使用HyDE方法进行检索
        
        Args:
            query: 用户查询
            top_k: 返回的文档数量
            
        Returns:
            检索到的文档列表
        """
        # 生成假设文档
        hypothetical_doc = self.generate_hypothetical_document(query)
        
        # 使用假设文档进行检索
        hyde_results = self.vector_retriever.query(
            query=hypothetical_doc,
            top_k=top_k
        )
        
        # 同时使用原始查询进行检索作为对比
        original_results = self.vector_retriever.query(
            query=query,
            top_k=top_k
        )
        
        print(f"\n=== HyDE检索结果 ===")
        for i, result in enumerate(hyde_results):
            print(f"文档 {i+1} (相似度: {result.get('similarity', 'N/A')}):")
            print(f"{result['text'][:200]}...\n")
        
        print(f"=== 原始查询检索结果 ===")
        for i, result in enumerate(original_results):
            print(f"文档 {i+1} (相似度: {result.get('similarity', 'N/A')}):")
            print(f"{result['text'][:200]}...\n")
        
        return hyde_results, original_results
    
    def generate_answer(self, query: str, retrieved_docs: List[Dict[str, Any]]) -> str:
        """
        基于检索到的文档生成答案
        
        Args:
            query: 用户查询
            retrieved_docs: 检索到的文档列表
            
        Returns:
            生成的答案
        """
        # 构建上下文
        context = "\n\n".join([doc['text'] for doc in retrieved_docs])
        
        # 构建提示
        prompt = f"""
        原始查询: {query}
        
        检索到的上下文信息:
        {context}
        
        请根据上述上下文信息回答原始查询。
        """
        
        response = self.rag_agent.step(prompt)
        answer = response.msgs[0].content.strip()
        
        return answer
    
    def enhanced_query(self, original_query: str, use_rewriting: bool = True, 
                      use_hyde: bool = True, top_k: int = 3) -> Dict[str, Any]:
        """
        执行增强版RAG查询
        
        Args:
            original_query: 原始用户查询
            use_rewriting: 是否使用查询重写
            use_hyde: 是否使用HyDE方法
            top_k: 检索文档数量
            
        Returns:
            包含各步骤结果的字典
        """
        print("=" * 60)
        print("开始执行增强版RAG查询")
        print("=" * 60)
        
        results = {
            'original_query': original_query,
            'rewritten_query': None,
            'hypothetical_document': None,
            'retrieved_docs': None,
            'final_answer': None
        }
        
        # 步骤1: 查询重写（可选）
        if use_rewriting:
            print("\n步骤1: 查询重写")
            print("-" * 30)
            rewritten_query = self.rewrite_query(original_query)
            results['rewritten_query'] = rewritten_query
            query_to_use = rewritten_query
        else:
            query_to_use = original_query
        
        # 步骤2: 文档检索
        print(f"\n步骤2: 文档检索")
        print("-" * 30)
        
        if use_hyde:
            print("使用HyDE方法进行检索...")
            hyde_results, original_results = self.retrieve_with_hyde(query_to_use, top_k)
            results['retrieved_docs'] = hyde_results
            results['original_retrieval_docs'] = original_results
            retrieved_docs = hyde_results
        else:
            print("使用传统方法进行检索...")
            retrieved_docs = self.vector_retriever.query(query=query_to_use, top_k=top_k)
            results['retrieved_docs'] = retrieved_docs
        
        # 步骤3: 答案生成
        print(f"\n步骤3: 答案生成")
        print("-" * 30)
        final_answer = self.generate_answer(query_to_use, retrieved_docs)
        results['final_answer'] = final_answer
        
        print(f"\n最终答案:\n{final_answer}")
        
        return results


def main():
    """主函数：演示增强版RAG系统的使用"""
    
    # 加载环境变量
    load_dotenv()
    api_key = os.getenv('MODELSCOPE_SDK_TOKEN')
    
    if not api_key:
        print("错误：请设置MODELSCOPE_SDK_TOKEN环境变量")
        return
    
    # 初始化增强版RAG系统
    print("初始化增强版RAG系统...")
    rag_system = EnhancedRAGSystem(api_key)
    
    # 设置知识库（使用CAMEL论文）
    pdf_url = "https://arxiv.org/pdf/2303.17760.pdf"
    rag_system.setup_knowledge_base(pdf_url=pdf_url)
    
    # 测试查询（包含错别字）
    test_queries = [
        "我盖如何解决CAMEL中文档冲服的问题问题呢，几个版本的文档可能存在代码结构的冲突",
        "CAMEL是什么东东？它有什么特点吗",
        "角色扮演在CAMEL中是怎么实现的"
    ]
    
    for query in test_queries:
        print("\n" + "=" * 80)
        print(f"测试查询: {query}")
        print("=" * 80)
        
        # 执行增强版RAG查询
        results = rag_system.enhanced_query(
            original_query=query,
            use_rewriting=True,
            use_hyde=True,
            top_k=2
        )
        
        print("\n" + "=" * 80)


if __name__ == "__main__":
    main()

3. Rerank (重排)

Rerank 模块用于对初步检索结果进行重新排序，以提高检索精确性和相关性，尤其在多路召回（结合向量相似度、关键词匹配、规则匹配等多种检索方式）场景中尤为重要。多路召回可能导致召回片段数量多且相关度参差不齐。

3.1 重排步骤

初步检索：获取多路召回的初始文档片段。
特征计算：评估每个文档片段与查询的相关性得分。
重新排序：根据特征得分对文档片段进行排序。
选择最佳结果：从重排后的结果中选取前 TOP-K 个作为最终最相关的片段，传递给LLM进行生成。

3.2 评估指标

命中率 (Hit Rate)：在前 k 个检索文档中找到正确答案的查询比例，衡量系统在几次尝试中找到正确答案的频率。
平均倒数排名 (MRR - Mean Reciprocal Rank)：评估系统准确性，根据排名最高的相关文档的倒数排名计算平均值（第一个相关文档排名为1，倒数排名为1；第二个为1/2，以此类推）。MRR和Hit Rate越高，表示Rerank效果越好。

3.3 RRF (Reciprocal Rank Fusion) 算法实践

原理：一种融合多个不同相关性指标结果集的方法，仅依赖排名计算，不要求相关性分数相互关联。
实现：通过遍历来自不同检索器（例如 VectorRetriever 和 BM25Retriever）的结果，计算每个文档的融合分数，然后按分数降序排序并返回前 k 个结果。

实现RRF算法的系统：

"""
增强版RAG系统：集成查询重写(Rewriting)和假设文档嵌入(HyDE)

该脚本实现了一个增强的RAG系统，结合了以下技术：
1. 查询重写(Query Rewriting)：修正用户查询中的错别字和表达问题
2. HyDE (Hypothetical Document Embeddings)：生成假设文档来改善检索效果
3. 传统RAG检索和生成

HyDE方法的核心思想：
- 使用LLM为用户查询生成假设文档
- 这些假设文档虽然可能包含错误，但与知识库中的真实文档相关联
- 通过假设文档的向量表示来检索相似的真实文档，提高检索准确性
"""

import os
import requests
from typing import List, Dict, Any

# 导入CAMEL框架相关模块
from camel.models import ModelFactory
from camel.types import ModelPlatformType
from camel.agents import ChatAgent
from camel.embeddings import SentenceTransformerEncoder
from camel.retrievers import VectorRetriever, BM25Retriever
from camel.storages.vectordb_storages import QdrantStorage

# 导入环境变量模块
from dotenv import load_dotenv

class EnhancedRAGSystem:
    """
    增强版RAG系统类

    集成了查询重写、HyDE、ReRank(RRF算法)和传统RAG功能
    """

    def __init__(self, api_key: str):
        """
        初始化增强版RAG系统

        Args:
            api_key: ModelScope API密钥
        """
        self.api_key = api_key

        # 初始化嵌入模型
        self.embedding_model = SentenceTransformerEncoder(
            model_name='intfloat/e5-large-v2'
        )

        # 初始化向量存储
        self.vector_storage = QdrantStorage(
            vector_dim=self.embedding_model.get_output_dim(),
            collection="enhanced_rag_collection",
            path="storage_enhanced_rag",
            collection_name="增强RAG知识库"
        )

        # 初始化向量检索器
        self.vector_retriever = VectorRetriever(
            embedding_model=self.embedding_model,
            storage=self.vector_storage
        )

        # 初始化BM25检索器（用于ReRank）
        self.bm25_retriever = BM25Retriever()

        # 初始化LLM模型
        self.model = ModelFactory.create(
            model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
            model_type="Qwen/Qwen2.5-72B-Instruct",
            url='https://api-inference.modelscope.cn/v1/',
            api_key=self.api_key
        )

        # 初始化各种代理
        self._init_agents()

    def rrf(self, vector_results: List[Dict], text_results: List[Dict], k: int = 10, m: int = 60) -> List[tuple]:
        """
        使用RRF (Reciprocal Rank Fusion) 算法对两组检索结果进行重排序

        RRF算法通过结合不同检索方法的排名来提高检索效果。
        公式：RRF_score = Σ(1/(rank + m))，其中m是超参数

        Args:
            vector_results: 向量召回的结果列表，每个元素是包含'text'的字典
            text_results: 文本召回的结果列表，每个元素是包含'text'的字典
            k: 排序后返回前k个结果
            m: RRF算法的超参数，用于平滑排名分数

        Returns:
            重排序后的结果列表，每个元素是(文档内容, 融合分数)的元组
        """
        doc_scores = {}

        # 处理向量检索结果
        # 为每个文档分配基于排名的分数：1/(rank + m)
        for rank, result in enumerate(vector_results):
            text = result['text']
            doc_scores[text] = doc_scores.get(text, 0) + 1 / (rank + m)

        # 处理文本检索结果
        # 累加来自不同检索方法的分数
        for rank, result in enumerate(text_results):
            text = result['text']
            doc_scores[text] = doc_scores.get(text, 0) + 1 / (rank + m)

        # 按融合分数降序排序并返回前k个结果
        sorted_results = sorted(doc_scores.items(), key=lambda x: x[1], reverse=True)[:k]

        print(f"RRF融合完成，共处理 {len(doc_scores)} 个唯一文档，返回前 {len(sorted_results)} 个结果")

        return sorted_results

    def _init_agents(self):
        """初始化不同功能的AI代理"""
        
        # 查询重写代理
        rewriting_sys_msg = """
        你是RAG模块中的Rewriting助手，目的是理解用户的提问，并且重新组织和优化用户的提问表达，
        修正用户输入中可能存在的错别字的情况并重构提问来使得句子表达更加通顺严谨。
        请直接输出重写后的查询，不要添加额外的解释。
        """
        self.rewriting_agent = ChatAgent(
            system_message=rewriting_sys_msg,
            model=self.model
        )
        
        # HyDE假设文档生成代理
        hyde_sys_msg = """
        你是一个专门生成假设文档的助手。根据用户的查询，生成一个相关的假设文档片段。
        这个文档应该：
        1. 直接回答用户的问题
        2. 包含相关的技术细节和概念
        3. 使用专业但清晰的语言
        4. 长度适中（200-400字）
        
        请直接输出假设文档内容，不要添加额外的解释或格式。
        """
        self.hyde_agent = ChatAgent(
            system_message=hyde_sys_msg,
            model=self.model
        )
        
        # RAG回答生成代理
        rag_sys_msg = """
        你是一个帮助回答问题的助手。
        我会给你原始查询和检索到的上下文信息。
        请根据检索到的上下文回答原始查询。
        如果上下文信息不足以回答问题，请说"根据提供的信息，我无法完全回答这个问题"。
        请确保回答准确、完整且有条理。
        """
        self.rag_agent = ChatAgent(
            system_message=rag_sys_msg,
            model=self.model
        )
    
    def setup_knowledge_base(self, pdf_url: str = None, pdf_path: str = None):
        """
        设置知识库，同时初始化向量检索器和BM25检索器

        Args:
            pdf_url: PDF文件的URL
            pdf_path: 本地PDF文件路径
        """
        # 创建本地数据目录
        os.makedirs('local_data', exist_ok=True)

        if pdf_url:
            # 下载PDF文件
            print("正在下载PDF文件...")
            response = requests.get(pdf_url)
            pdf_path = 'local_data/knowledge_base.pdf'
            with open(pdf_path, 'wb') as file:
                file.write(response.content)
            print(f"PDF文件已下载到: {pdf_path}")

        if pdf_path:
            # 处理PDF文件并建立向量数据库
            print("正在处理PDF文件并建立向量数据库...")
            self.vector_retriever.process(content=pdf_path)

            # 同时为BM25检索器处理文档
            print("正在为BM25检索器处理文档...")
            self.bm25_retriever.process(content_input_path=pdf_path)

            print("知识库设置完成！（向量检索器 + BM25检索器）")
    
    def rewrite_query(self, original_query: str) -> str:
        """
        重写用户查询
        
        Args:
            original_query: 原始用户查询
            
        Returns:
            重写后的查询
        """
        rewrite_prompt = f"用户的原始提问如下：{original_query}"
        response = self.rewriting_agent.step(rewrite_prompt)
        rewritten_query = response.msgs[0].content.strip()
        
        print(f"原始查询: {original_query}")
        print(f"重写查询: {rewritten_query}")
        
        return rewritten_query
    
    def generate_hypothetical_document(self, query: str) -> str:
        """
        生成假设文档 (HyDE方法)
        
        Args:
            query: 用户查询
            
        Returns:
            生成的假设文档
        """
        hyde_prompt = f"请为以下查询生成一个相关的假设文档：{query}"
        response = self.hyde_agent.step(hyde_prompt)
        hypothetical_doc = response.msgs[0].content.strip()
        
        print(f"生成的假设文档:\n{hypothetical_doc}")
        
        return hypothetical_doc

    def retrieve_with_rrf(self, query: str, top_k: int = 10, rrf_k: int = 5, m: int = 60) -> List[Dict[str, Any]]:
        """
        使用RRF算法结合向量检索和BM25检索的结果

        Args:
            query: 用户查询
            top_k: 每个检索器返回的文档数量
            rrf_k: RRF融合后返回的文档数量
            m: RRF算法的超参数

        Returns:
            RRF融合后的检索结果列表
        """
        print(f"使用RRF算法进行混合检索...")

        # 向量检索
        print("执行向量检索...")
        vector_results = self.vector_retriever.query(query=query, top_k=top_k)

        # BM25检索
        print("执行BM25检索...")
        bm25_results = self.bm25_retriever.query(query=query, top_k=top_k)

        # 使用RRF算法融合结果
        print("使用RRF算法融合检索结果...")
        rrf_results = self.rrf(vector_results, bm25_results, k=rrf_k, m=m)

        # 转换RRF结果格式以保持与其他检索方法的一致性
        formatted_results = []
        for text, score in rrf_results:
            formatted_results.append({
                'text': text,
                'rrf_score': score,
                'source': 'RRF_fusion'
            })

        print(f"RRF检索完成，返回 {len(formatted_results)} 个文档")
        for i, result in enumerate(formatted_results):
            print(f"文档 {i+1} (RRF分数: {result['rrf_score']:.4f}):")
            print(f"{result['text'][:200]}...\n")

        return formatted_results

    def retrieve_with_hyde_and_rrf(self, query: str, top_k: int = 10, rrf_k: int = 5, m: int = 60) -> List[Dict[str, Any]]:
        """
        结合HyDE和RRF的高级检索方法

        Args:
            query: 用户查询
            top_k: 每个检索器返回的文档数量
            rrf_k: RRF融合后返回的文档数量
            m: RRF算法的超参数

        Returns:
            HyDE+RRF融合后的检索结果列表
        """
        print(f"使用HyDE+RRF组合方法进行检索...")

        # 生成假设文档
        hypothetical_doc = self.generate_hypothetical_document(query)

        # 使用假设文档进行向量检索
        print("使用假设文档进行向量检索...")
        hyde_vector_results = self.vector_retriever.query(query=hypothetical_doc, top_k=top_k)

        # 使用原始查询进行BM25检索
        print("使用原始查询进行BM25检索...")
        bm25_results = self.bm25_retriever.query(query=query, top_k=top_k)

        # 使用RRF算法融合HyDE向量检索和BM25检索的结果
        print("使用RRF算法融合HyDE和BM25检索结果...")
        rrf_results = self.rrf(hyde_vector_results, bm25_results, k=rrf_k, m=m)

        # 转换结果格式
        formatted_results = []
        for text, score in rrf_results:
            formatted_results.append({
                'text': text,
                'rrf_score': score,
                'source': 'HyDE_RRF_fusion'
            })

        print(f"HyDE+RRF检索完成，返回 {len(formatted_results)} 个文档")
        for i, result in enumerate(formatted_results):
            print(f"文档 {i+1} (RRF分数: {result['rrf_score']:.4f}):")
            print(f"{result['text'][:200]}...\n")

        return formatted_results

    def retrieve_with_hyde(self, query: str, top_k: int = 3) -> List[Dict[str, Any]]:
        """
        使用HyDE方法进行检索
        
        Args:
            query: 用户查询
            top_k: 返回的文档数量
            
        Returns:
            检索到的文档列表
        """
        # 生成假设文档
        hypothetical_doc = self.generate_hypothetical_document(query)
        
        # 使用假设文档进行检索
        hyde_results = self.vector_retriever.query(
            query=hypothetical_doc,
            top_k=top_k
        )
        
        # 同时使用原始查询进行检索作为对比
        original_results = self.vector_retriever.query(
            query=query,
            top_k=top_k
        )
        
        print(f"\n=== HyDE检索结果 ===")
        for i, result in enumerate(hyde_results):
            print(f"文档 {i+1} (相似度: {result.get('similarity', 'N/A')}):")
            print(f"{result['text'][:200]}...\n")
        
        print(f"=== 原始查询检索结果 ===")
        for i, result in enumerate(original_results):
            print(f"文档 {i+1} (相似度: {result.get('similarity', 'N/A')}):")
            print(f"{result['text'][:200]}...\n")
        
        return hyde_results, original_results
    
    def generate_answer(self, query: str, retrieved_docs: List[Dict[str, Any]]) -> str:
        """
        基于检索到的文档生成答案
        
        Args:
            query: 用户查询
            retrieved_docs: 检索到的文档列表
            
        Returns:
            生成的答案
        """
        # 构建上下文
        context = "\n\n".join([doc['text'] for doc in retrieved_docs])
        
        # 构建提示
        prompt = f"""
        原始查询: {query}
        
        检索到的上下文信息:
        {context}
        
        请根据上述上下文信息回答原始查询。
        """
        
        response = self.rag_agent.step(prompt)
        answer = response.msgs[0].content.strip()
        
        return answer
    
    def enhanced_query(self, original_query: str, use_rewriting: bool = True,
                      use_hyde: bool = True, use_rrf: bool = True, top_k: int = 10, rrf_k: int = 5) -> Dict[str, Any]:
        """
        执行增强版RAG查询

        Args:
            original_query: 原始用户查询
            use_rewriting: 是否使用查询重写
            use_hyde: 是否使用HyDE方法
            use_rrf: 是否使用RRF重排序算法
            top_k: 每个检索器返回的文档数量
            rrf_k: RRF融合后返回的文档数量

        Returns:
            包含各步骤结果的字典
        """
        print("=" * 60)
        print("开始执行增强版RAG查询")
        print("=" * 60)
        
        results = {
            'original_query': original_query,
            'rewritten_query': None,
            'hypothetical_document': None,
            'retrieved_docs': None,
            'final_answer': None
        }
        
        # 步骤1: 查询重写（可选）
        if use_rewriting:
            print("\n步骤1: 查询重写")
            print("-" * 30)
            rewritten_query = self.rewrite_query(original_query)
            results['rewritten_query'] = rewritten_query
            query_to_use = rewritten_query
        else:
            query_to_use = original_query
        
        # 步骤2: 文档检索
        print(f"\n步骤2: 文档检索")
        print("-" * 30)

        if use_rrf and use_hyde:
            print("使用HyDE+RRF组合方法进行检索...")
            retrieved_docs = self.retrieve_with_hyde_and_rrf(query_to_use, top_k=top_k, rrf_k=rrf_k)
            results['retrieved_docs'] = retrieved_docs
            results['retrieval_method'] = 'HyDE+RRF'
        elif use_rrf:
            print("使用RRF方法进行检索...")
            retrieved_docs = self.retrieve_with_rrf(query_to_use, top_k=top_k, rrf_k=rrf_k)
            results['retrieved_docs'] = retrieved_docs
            results['retrieval_method'] = 'RRF'
        elif use_hyde:
            print("使用HyDE方法进行检索...")
            hyde_results, original_results = self.retrieve_with_hyde(query_to_use, top_k)
            results['retrieved_docs'] = hyde_results
            results['original_retrieval_docs'] = original_results
            results['retrieval_method'] = 'HyDE'
            retrieved_docs = hyde_results
        else:
            print("使用传统向量检索方法...")
            retrieved_docs = self.vector_retriever.query(query=query_to_use, top_k=top_k)
            results['retrieved_docs'] = retrieved_docs
            results['retrieval_method'] = 'Traditional'
        
        # 步骤3: 答案生成
        print(f"\n步骤3: 答案生成")
        print("-" * 30)
        final_answer = self.generate_answer(query_to_use, retrieved_docs)
        results['final_answer'] = final_answer
        
        print(f"\n最终答案:\n{final_answer}")
        
        return results


def main():
    """主函数：演示增强版RAG系统的使用"""
    
    # 加载环境变量
    load_dotenv()
    api_key = os.getenv('MODELSCOPE_SDK_TOKEN')
    
    if not api_key:
        print("错误：请设置MODELSCOPE_SDK_TOKEN环境变量")
        return
    
    # 初始化增强版RAG系统
    print("初始化增强版RAG系统...")
    rag_system = EnhancedRAGSystem(api_key)
    
    # 设置知识库（使用CAMEL论文）
    pdf_url = "https://arxiv.org/pdf/2303.17760.pdf"
    rag_system.setup_knowledge_base(pdf_url=pdf_url)
    
    # 测试查询（包含错别字）
    test_queries = [
        "我盖如何解决CAMEL中文档冲服的问题问题呢，几个版本的文档可能存在代码结构的冲突",
        "CAMEL是什么东东？它有什么特点吗",
        "角色扮演在CAMEL中是怎么实现的"
    ]

    # 测试不同的检索方法组合
    test_methods = [
        {"name": "传统RAG", "rewriting": False, "hyde": False, "rrf": False},
        {"name": "查询重写+传统RAG", "rewriting": True, "hyde": False, "rrf": False},
        {"name": "HyDE增强RAG", "rewriting": False, "hyde": True, "rrf": False},
        {"name": "RRF重排序RAG", "rewriting": False, "hyde": False, "rrf": True},
        {"name": "完整增强RAG (Rewriting+HyDE+RRF)", "rewriting": True, "hyde": True, "rrf": True}
    ]

    for i, query in enumerate(test_queries):
        print("\n" + "=" * 100)
        print(f"测试查询 {i+1}: {query}")
        print("=" * 100)

        # 只对第一个查询测试所有方法，其他查询使用完整增强方法
        methods_to_test = test_methods if i == 0 else [test_methods[-1]]

        for method in methods_to_test:
            print(f"\n{'='*20} {method['name']} {'='*20}")

            # 执行增强版RAG查询
            results = rag_system.enhanced_query(
                original_query=query,
                use_rewriting=method['rewriting'],
                use_hyde=method['hyde'],
                use_rrf=method['rrf'],
                top_k=10,
                rrf_k=3
            )

            print(f"检索方法: {results.get('retrieval_method', 'Unknown')}")
            print("-" * 50)

        print("\n" + "=" * 100)


if __name__ == "__main__":
    main()

通过结合 Basic RAG，以及Rewriting和Rerank等优化模块，我们可以构建出更强大、更准确的RAG应用，从而显著提升LLM在特定知识领域的表现。

以下是对你提供的内容的系统性中文整理总结，涵盖了向量检索模块的评估与优化流程，包括 TF-IDF 与嵌入模型对比、评估指标定义、检索流程实现、优化方向等内容，适合撰写文档或教学材料使用。

向量检索模块评估与优化

一、背景说明

在构建基于向量检索（Vector Retrieval, VR）的智能问答系统时，评估检索质量成为关键一步。本实践以 CAMEL AI 框架为基础，通过标准问题及预期答案的方式，对检索器返回结果进行自动化评估，并尝试不同方法进行优化。

二、测试样例定义

我们通过一组测试查询（test_queries）及预期标准答案（expected_answers）来建立基本评估集：

test_queries = [
    {
        "query": "什么是CAMEL AI？",
        "expected_answers": ["CAMEL AI 是一个开源的、社区驱动的AI框架。"]
    },
    {
        "query": "如何开始使用CAMEL AI？",
        "expected_answers": ["首先安装框架：`pip install camel-ai`，然后引入必要的模块。"]
    },
    {
        "query": "CAMEL AI 的主要特点是什么？",
        "expected_answers": ["模块化设计、易用性和扩展性。"]
    }
]

三、评估指标设计

系统定义了以下核心评估指标：

指标名	含义
Precision（精确率）	正确返回结果 / 实际返回结果
Recall（召回率）	正确返回结果 / 所有应返回的正确结果
F1 分数	精确率和召回率的调和平均
平均相似度	所有预期-实际配对之间的相似度均值

其中，相似度计算方法有两种实现方式：

四、相似度计算方法

方法1：TF-IDF + 余弦相似度（初始方法）

def compute_similarity(expected, retrieved):
    vectorizer = TfidfVectorizer()
    tfidf = vectorizer.fit_transform([expected, retrieved])
    similarity_matrix = cosine_similarity(tfidf, tfidf)
    return similarity_matrix[0, 1]

方法2：Embedding + 余弦相似度（改进方案）

1
2
3

def compute_similarity(expected, retrieved):
    embeddings = embedding_model.embed_list([expected, retrieved])
    return cosine_similarity([embeddings[0]], [embeddings[1]])[0][0]

优点：Embedding 模型具备更强的语义理解能力，能处理“车辆≈汽车”这类同义关系。

五、整体评估流程

def evaluate_retrieval(query, expected_answers, threshold=0.5, top_k=1):
    results = vr.query(query=query, top_k=top_k)
    retrieved_texts = [result["text"] for result in results]
    
    precision = calculate_precision(retrieved_texts, expected_answers, threshold)
    recall = calculate_recall(retrieved_texts, expected_answers, threshold)
    f1 = calculate_f1(precision, recall)

    similarities = [
        compute_similarity(expected, retrieved)
        for expected, retrieved in zip(expected_answers, retrieved_texts)
    ]
    avg_similarity = np.mean(similarities) if similarities else 0

    return {
        "precision": precision,
        "recall": recall,
        "f1": f1,
        "avg_similarity": avg_similarity,
        "retrieved_texts": retrieved_texts
    }

六、优化路径探索

1. 使用 Embedding 替代 TF-IDF

提升语义对齐效果
平均相似度显著提高（如从 0.36 提升至 0.91）

2. 调整文档切片粒度（chunking）

vr.process(
    content="example_document.md",
    max_characters=100,  # 更小的切片单元
    should_chunk=True,
)

优化检索粒度，避免一次性返回长段内容
实现更加针对性的文本匹配与评分

3. 模型与参数优化方向

嵌入模型：尝试不同的 encoder（如 BGE、MiniLM）
相似度度量：替换余弦相似度为欧几里得/点积等
检索策略：TF-IDF + Embedding 混合策略

七、生成模块评估建议（BLEU / ROUGE）

from rouge_score import rouge_scorer
from nltk.translate.bleu_score import sentence_bleu
from nltk.tokenize import word_tokenize

reference = "RAG combines retrieval and generation for QA."
generated = "RAG integrates retrieval and generation for question answering."

scorer = rouge_scorer.RougeScorer(['rouge1', 'rougeL'], use_stemmer=True)
scores = scorer.score(reference, generated)

reference_tokens = word_tokenize(reference)
generated_tokens = word_tokenize(generated)
bleu_score = sentence_bleu([reference_tokens], generated_tokens)

输出示例：

1
2
3

ROUGE-1: 0.86
ROUGE-L: 0.82
BLEU Score: 0.71

八、结论

本评估流程展示了向量检索系统从初步搭建 → 精度评估 → 嵌入优化 → 文档切片的迭代式优化路径，并为后续生成式问答系统提供了评估参考。

后续可探索方向包括：

检索器多阶段混合策略（关键词初筛 + 嵌入复检）
基于用户反馈的自动优化（在线学习）
微调专用 Embedding 模型以适配垂类语义

当然可以！下面是针对你这个 Graph RAG 实战项目的详细任务分解（spec → task → controller）设计，适用于你当前使用的 CAMEL 框架 + Qwen2.5 模型 + Firecrawl 网页抓取 + Neo4j 图数据库 + 混合 RAG 推理的场景：

Graph RAG 实战系统任务分解

Spec（规范说明）

构建一个以知识图谱驱动的 Graph RAG 系统，实现从网页抓取 → 实体关系抽取 → 知识图谱构建 → 混合检索 → 回答生成的闭环流程，核心目标为提升复杂问题回答的准确性与可解释性。

用户输入自然语言问题
系统自动进行相关网页抓取与处理
抽取结构化实体关系，写入 Neo4j 图谱
使用图谱结构 + 向量语义检索综合选取回答依据
调用 Qwen2.5 模型生成最终响应

Task（模块拆解）

网页抓取模块（web_crawler）
- 使用 Firecrawl API 抓取用户问题相关的网页
- 输出结构化网页内容（标题、正文、链接等）
信息抽取模块（entity_relation_extractor）
- 对抓取的网页内容进行实体识别与关系抽取（NER + RE）
- 输出三元组（subject, relation, object）
图谱构建模块（graph_builder）
- 将三元组写入 Neo4j 数据库（防止重复写入）
- 实现节点合并、关系合并策略
混合检索模块（hybrid_retriever）
- 图谱检索：基于 Cypher 查询获取相关实体路径
- 向量检索：基于 CAMEL 的向量模块进行语义召回
- 融合策略：Rank/Fuse/Rerank 等融合两类召回
问答生成模块（graph_rag_qa）
- 将图谱结果 + 文档结果合并后作为上下文
- 使用 Qwen2.5 模型生成回答
- 支持来源追踪（source attribution）
LLM Agent 调度模块（camel_controller）
- 封装整个流程为 CAMEL Agent 的工具调用链
- 根据用户输入智能调度抓取 → 构图 → QA 全链路

Controller（模块控制逻辑）

# controller.py 示例（简化伪码）

class GraphRAGController:
    def __init__(self):
        self.web_crawler = FirecrawlClient()
        self.extractor = EntityRelationExtractor()
        self.graph_db = Neo4jClient()
        self.vector_search = VectorRetriever()
        self.qa_model = QwenRAG()
    
    def process_user_query(self, user_input):
        # Step 1: 网页抓取
        docs = self.web_crawler.search_and_parse(user_input)

        # Step 2: 实体关系抽取
        triples = self.extractor.extract_triples(docs)

        # Step 3: 构建知识图谱
        self.graph_db.add_triples(triples)

        # Step 4: 混合检索
        graph_context = self.graph_db.query_relevant(user_input)
        vector_context = self.vector_search.query(user_input)
        context = self.merge_context(graph_context, vector_context)

        # Step 5: RAG 问答生成
        answer = self.qa_model.generate_answer(user_input, context)

        return answer

    def merge_context(self, graph_ctx, vector_ctx):
        # 可定制融合策略，例如先rank再合并
        return graph_ctx + vector_ctx[:2]

其它

引入 RAG-Fusion 或 ColBERT-RAG 提高融合性能
使用 LangGraph/Flowise 等构建 DAG 状态机调度
多跳推理能力强化：通过图谱路径进行 reasoning chain 构建
可视化图谱展示：Neo4j Bloom / D3.js 前端图谱可视化

其它实践部分都在同章节的练习部分，请跳转Agent-camel框架练习（4）查看更为详细的实践步骤。

【Python】第三章学习心得

Posted on 2025-07-18 In 学习心得

《聪明办法学 Python（第2版）》第三章学习心得：变量与数据类型

通过对第三章“变量与数据类型”的学习，我对 Python 的基础数据结构和变量使用方法有了更加深入的理解，为今后的程序构建打下了坚实的基础。

变量的本质与命名规则

在这一章中，变量不再只是“用来存东西的盒子”那么简单，而被赋予了更贴近 Python 精神的理解 —— 名字指向对象（name → object）。

我学到的重要点包括：

变量不需要声明类型，赋值即创建，例如：
1
2
age = 18
name = "Alice"
命名规则简洁直观（小写字母、下划线分隔、不能以数字开头等），并且不建议使用保留字（如 if, class, for 等）。

基本数据类型与类型转换

本章详尽介绍了几种常用的基本数据类型，包括：

数值类型：int、float
字符串类型：str
布尔类型：bool

我特别记住了几个实用的函数：

type()：查看变量的类型
int() / float() / str()：类型转换
bool()：任何值都可以转换为布尔值（如非零即真，空字符串为假）

示例：

1
2
3

print(type(3.14))       # <class 'float'>
print(int("42"))        # 42
print(bool(""))         # False

运算符的使用与优先级

这一部分复习并扩展了数学运算的知识，并引入了 Python 特有的运算符用法：

算术运算符：+ - * / // % **
比较运算符：== != > < >= <=
逻辑运算符：and or not

我印象深刻的是：

// 是地板除法，结果向下取整
** 是幂运算，如 2 ** 3 == 8
字符串可以进行加法和乘法：
1
print("Hi" * 3) # HiHiHi

还学到了 运算符优先级，类似数学中的“先乘除后加减”，使用括号可以明确顺序，增强代码可读性。

我的收获与思考

本章不仅教我如何使用变量与基本类型，更让我理解了 Python 语言“简洁但不简单”的设计理念：

一切皆对象，变量只是对象的标签
不强制类型，但类型管理依然清晰
运算表达灵活，适合快速开发

通过练习，我逐渐体会到了写 Python 代码时的“自然感”，就像是在“表达思路”，而不是“翻译成机器语言”。

Agent-camel框架学习记录（3）

Posted on 2025-07-17 Edited on 2025-07-20 In 学习笔记

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

CAMEL 多智能体工作流系统概览

CAMEL是一个用于构建多智能体协作系统的框架，它通过角色扮演机制，让不同的AI智能体扮演特定角色，并协同完成复杂任务。其核心特点包括：

任务分解：将复杂任务拆解为可管理的子任务。
角色分工：为每个智能体分配专业角色。
依赖管理：智能地处理任务之间的依赖关系。
高效协作：智能体通过对话和合作共同达成目标。

RolePlaying：对话式协作

RolePlaying 是 CAMEL 中实现多智能体协作的主要方式。它模拟人类对话和协作过程，通过 AI用户（发布指令并引导对话）和 AI助手（提供解决方案并执行指令）的多轮对话来完成任务。

核心概念与参数

任务（Task）：由初始提示（task_prompt）启动，可由任务指定智能体（with_task_specify）进一步明确。

1
2
3

AI用户（User Agent）：由 user_role_name 定义角色名称。
AI助手（Assistant Agent）：由 assistant_role_name 定义角色名称。
评审者（Critic Agent）：可选，通过 critic_role_name 配置，可以是人类（"human"）或自动评审智能体，用于评估和优化任务完成情况（with_critic_in_the_loop）。

实践流程

1.设置参数：导入模块，配置模型，并为任务、AI用户和AI助手设置角色名称及相关参数。
2.组建 AI-Society：使用 RolePlaying 类初始化多智能体社会。
3.解决任务：通过循环调用 society.step() 进行多轮对话，直至任务完成或达到终止条件。is_terminated() 函数可用于检查会话终止原因。

Workforce：大规模团队协作

Workforce 适用于更复杂的、需要多个智能体并行或串行协作的场景，如软件开发、内容生产和项目管理。它允许用户定义多个“工作节点”（Worker Nodes），每个节点可以是一个拥有特定能力和职责的 ChatAgent。

核心组件

Workforce 实例：用于管理整个工作组，包含描述、协调智能体（coordinator_agent）和任务规划智能体（task_agent）等。

工作节点（Worker Nodes）：由 ChatAgent 实例表示，每个节点拥有独特的系统消息（system_message）、模型配置和可选的工具集（tools），如搜索工具。

任务（Task）：封装具体工作需求，包含 content（任务内容）、additional_info（附加信息）和 id（唯一标识）。

实践流程

1.创建 Workforce 实例：初始化 Workforce 对象，并可配置其描述、协调器和任务代理模型。
2.定义 Worker：创建具有不同角色和能力的 ChatAgent 实例（例如：搜索助手、规划师、评审员）。
3.添加工作节点：使用 add_single_agent_worker() 方法将定义的 ChatAgent 添加到 Workforce 中，并为其提供精准的描述，以便协调器分配任务。
4.启动 Workforce 并处理任务：创建 Task 对象，然后调用 workforce.process_task(task) 启动任务处理流程，Workforce 将根据节点描述自动分发子任务并整合结果。

综上，CAMEL 提供了两种主要的多智能体协作模式：

1
2
3

RolePlaying：适用于双向对话和逐步协作的场景，通过 AI 用户和 AI 助手的互动来细化并完成任务。

Workforce：适用于多角色、大规模团队协作的场景，通过协调智能体调度多个拥有特定能力的 ChatAgent 共同完成复杂任务，并可引入外部工具辅助。

两种模式都强调通过明确的角色定义和系统消息来提升智能体的能力和协作效率。

由于先前我们已经在之前的学习笔记以及练习中梳理过RolePlaying相关的内容以及演示，我们接下来主要演示Workforce场景的使用：

下面我们将创建一个简单的 Workforce 示例，让不同的智能体共同完成一个任务，比如生成一份关于东京旅游的行程规划。我们将定义以下角色：

 工作节点（Worker Agents）的定义
在这个优化版本中，我们为每个智能体赋予了更明确、更专业的职责，并移除了对外部搜索工具的依赖，让它们专注于利用自身的“知识库”来提供信息和执行任务。

东京旅游专家 (Researcher Agent)：

角色定位：一位经验丰富的东京旅游专家。

职责：利用其丰富的内置知识提供东京的景点、美食、交通和购物信息，不再进行网络搜索，以确保信息来源可控且避免速率限制。

高级旅游规划师 (Planner Agent)：

角色定位：专业的行程规划师。

职责：根据“东京旅游专家”提供的信息和游客的详细需求，精心制定一份合理、详细且吸引人的3日东京旅游行程，注重时间、交通和体验平衡。

资深旅行评论员 (Reviewer Agent)：

角色定位：眼光独到的旅行评论员。

职责：严格评估规划师制定的行程，从实用性、趣味性、性价比、潜在问题和文化体验等多个维度给出建设性反馈和优化建议。

准备工作

首先，确保你安装了必要的库并配置了API密钥。

from camel.agents import ChatAgent
from camel.models import ModelFactory
from camel.types import ModelPlatformType, TaskType
from camel.societies.workforce import Workforce
from camel.messages import BaseMessage
from camel.tasks import Task
import os
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 创建模型实例
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

print("🔧 正在创建优化版本的 Workforce...")

定义工作节点 (Worker Agents)

我们将创建三个不同职责的 ChatAgent，每个 Agent 都有自己的系统消息和潜在的工具。
工作节点（Worker Agents）的定义

# 1. 研究员 Agent：负责信息搜索
researcher_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="旅游信息研究员",
        content="你是一个专业的旅游信息研究员，精通网络搜索。你的职责是准确、全面地收集指定目的地的景点、美食、交通和住宿信息，并提供给规划师。你会使用搜索工具来获取最新和最准确的数据。"
    ),
    model=model,
    tools=[SearchToolkit().search_duckduckgo] # 赋予搜索能力
)

# 2. 规划师 Agent：负责行程规划
planner_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="高级旅游规划师",
        content="你是一位经验丰富的高级旅游规划师。你的职责是根据研究员提供的信息和用户的具体需求，制定一份合理、详细且富有吸引力的旅游行程。你需要考虑时间安排、交通便利性、景点特色和用户体验。"
    ),
    model=model
)

# 3. 评审员 Agent：负责评估和优化
reviewer_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="资深旅行评论员",
        content="你是一位眼光独到的资深旅行评论员。你的职责是像真正的旅行者一样，从实用性、趣味性、性价比和潜在问题等角度，严格评审规划师提供的旅游行程，并提出建设性的改进意见，确保行程质量。"
    ),
    model=model
)

print("✅ 所有工作节点（研究员、规划师、评审员）已定义。")

本部分代码可以采用Tools实时从网站调取最新的旅游相关信息，以提高研究院代理的推荐精准性并保持最新信息。
但是，由于存在“多个搜索任务同时执行，短时间内发送了太多请求，触发了DuckDuckGo 搜索速率限制”问题，最终导致研究员代理无法获取实时的东京旅游信息的问题。
因此我们进行了进一步的版本改进：

#--------------------------------------------------
# 定义工作节点 (不使用搜索工具，避免速率限制)
#--------------------------------------------------

# 1. 研究员 Agent：使用内置知识提供信息
researcher_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="东京旅游专家",
        content="""你是一位资深的东京旅游专家，拥有丰富的东京旅游知识。你熟悉东京的热门景点、特色美食、交通方式和购物场所。
        你的职责是基于你的专业知识，为游客提供准确、实用的东京旅游信息，包括：
        - 融合现代与传统的热门景点
        - 特色美食推荐和餐厅位置
        - 便捷的交通方式和路线
        - 适合购物的区域和商场
        请提供详细、实用的建议，不需要进行网络搜索。"""
    ),
    model=model
)

# 2. 规划师 Agent：负责行程规划
planner_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="高级旅游规划师",
        content="""你是一位经验丰富的高级旅游规划师，专门制定东京旅游行程。
        你的职责是根据提供的信息和用户需求，制定合理、详细且富有吸引力的旅游行程。
        你需要考虑：
        - 时间安排的合理性
        - 交通便利性和路线优化
        - 景点的特色和游客体验
        - 餐饮和购物的平衡安排
        - 现代与传统文化的结合体验"""
    ),
    model=model
)

# 3. 评审员 Agent：负责评估和优化
reviewer_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="资深旅行评论员",
        content="""你是一位眼光独到的资深旅行评论员，专门评估旅游行程质量。
        你的职责是从真正旅行者的角度，严格评审旅游行程，并提出建设性改进意见。
        评估维度包括：
        - 实用性：交通是否便利，时间安排是否合理
        - 趣味性：景点是否有吸引力，体验是否丰富
        - 性价比：费用预算是否合理
        - 潜在问题：可能遇到的困难和解决方案
        - 文化体验：是否能深入了解日本文化"""
    ),
    model=model
)

print("✅ 所有工作节点已定义（无搜索工具依赖）")

在这个优化版本中，我们为每个智能体赋予了更明确、更专业的职责，并移除了对外部搜索工具的依赖，让它们专注于利用自身的“知识库”来提供信息和执行任务。

Workforce 实例的创建

#--------------------------------------------------
# 创建简化的 Workforce 实例
#--------------------------------------------------

# 创建协调器 Agent
coordinator_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="工作组协调员",
        content="你是一个高效的工作组协调员，负责协调旅游规划团队的工作。你需要合理分配任务，确保工作流程顺畅，最终产出高质量的旅游行程规划。"
    ),
    model=model
)

# 创建任务代理 Agent
from camel.toolkits import TaskPlanningToolkit
task_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="任务规划专家",
        content="你是一个专业的任务规划专家，负责将复杂的旅游规划任务分解为具体的子任务。你擅长分析任务需求，识别关键步骤，并合理安排任务执行顺序。"
    ),
    model=model,
    tools=TaskPlanningToolkit().get_tools()
)

# 创建 Workforce 实例（完整版本）
travel_workforce = Workforce(
    description="东京旅游行程规划与评估工作组",
    coordinator_agent=coordinator_agent,
    task_agent=task_agent
)

我们创建了一个名为 travel_workforce 的 Workforce 实例，其描述为“东京旅游行程规划与评估工作组”，清晰地概括了整个团队的职能。

1
2
3

明确的协调器 (Coordinator Agent)：这次我们单独创建了一个 coordinator_agent，并为其分配了“工作组协调员”的角色，强调其负责任务分配和流程顺畅的核心职责。

明确的任务代理 (Task Agent)：我们也单独创建了 task_agent，赋予其“任务规划专家”的角色，并为其配备了 TaskPlanningToolkit，使其更擅长将复杂任务分解为可执行的子任务。

工作节点的添加：

# 添加工作节点
travel_workforce.add_single_agent_worker(
    "提供东京的景点、美食和交通专业知识",
    worker=researcher_agent
).add_single_agent_worker(
    "制定详细的东京3日旅游行程",
    worker=planner_agent
).add_single_agent_worker(
    "评估旅游行程并提出改进建议",
    worker=reviewer_agent
)

print("✅ Workforce 实例已创建并添加所有工作节点")

使用 add_single_agent_worker() 方法，将前面定义的“东京旅游专家”、“高级旅游规划师”和“资深旅行评论员”作为独立的工人节点添加到 travel_workforce 中。每个节点都附带了简洁明了的职责描述，这是协调器进行任务分配的关键依据。

创建任务并启动 Workforce
最后，我们定义一个要交给 Workforce 处理的任务，并调用 process_task() 方法启动协作流程。

#--------------------------------------------------
# 创建任务并启动
#--------------------------------------------------

tokyo_task = Task(
    content="请为一位首次访问东京的游客规划一份详细的3日旅游行程。行程应包含热门景点、特色美食体验，并考虑交通便利性。",
    additional_info={
        "游客偏好": "希望体验东京的现代与传统结合，对购物和美食有兴趣",
        "当前日期": "2025年7月17日",
        "旅行天数": "3天",
        "游客类型": "首次访问东京的游客",
        "特殊要求": "避免过于紧凑的行程，注重文化体验"
    },
    id="tokyo_trip_plan_optimized"
)

print(f"\n🚀 开始处理优化任务: '{tokyo_task.content[:50]}...'")

try:
    # 处理任务
    processed_task = travel_workforce.process_task(tokyo_task)
    
    print("\n" + "="*60)
    print("📋 任务处理完成")
    print("="*60)
    print(f"任务ID: {processed_task.id}")
    print(f"\n最终结果:\n{processed_task.result}")
    print("\n🎉 优化版 Workforce 演示成功！")
    
except Exception as e:
    print(f"\n❌ 任务处理出现错误: {str(e)}")
    print("这可能是由于模型配置或网络问题导致的")

让我们看看最终运行效果如何吧！：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/test_Workforce_optimized.py
🔧 正在创建优化版本的 Workforce...
✅ 所有工作节点已定义（无搜索工具依赖）
✅ Workforce 实例已创建并添加所有工作节点

🚀 开始处理优化任务: '请为一位首次访问东京的游客规划一份详细的3日旅游行程。行程应包含热门景点、特色美 食体验，并考虑交通便...'
Worker node a6766c80-35c1-4049-a379-70e3f09aa193 (提供东京的景点、美食和交通专业知识) get task tokyo_trip_plan_optimized.0: 收集东京的热门景点、特色美食和交通信息。
======
Reply from Worker node a6766c80-35c1-4049-a379-70e3f09aa193 (提供东京的景点、美食和交通专业知识):

对于希望体验东京现代与传统结合的首次访问游客，以下是一些建议：

**热门景点**:
- **浅草寺**：作为东京最古老的寺庙，浅草寺是体验日本传统文化的绝佳地点。附近还有雷门和仲见世商店街，可以购买到各种手工艺品和小吃。
- **明治神宫**：位于原宿，是一个供奉明治天皇及其妻子的地方。周围有大片森林，环境非常宁静。
- **东京塔/晴空塔**：这两个观景塔都是俯瞰东京全景的好地方，尤其是夜景非常美丽。
- **上野公园及博物馆区**：上野公园内有多个博物馆，如东京国立博物馆，非常适合喜欢艺术和历史的游客。    

**特色美食**:
- **寿司**：银座的‘すきやばし次郎’（Sukiyabashi Jiro）是世界著名的寿司店，但价格昂贵，可以尝试其他平价但同样美味的寿司店，如‘築地場外市場’（Tsukiji Outer Market）。
- **拉面**：池袋的‘ラーメンストリート’（Ramen Street）汇集了多家拉面店，可以尝试点不同风味的拉面。    
- **烤肉**：新宿的‘焼肉きんぐ’（Yakiniku King）提供自助式的烤肉，性价比高，适合家庭或朋友聚餐。       

**交通信息**:
- **地铁**：东京地铁网络发达，覆盖主要旅游景点。建议购买一日券或多日券以节省费用。
- **巴士**：观光巴士线路连接了主要的旅游景点，车上有中文解说，适合外国游客。
- **出租车**：虽然价格较高，但在不熟悉地铁系统时，可以考虑使用。
- **步行**：部分景点之间距离较近，如浅草寺和上野公园，可以选择步行游览。

以上建议希望能帮助您在东京度过一个愉快的文化体验之旅。
======
🎯 Task tokyo_trip_plan_optimized.0 completed successfully.
Worker node d444ab33-281a-4184-9e5e-0e92cfc108f9 (制定详细的东京3日旅游行程) get task tokyo_trip_plan_optimized.1: 基于收集的信息，设计一个结合现代与传统元素、适合购物和美食体验的3日旅游行程。
======
Reply from Worker node d444ab33-281a-4184-9e5e-0e92cfc108f9 (制定详细的东京3日旅游行程):

### 东京3日游行程安排

#### 第1天：浅草寺 - 仲见世商店街 - 上野公园及博物馆区
- **上午**：
  - 9:00 - 11:00：参观浅草寺，感受日本的传统宗教文化和建筑。
  - 11:00 - 12:00：漫步仲见世商店街，品尝当地小吃，购买手工艺品。
- **中午**：
  - 12:00 - 13:00：在仲见世商店街附近的餐厅享用午餐，推荐尝试传统的日式料理。
- **下午**：
  - 13:30 - 16:00：前往上野公园，参观东京国立博物馆，了解日本的历史和艺术。
  - 16:00 - 17:30：在上野公园内散步，欣赏自然美景。
- **晚上**：
  - 18:00 - 19:30：在上野站附近的居酒屋享用晚餐，体验日本的夜生活。

#### 第2天：明治神宫 - 原宿 - 表参道 - 池袋拉面街
- **上午**：
  - 9:00 - 11:00：参观明治神宫，感受宁静的自然环境和传统神道教文化。
- **中午**：
  - 11:30 - 12:30：在原宿的竹下通品尝街头小吃，如章鱼烧和可丽饼。
- **下午**：
  - 13:00 - 15:00：游览表参道，享受时尚购物体验，参观高端品牌店和设计师精品店。
  - 15:30 - 17:00：前往池袋拉面街，尝试不同风味的拉面。
- **晚上**：
  - 18:00 - 19:30：在池袋的居酒屋享用晚餐，体验当地的餐饮文化。

#### 第3天：东京塔/晴空塔 - 银座 - 新宿烤肉
- **上午**：
  - 9:00 - 11:00：参观东京塔或晴空塔，俯瞰东京全景，欣赏美丽的城市风光。
- **中午**：
  - 11:30 - 12:30：在银座的築地場外市場享用寿司，品尝新鲜的海鲜。
- **下午**：
  - 13:00 - 15:00：在银座购物，购买高端奢侈品和时尚商品。
  - 15:30 - 17:00：自由活动时间，可在银座继续探索或休息。
- **晚上**：
  - 18:00 - 19:30：在新宿的焼肉きんぐ享用自助烤肉，与家人或朋友共度美好时光。

### 交通建议
- **地铁**：建议购买三日券，方便快捷地到达各个景点。
- **步行**：部分景点之间距离较近，如浅草寺和上野公园，可以选择步行游览。
- **出租车**：在不熟悉地铁系统时，可以考虑使用出租车，尤其是在携带较多行李的情况下。

希望这个行程能为您的东京之旅带来美好的回忆！祝您旅途愉快！
======
🎯 Task tokyo_trip_plan_optimized.1 completed successfully.
Worker node ebcf8ea8-a047-434f-bb70-82ba9b0f8b92 (评估旅游行程并提出改进建议) get task tokyo_trip_plan_optimized.2: 评估设计的旅游行程，确保其满足游客的需求，包括避免过于紧凑的行程，注重文化体验。        
======
Reply from Worker node ebcf8ea8-a047-434f-bb70-82ba9b0f8b92 (评估旅游行程并提出改进建议):

### 东京3日游行程评估报告

#### 实用性
- **交通**：行程中建议使用地铁三日券，这是非常实用的建议，因为东京地铁网络发达，覆盖主要旅游景点，可以节省时间和费用。
- **时间安排**：整体时间安排较为合理，避免了过于紧凑的行程，每个景点都有足够的时间进行参观和体验。    

#### 趣味性
- **景点吸引力**：行程中包含了许多具有代表性的景点，如浅草寺、明治神宫、东京塔/晴空塔等，这些景点不仅 有历史文化价值，还能让游客感受到东京的现代都市魅力。
- **体验丰富**：除了参观景点，还安排了购物、美食体验，如在仲见世商店街品尝小吃，在築地場外市場享用寿司，在池袋拉面街尝试不同风味的拉面，以及在新宿的焼肉きんぐ享用自助烤肉，这些都能让游客全方位体验东京的魅力。

#### 性价比
- **费用预算**：建议购买地铁三日券，这是一个经济实惠的选择。此外，行程中推荐了一些性价比高的美食地点，如築地場外市場和池袋拉面街，这有助于控制旅行成本。

#### 潜在问题
- **语言障碍**：对于不熟悉日语的外国游客，可能会在点餐和购物时遇到困难。建议提前下载翻译应用，或者选择有英文菜单和服务的餐厅。
- **天气变化**：东京的天气多变，特别是在夏季，建议游客随身携带雨具，以防突然下雨。

#### 文化体验
- **深入体验**：行程中安排了多个具有文化特色的景点，如浅草寺、明治神宫和东京国立博物馆，这些地方可以让游客深入了解日本的历史和文化。
- **互动体验**：建议在浅草寺和明治神宫增加一些互动环节，如参加祈福仪式或体验传统茶道，这样可以进一步增强文化体验。

总体来说，这个行程设计得非常好，既兼顾了实用性，又提供了丰富的文化体验。希望这些建议能帮助游客更好地享受东京之旅。
======
🎯 Task tokyo_trip_plan_optimized.2 completed successfully.

============================================================
📋 任务处理完成
============================================================
任务ID: tokyo_trip_plan_optimized

🎉 Workforce 演示成功！

以及另一个版本的不同输出：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/test_Workforce_optimized.py
🔧 正在创建优化版本的 Workforce...
✅ 所有工作节点已定义（无搜索工具依赖）
✅ Workforce 实例已创建并添加所有工作节点

🚀 开始处理优化任务: '请为一位首次访问东京的游 客规划一份详细的3日旅游行程。行程应包含热门景点、特色美食体验，并考虑交通便...'
Worker node 39687a9c-f0d1-4cd6-98d9-f71b751d4bde (提供东京的景点、美食和交通专业知识) get task tokyo_trip_plan_optimized.0: 研究东京的热门景 点、特色美食和交通方式，以满足游客对现代与传统 结合的体验需求。
======
Reply from Worker node 39687a9c-f0d1-4cd6-98d9-f71b751d4bde (提供东京的景点、美食和交通专业知 识):

为了满足您对东京现代与传统结合的体验需求，我为 您规划了为期三天的行程。第一天：上野公园和阿美 横丁，您可以在这里感受到浓厚的传统日本文化氛围 ，同时也能品尝到各种地道的日本小吃。第二天：浅 草寺和雷门，这是东京最古老的寺庙之一，旁边还有 许多传统手工艺品店，之后可以前往附近的东京晴空 塔，体验现代东京的壮观景象。第三天：原宿和表参 道，这里是东京时尚潮流的发源地，有许多独特的商 店和咖啡馆，非常适合购物和拍照。关于交通方式， 建议购买一日券或三日券乘坐地铁，这样既方便又经 济。如果您想体验更多当地生活，也可以选择租用自 行车。至于美食，推荐您尝试寿司、拉面和天妇罗， 这些都可以在上述提到的地方找到。希望这些建议能 帮助您度过一个愉快的东京之旅。
======
🎯 Task tokyo_trip_plan_optimized.0 completed successfully.
Worker node d72e4f78-769b-406d-bacc-cc4b230711b5 (制定详细的东京3日旅游行程) get task tokyo_trip_plan_optimized.1: 基于研究结果，制定一个平衡的3日旅游行程，确保行程不过于紧凑，同时注重文化体验。
======
Reply from Worker node d72e4f78-769b-406d-bacc-cc4b230711b5 (制定详细的东京3日旅游行程):      

为了满足您对东京现代与传统结合的体验需求，我为 您规划了为期三天的平衡行程。第一天：上午参观上 野公园，感受浓厚的传统日本文化氛围，中午在阿美 横丁品尝各种地道的日本小吃；下午自由活动，可以 选择逛逛附近的博物馆或商店。第二天：上午游览浅 草寺和雷门，了解东京的历史文化；中午在附近品尝 传统的日式料理；下午前往东京晴空塔，体验现代东 京的壮观景象。第三天：全天探索原宿和表参道，这 里是东京时尚潮流的发源地，有许多独特的商店和咖 啡馆，非常适合购物和拍照。关于交通方式，建议购 买三日券乘坐地铁，这样既方便又经济。希望这些建 议能帮助您度过一个愉快的东京之旅。
======
🎯 Task tokyo_trip_plan_optimized.1 completed successfully.
Worker node 3a796729-1774-43b5-b481-60504a509ded (评估旅游行程并提出改进建议) get task tokyo_trip_plan_optimized.2: 评估制定的旅游行程，提出 改进建议，确保行程符合游客的兴趣和特殊要求。   
======
Reply from Worker node 3a796729-1774-43b5-b481-60504a509ded (评估旅游行程并提出改进建议):     

根据您的需求，我已经评估了这个3天的东京旅游行程。实用性方面，行程中的交通方式建议购买三日券乘 坐地铁，非常便利且经济，同时也提供了租用自行车 的建议，增加了旅行的灵活性。趣味性方面，行程包 含了多个具有代表性的景点，如上野公园、浅草寺、 东京晴空塔等，能够充分体验东京的传统与现代结合 的魅力。此外，还特别提到了购物和美食的地点，符 合您的兴趣。性价比方面，整体行程安排合理，没有 过多的重复和浪费时间的环节，费用预算也相对合理 。潜在问题方面，需要注意的是东京晴空塔可能需要 提前预订门票，以免现场排队时间过长。此外，原宿 和表参道的购物区可能会比较拥挤，建议避开高峰时 段。文化体验方面，行程中安排了多个能够深入了解 日本文化的景点，如上野公园、浅草寺等，能够满足 您对文化体验的需求。总体来说，这是一个很好的行 程，但建议在出行前再次确认所有景点的开放时间和 门票预订情况，以确保行程顺利进行。
======
🎯 Task tokyo_trip_plan_optimized.2 completed successfully.

============================================================
📋 任务处理完成
============================================================
任务ID: tokyo_trip_plan_optimized

🎉Workforce 演示成功！

两个输出的版本在输出格式/行程规划的具体方面均有不同，但是都遵循“旅行专家推荐→旅游规划师规划→资深评论员审评”的三大步骤，且输出都在预期范围之内。

后续我又研究了一下，并创建一个既能使用搜索工具，又能避免速率限制问题的解决方案：
确保自动在搜索请求之间添加延迟（5秒），以避免触发 DuckDuckGo 的速率限制
并进行了一些其它改进优化工作：

我们主要看搜索部分：

#--------------------------------------------------
# 自定义搜索工具类，添加速率限制控制
#--------------------------------------------------

class RateLimitedSearchToolkit:
    """带速率限制的搜索工具包"""
    
    def __init__(self, delay_seconds=3):
        self.search_toolkit = SearchToolkit()
        self.delay_seconds = delay_seconds
        self.last_search_time = 0
    
    def safe_search_duckduckgo(self, query: str, max_results: int = 5):
        """安全的搜索方法，包含速率限制"""
        current_time = time.time()
        time_since_last = current_time - self.last_search_time
        
        if time_since_last < self.delay_seconds:
            sleep_time = self.delay_seconds - time_since_last
            print(f" 等待 {sleep_time:.1f} 秒以避免速率限制...")
            time.sleep(sleep_time)
        
        try:
            result = self.search_toolkit.search_duckduckgo(query, max_results)
            self.last_search_time = time.time()
            print(f" 搜索成功: {query[:50]}...")
            return result
        except Exception as e:
            print(f" 搜索失败: {str(e)}")
            return f"搜索暂时不可用，请使用已有知识回答。错误: {str(e)}"

# 创建速率限制搜索工具实例
safe_search = RateLimitedSearchToolkit(delay_seconds=5)

#--------------------------------------------------
# 定义工作节点（带安全搜索功能）
#--------------------------------------------------

# 1. 研究员 Agent：使用安全搜索工具
researcher_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="东京旅游信息研究员",
        content="""你是一个专业的东京旅游信息研究员。你的职责是：
        1. 使用搜索工具获取最新的东京旅游信息
        2. 如果搜索不可用，使用你的专业知识提供信息
        3. 重点关注：热门景点、特色美食、交通方式、购物场所
        4. 特别注意现代与传统结合的地方
        5. 提供实用、准确的旅游建议
        
        搜索策略：
        - 使用简洁的关键词避免复杂查询
        - 如果遇到速率限制，依靠专业知识回答
        - 优先提供2025年最新信息"""
    ),
    model=model,
    tools=[safe_search.safe_search_duckduckgo]  # 使用安全搜索工具
)

# 2. 规划师 Agent
planner_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="高级旅游规划师",
        content="""你是一位经验丰富的东京旅游规划师。你的职责是：
        1. 根据研究员提供的信息制定详细行程
        2. 考虑交通便利性和时间安排
        3. 平衡现代与传统文化体验
        4. 安排合理的购物和美食时间
        5. 确保行程适合首次访问东京的游客
        
        规划原则：
        - 每天不超过3-4个主要景点
        - 合理安排休息时间
        - 考虑地理位置的邻近性
        - 包含详细的交通指南"""
    ),
    model=model
)

# 3. 评审员 Agent
reviewer_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="资深旅行评论员",
        content="""你是一位资深的旅行评论员。你的职责是：
        1. 从实际旅行者角度评估行程
        2. 识别潜在问题和改进空间
        3. 提供具体的优化建议
        4. 确保行程的实用性和趣味性
        
        评估维度：
        - 时间安排是否合理
        - 交通是否便利
        - 费用预算是否适中
        - 文化体验是否丰富
        - 是否适合目标游客群体"""
    ),
    model=model
)

主要改变以上信息，那么让我们来再看看运行效果如何吧：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Workforce_with_search.py
🔧 正在创建带搜索功能的 Workforce...
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_linkup'. The parameter definition is {'enum': ['searchResults', 'sourcedAnswer', 'structured'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'enum': ['OneDay', 'OneWeek', 'OneMonth', 'OneYear', 'NoLimit'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'anyOf': [{'enum': ['finance', 'law', 'medical', 'internet', 'tax', 'news_province', 'news_center'], 'type': 'string'}, {'type': 'null'}], 'type': ['null']}. This may affect the quality of tool calling.   
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'safe_search_duckduckgo'. The parameter definition is {'type': 'string'}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'safe_search_duckduckgo'. The parameter definition is {'type': ['integer', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
✅ 所有工作节点已定义（包含安全搜索功能）
✅ Workforce 实例已创建（包含搜索功能）

🚀 开始处理带搜索功能的任务...
任务: 请为一位首次访问东京的游客规划一份详细的3日旅游行程。需要包含热门景点、特色美食体验，并考虑交通 便利性。请获取2025年最新的旅游信息。...

⏳ 正在协调多智能体工作...
Worker node 1370eb13-4f2f-4a47-99f0-cbbbcd2fb50b (负责搜索和提供东京最新的旅游信息，包括景点、美食、交通等) get task tokyo_trip_plan_with_search.0: Subtask 1 (1370eb13-4f2f-4a47-99f0-cbbbcd2fb50b): 负责搜索和提供东京最新的旅游信息，包括景点、美食、交通等
✅ 搜索成功: 东京 最新 旅游信息 热门景点 特色美食 交通方式 购物场所 2025...
======
Reply from Worker node 1370eb13-4f2f-4a47-99f0-cbbbcd2fb50b (负责搜索和提供东京最新的旅游信息，包括景 点、美食、交通等):

根据我的知识，以下是对您计划的东京之旅的一些建议，这些信息尽可能地反映了2025年的最新情况，尽管我无法即时检索到最新数据，但这些推荐仍然具有时效性。

**热门景点**
- **浅草寺**：作为东京最古老的佛教寺庙，浅草寺不仅是一个重要的文化遗址，也是感受日本传统文化的好地方。从雷门进入，可以欣赏到传统的日式建筑和热闹的商店街。
- **东京晴空塔**（Tokyo Skytree）：这座634米高的电波塔不仅是东京的新地标，而且从塔顶可以俯瞰整个东京市区的景色。它很好地代表了东京的现代一面。
- **明治神宫**：位于原宿附近的明治神宫是一个供奉明治天皇和昭宪皇后的神社。这里环境宁静，是体验日本传统宗教仪式的好去处。
- **上野公园及周边**：上野公园是东京著名的赏樱地点，周围有许多博物馆，如东京国立博物馆，适合喜欢艺术和历史的游客。

**特色美食**
- **寿司**：在筑地市场或银座区尝试新鲜的寿司是许多游客的首选。虽然筑地市场已经迁移到了丰洲，但是该区域依然有许多优质的寿司店。
- **拉面**：东京有很多不同风味的拉面店，比如一兰拉面、Ichiran等，提供了多种选择来满足不同的口味。     
- **居酒屋**：体验日本的居酒屋文化，品尝各种小菜和日本酒，是一种非常地道的享受方式。

**交通方式**
- **地铁/电车**：东京的公共交通系统发达且准时，是游览城市最方便的方式。购买一日券或多日券可以节省费用 。
- **出租车**：对于不熟悉路线或者携带大量行李的游客来说，乘坐出租车也是一种不错的选择，不过价格相对较高。

**购物场所**
- **涩谷109**：这里是年轻人时尚潮流的中心，可以找到各种流行的服装品牌。
- **银座**：银座区以其高端的购物环境著称，无论是国际奢侈品牌还是日本本土品牌，在这里都能找到。        
- **秋叶原**：对于动漫迷和技术爱好者来说，秋叶原是必去之地，这里有众多的电器店和动漫周边产品店。      

**现代与传统结合的地方**
- **表参道**：这条街道不仅有高级时装店和设计感强烈的建筑，还保留了一些传统的日式茶馆和咖啡厅，体现了东京独特的城市风貌。
- **六本木新城**：集美术馆、电影院、餐厅于一体的综合设施，周围还有美丽的绿地和公园，展现了东京现代都市生活的另一面。

希望这些建议能帮助您规划一个轻松愉快的东京之旅！如果您有任何特定的需求或问题，欢迎随时向我咨询。      
======
Task tokyo_trip_plan_with_search.0 completed successfully.
Worker node 9ba18c5a-012a-4200-994d-fee79899706d (负责制定详细的东京3日旅游行程规划) get task tokyo_trip_plan_with_search.1: Subtask 2 (9ba18c5a-012a-4200-994d-fee79899706d): 根据收集到的信息，制定详细的 东京3日旅游行程规划
======
Reply from Worker node 9ba18c5a-012a-4200-994d-fee79899706d (负责制定详细的东京3日旅游行程规划):      

根据您的需求，以下是为您精心规划的东京三日游行程，旨在平衡现代与传统文化体验，并确保您有足够的时间享受购物和美食。

### 第一天：传统文化与美食探索
- **上午**：
  - **浅草寺**：从雷门进入，参观这座历史悠久的寺庙，体验日本的传统氛围。（建议停留1-2小时）
  - **仲见世商店街**：在浅草寺附近逛逛，品尝一些传统的日本小吃，如章鱼烧、抹茶甜点等。（建议停留1小时 ）
- **中午**：
  - 在浅草地区尝试一家寿司店，享用新鲜美味的寿司。（建议停留1小时）
- **下午**：
  - **上野公园**：参观上野公园，欣赏美丽的自然风光，如果时间允许，可以参观东京国立博物馆，了解日本的历史和文化。（建议停留2-3小时）
- **晚上**：
  - **秋叶原**：前往秋叶原，体验日本的动漫文化和电子产品市场。这里有许多商店出售动漫周边产品和最新的电子产品。（建议停留2小时）
  - **居酒屋**：在秋叶原或上野附近找一家居酒屋，品尝日本的小菜和清酒，感受日本的夜生活。（建议停留1-2 小时）

### 第二天：现代都市体验
- **上午**：
  - **东京晴空塔**：前往东京晴空塔，乘坐电梯到达观景台，俯瞰东京市区的美景。（建议停留1-2小时）       
- **中午**：
  - 在晴空塔附近的餐厅享用午餐，尝试一些现代日本料理。（建议停留1小时）
- **下午**：
  - **表参道**：前往表参道，参观时尚的商店和设计感强烈的建筑，体验东京的现代都市风貌。（建议停留2-3小 时）
- **晚上**：
  - **六本木新城**：前往六本木新城，参观美术馆、电影院和餐厅，享受东京的夜生活。（建议停留2-3小时）   

### 第三天：购物与休闲
- **上午**：
  - **涩谷109**：前往涩谷109，这里是年轻人的时尚潮流中心，可以找到各种流行的服装品牌。（建议停留1-2小 时）
- **中午**：
  - 在涩谷的餐馆享用午餐，尝试一些当地的特色美食。（建议停留1小时）
- **下午**：
  - **明治神宫**：前往明治神宫，参观这个宁静的神社，体验日本的传统宗教仪式。（建议停留1-2小时）       
- **晚上**：
  - **银座**：前往银座，这里是高端购物的天堂，可以找到国际奢侈品牌和日本本土品牌。（建议停留2-3小时） 
  - **银座的高级餐厅**：在银座的高级餐厅享用晚餐，结束美好的东京之旅。（建议停留1-2小时）

### 交通指南
- **地铁/电车**：东京的公共交通系统发达且准时，建议购买一日券或多日券以节省费用。使用Google Maps或Yahoo! Japan Map可以方便地查询路线和换乘信息。
- **出租车**：对于不熟悉路线或者携带大量行李的游客，可以选择乘坐出租车，但价格相对较高。

希望这份行程能帮助您度过一个愉快的东京之旅！如果有任何问题，请随时联系我。
======
Task tokyo_trip_plan_with_search.1 completed successfully.
Worker node 1f0da1fb-fc98-4c70-9dc2-535058fa7990 (负责评估行程质量并提出优化建议) get task tokyo_trip_plan_with_search.2: Subtask 3 (1f0da1fb-fc98-4c70-9dc2-535058fa7990): 评估行程质量并提出优化建议      
======
Reply from Worker node 1f0da1fb-fc98-4c70-9dc2-535058fa7990 (负责评估行程质量并提出优化建议):

根据提供的行程规划，以下是对东京三日游行程的评估和优化建议：

### 评估
- **时间安排是否合理**：整体时间安排较为合理，每个活动的时间分配适当，没有过于紧凑的情况。每天的活动量适中，游客可以在充分体验每个景点的同时，也有时间休息。
- **交通是否便利**：东京的公共交通系统非常发达，行程中提到的地铁和电车是最便捷的交通方式。建议购买一日券或多日券，这样可以节省交通费用并减少购票时间。
- **费用预算是否适中**：中等预算下，行程中的景点和活动选择较为合适。特别是免费或低成本的景点（如浅草寺、上野公园、明治神宫等），以及一些经济实惠的餐饮选择（如居酒屋、寿司店等），都符合中等预算的要求。    
- **文化体验是否丰富**：行程涵盖了丰富的文化体验，既有传统的寺庙和神社（如浅草寺、明治神宫），也有现代的城市景观（如东京晴空塔、表参道）。此外，还包括了购物和美食体验，能够满足不同兴趣的游客。
- **是否适合目标游客群体**：行程非常适合首次访问东京的游客，尤其是对购物和美食感兴趣的游客。行程中的景点和活动既展示了东京的传统文化，又体现了其现代都市风貌。

### 优化建议
1. **增加休息时间**：虽然整体时间安排合理，但在每个活动之间可以适当增加一些自由时间，让游客可以根据自 己的节奏调整行程。
2. **提供具体交通信息**：建议在行程中提供具体的交通线路和换乘信息，特别是在转乘频繁的情况下，可以帮助 游客更高效地到达目的地。
3. **增加夜间活动选项**：虽然行程中已经包含了一些夜间活动（如居酒屋、六本木新城），但可以考虑增加更多 夜间活动选项，如夜游东京湾、观看歌舞伎表演等，以丰富夜生活体验。
4. **推荐经济实惠的住宿**：对于中等预算的游客，可以推荐一些经济实惠且位置便利的住宿选择，如胶囊旅馆、 商务酒店等。
5. **提供备用方案**：考虑到天气等因素可能影响某些户外活动，建议为每个主要活动提供一个备用方案，以确保 行程顺利进行。

希望这些建议能帮助您进一步完善东京三日游的行程规划，确保游客有一个愉快的旅行体验。
======
 Task tokyo_trip_plan_with_search.2 completed successfully.

================================================================================
 任务处理完成 
================================================================================
任务ID: tokyo_trip_plan_with_search

🎉Workforce 演示成功！

提示：如果搜索遇到速率限制，系统会自动使用内置知识库

我们可以看到，目前搜索工具正常调用并且收集网页端最新数据信息，以确保当前旅游规划是最符合当前时间的。

Agent-camel框架练习（3）

Posted on 2025-07-17 Edited on 2025-07-20 In 自主练习

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

Task1

给Workforce的简单实践部分新增一个agent，重新编排功能。

我根据自己的兴趣爱好重新构建了一下Workforce案例（具体信息在同章节的学习记录中），该部分主要展示对agent的重新编排，以及最终的展现效果：
让我们先简单回顾下学习笔记中的主要agent角色组成：

东京旅游专家 (Researcher Agent)：
角色定位：一位经验丰富的东京旅游专家。
职责：利用其丰富的内置知识提供东京的景点、美食、交通和购物信息，不再进行网络搜索，以确保信息来源可控且避免速率限制。

高级旅游规划师 (Planner Agent)：
角色定位：专业的行程规划师。
职责：根据“东京旅游专家”提供的信息和游客的详细需求，精心制定一份合理、详细且吸引人的3日东京旅游行程，注重时间、交通和体验平衡。

资深旅行评论员 (Reviewer Agent)：
角色定位：眼光独到的旅行评论员。
职责：严格评估规划师制定的行程，从实用性、趣味性、性价比、潜在问题和文化体验等多个维度给出建设性反馈和优化建议。

我主要在Workforce中添加了两个单独的Agent，分别为AI用户agent以及最终整合agent：

1.AI用户agent

新增AI用户Agent 
ai_user_agent = ChatAgent(
    system_message="AI智能用户代理，代表真实用户参与旅游规划过程"
)
用户画像：
-26岁软件工程师，首次访问东京
-对动漫文化和科技产品很感兴趣
-喜欢拍照分享到社交媒体
-不喜欢太早起床，偏好10点后开始活动
-预算中等，注重性价比和独特体验

个性化需求示例：
"我希望能找到一些小众但很有特色的动漫主题咖啡店"
"我不太喜欢太早起床，希望每天的行程从上午10点开始"
"希望能安排一些适合拍照的网红打卡点，特别是现代建筑"
"我想买一些日本独有的科技产品，但不要太贵的"

实现代码：

 1. AI用户Agent - 表达个性化需求
ai_user_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="AI智能用户代理",
        content="""你是一个智能的AI用户代理，代表真实用户参与旅游规划过程。

        用户画像（你需要扮演的角色）：
        - 26岁的软件工程师，首次访问东京
        - 对日本动漫文化和科技产品很感兴趣
        - 喜欢拍照分享到社交媒体（Instagram风格）
        - 不喜欢太早起床，偏好10点后开始活动
        - 预算中等，注重性价比和独特体验
        - 对传统文化有兴趣但不想走太多路
        - 希望体验地道的日本生活方式

        你的任务：
        1. 主动表达具体的个性化需求和偏好
        2. 提出实际的限制条件和特殊要求
        3. 对规划过程中的建议给出用户反馈
        4. 确保最终行程符合你的个性化需求

        个性化需求示例（你应该表达的内容）：
        - "我希望能找到一些小众但很有特色的动漫主题咖啡店"
        - "我不太喜欢太早起床，希望每天的行程从上午10点开始"
        - "我想体验一次传统的日式早餐，但希望是在酒店附近"
        - "我对寺庙很感兴趣，但希望选择不需要爬太多台阶的"
        - "希望能安排一些适合拍照的网红打卡点，特别是现代建筑"
        - "我想买一些日本独有的科技产品，但不要太贵的"
        - "希望能体验一次日本的温泉或者传统澡堂"

        表达方式：
        - 用第一人称表达需求："我希望..."、"我不喜欢..."
        - 提供具体的偏好和限制条件
        - 表达对某些活动的兴趣程度
        - 提出实际的担忧和问题

        输出格式：

        ## 我的个性化旅游需求
    
        ### 基本偏好
        - [具体偏好1]
        - [具体偏好2]
    
        ### 时间安排偏好
        - [时间相关需求]
    
        ### 特殊兴趣
        - [兴趣点1]
        - [兴趣点2]
    
        ### 限制条件
        - [限制1]
        - [限制2]
    
        ### 期望体验
        - [期望体验1]
        - [期望体验2]
        """
    ),
    model=model
)

2.最终整合agent

新增最终整合Agent 
final_integrator_agent = ChatAgent(
    system_message="最终行程整合专员，整合所有信息生成标准化版本"
)
核心功能：
-采用统一的标准输出格式
-整合所有专员的建议和信息
-应用评审员的改进建议
-提供完整的预算和实用信息

实现代码：

 5. 个性化最终整合专员
personalized_integrator_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="个性化最终整合专员",
        content="""你是个性化最终整合专员。你的职责是整合所有信息，生成高度个性化的最终旅游行程。

        核心职责：
        1. 整合AI用户的个性化需求
        2. 采纳个性化规划师的行程安排
        3. 应用个性化评审员的改进建议
        4. 生成符合用户个性的标准化最终行程

        个性化最终输出格式：
       
        # 个性化东京3日旅游行程 - 最终版本

        ## 用户画像与需求
        - 用户类型：[用户特征]
        - 核心需求：[主要个性化需求]
        - 特殊偏好：[用户偏好]
        - 限制条件：[用户限制]

        ## 个性化行程概览
        - 设计理念：[个性化设计思路]
        - 主要特色：[行程个性化亮点]
        - 预算水平：[符合用户预算]

        ## 详细个性化行程

        ### 第一天：[个性化主题]
        **时间安排** (遵循用户10点后开始的偏好)
        - 10:00-12:00 | [个性化景点选择]
          - 选择理由：[为什么符合用户需求]
          - 个性化体验：[独特体验点]
          - 拍照建议：[满足用户拍照需求]
          - 交通：[便利交通，减少步行]
          - 预算：[符合用户预算]

        - 12:00-13:30 | 个性化午餐
          - 推荐：[符合用户偏好的餐厅]
          - 特色：[为什么推荐]
          - 用户匹配：[如何满足用户需求]

        [继续其他时间段...]

        ## 个性化实用信息
        ### 用户专属建议
        - 动漫文化体验：[具体建议]
        - 科技产品购物：[购物指南]
        - 拍照打卡攻略：[拍照建议]

        ### 个性化预算参考
        - 符合用户预算的费用分配
        - 性价比最高的选择

        ### 用户专属贴心提醒
        - [针对用户特点的提醒]
        - [个性化注意事项]
      

        整合要求：
        - 必须体现高度的个性化
        - 每个安排都要说明如何满足用户需求
        - 确保最终行程的独特性和实用性"""
    ),
    model=model
)

其它更改优化项：

运行后我们发现研究员 Agent部分直接生成了详细的时间日程表。
这与智能规划师Agent的工作内容相互重合，存在生成重复内容的可能性。
所以我们重新改进两部分Agent的提示模板，确保功能生成不重合：

# 2. 个性化信息收集专员 - 根据AI用户需求收集信息
personalized_info_collector_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="个性化信息收集专员",
        content="""你是个性化信息收集专员。你的职责是根据AI用户的具体需求，收集相关的旅游信息。

        核心职责：
        1. 仔细分析AI用户提出的个性化需求
        2. 针对用户的特殊兴趣收集相关信息
        3. 搜索符合用户偏好的景点、餐厅、活动
        4. 收集用户关心的实用信息（价格、时间、交通）
        5. 特别关注用户的限制条件和特殊要求

        收集重点（根据用户需求调整）：
        - 动漫主题咖啡店和相关景点
        - 适合拍照的现代建筑和网红打卡点
        - 不需要早起的活动安排
        - 交通便利、步行较少的景点
        - 科技产品购物场所和价格信息
        - 温泉或传统澡堂体验
        - 地道的日式早餐推荐

        输出格式：
        
        ## 个性化信息收集报告

        ### 针对用户兴趣的特色推荐
        **动漫文化相关**
        - [具体推荐1]
        - [具体推荐2]

        **科技产品购物**
        - [购物地点和价格信息]

        **拍照打卡点**
        - [网红景点推荐]

        ### 符合用户限制条件的选择
        **10点后开始的活动**
        - [适合的景点和开放时间]

        **步行较少的景点**
        - [交通便利的推荐]

        ### 实用信息
        - 价格区间：[具体价格]
        - 交通方式：[详细交通]
        - 营业时间：[开放时间]
        

        **重要要求：
        - 必须基于AI用户的具体需求收集信息
        - 不要制定行程，只提供信息
        - 重点关注用户的个性化偏好"""
    ),
    model=model,
    tools=[safe_search.safe_search_duckduckgo]
)

# 3. 个性化行程规划师 - 整合用户需求制定行程
personalized_planner_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="个性化行程规划师",
        content="""你是个性化行程规划师。你的职责是根据AI用户的个性化需求和收集到的信息，制定高度个性化的旅游行程。

        核心职责：
        1. 深度理解AI用户的个性化需求和偏好
        2. 将用户需求与收集到的信息完美结合
        3. 制定符合用户生活习惯的行程安排
        4. 优先满足用户的特殊兴趣和要求
        5. 考虑用户的限制条件和实际情况

        个性化规划原则：
        - 严格按照用户的时间偏好安排（10点后开始）
        - 优先安排用户感兴趣的活动（动漫、科技、拍照）
        - 考虑用户的体力限制（减少步行，选择交通便利地点）
        - 平衡用户兴趣与传统文化体验
        - 安排符合用户预算的活动

        输出格式：

        ## 个性化东京3日旅游行程

        ### 行程设计理念
        - 基于用户需求：[用户主要需求]
        - 个性化特色：[行程特色]

        ### 第一天：[个性化主题]
        **上午 (10:00-12:00)** - 考虑用户不喜欢早起
        - 景点：[符合用户兴趣的景点]
        - 个性化理由：[为什么选择这个景点]
        - 交通：[便利的交通方式]
        - 拍照建议：[适合拍照的角度/时间]

        **中午 (12:00-13:30)**
        - 用餐：[符合用户偏好的餐厅]
        - 特色：[为什么推荐]

        **下午 (13:30-17:00)**
        - 活动：[个性化活动安排]
        - 用户兴趣匹配：[如何满足用户需求]

        **晚上 (17:00-21:00)**
        - 安排：[晚间个性化活动]


        **个性化要求：
        - 每个安排都要说明如何满足用户的个性化需求
        - 严格遵守用户的限制条件
        - 优先考虑用户的特殊兴趣"""
    ),
    model=model
)

并且重新编排了各个工作节点的调用和协调工作：

#--------------------------------------------------
# 创建个性化Workforce
#--------------------------------------------------

coordinator_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="个性化工作组协调员",
        content="""你是个性化工作组协调员，负责协调五个专业角色的工作：
        1. AI用户代理 - 表达个性化需求和偏好
        2. 个性化信息收集专员 - 根据用户需求收集相关信息
        3. 个性化行程规划师 - 制定个性化行程安排
        4. 个性化质量评审员 - 评估个性化程度和质量
        5. 个性化最终整合专员 - 生成个性化最终版本
        
        确保整个流程以用户的个性化需求为核心，每个环节都要体现个性化特色。"""
    ),
    model=model
)

from camel.toolkits import TaskPlanningToolkit
task_agent = ChatAgent(
    system_message=BaseMessage.make_assistant_message(
        role_name="个性化任务规划专家",
        content="你负责将个性化旅游规划任务分解为五个明确的子任务，确保用户需求在每个环节都得到充分体现。"
    ),
    model=model,
    tools=TaskPlanningToolkit().get_tools()
)

# 创建个性化 Workforce
travel_workforce = Workforce(
    description="东京个性化旅游规划工作组（AI用户交互优化版）",
    coordinator_agent=coordinator_agent,
    task_agent=task_agent
)

# 按照个性化工作流程顺序添加节点
travel_workforce.add_single_agent_worker(
    "AI用户代理：表达个性化旅游需求、偏好和限制条件",
    worker=ai_user_agent
).add_single_agent_worker(
    "个性化信息收集专员：根据AI用户的具体需求收集相关旅游信息",
    worker=personalized_info_collector_agent
).add_single_agent_worker(
    "个性化行程规划师：整合用户需求制定高度个性化的旅游行程",
    worker=personalized_planner_agent
).add_single_agent_worker(
    "个性化质量评审员：评估行程的个性化程度和用户需求满足度",
    worker=personalized_reviewer_agent
).add_single_agent_worker(
    "个性化最终整合专员：生成符合用户个性的标准化最终行程",
    worker=personalized_integrator_agent
)

print("AI用户交互优化版 Workforce 实例已创建")

#--------------------------------------------------
# 创建和处理个性化任务
#--------------------------------------------------

ai_user_personalized_task = Task(
    content="""请为一位首次访问东京的用户规划一份高度个性化的3日旅游行程。

    个性化工作流程要求：
    1. AI用户代理：表达具体的个性化需求和偏好
    2. 个性化信息收集专员：根据用户需求收集相关信息
    3. 个性化行程规划师：制定符合用户个性的行程安排
    4. 个性化质量评审员：评估个性化程度并提出改进建议
    5. 个性化最终整合专员：生成高度个性化的最终版本

    确保整个过程以用户的个性化需求为核心，每个环节都要体现个性化特色。""",
    
    additional_info={
        "用户基础信息": "26岁软件工程师，首次访问东京",
        "核心特征": "对动漫文化和科技产品感兴趣，喜欢拍照分享",
        "时间偏好": "不喜欢早起，偏好10点后开始活动",
        "预算水平": "中等预算，注重性价比和独特体验",
        "当前日期": "2025年7月17日",
        "旅行天数": "3天",
        "特殊要求": "高度个性化，AI用户深度参与"
    },
    id="ai_user_personalized_tokyo_trip"
)

其它部分基本没有很大改动，我们直接看下运行效果吧

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Workforce_with_AI_User_optimized.py
🔧 正在创建AI用户交互优化版 Workforce...
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_linkup'. The parameter definition is {'enum': ['searchResults', 'sourcedAnswer', 'structured'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'enum': ['OneDay', 'OneWeek', 'OneMonth', 'OneYear', 'NoLimit'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'anyOf': [{'enum': ['finance', 'law', 'medical', 'internet', 'tax', 'news_province', 'news_center'], 'type': 'string'}, {'type': 'null'}], 'type': ['null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:512: UserWarning: Function description is missing for 
                          safe_search_duckduckgo. This may 
                          affect the quality of tool calling.
  warnings.warn(f"""Function description is missing for
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'safe_search_duckduckgo'. The parameter definition is {'type': 'string'}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'safe_search_duckduckgo'. The parameter definition is {'type': ['integer', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
✅ 所有个性化工作节点已定义
✅ AI用户交互优化版 Workforce 实例已创建

🚀 开始处理AI用户个性化任务...

📋 个性化工作流程：
1️⃣ AI用户代理 - 表达个性化需求
2️⃣ 个性化信息收集 - 针对性收集信息
3️⃣ 个性化行程规划 - 制定个性化行程
4️⃣ 个性化质量评审 - 评估个性化程度
5️⃣ 个性化最终整合 - 生成个性化最终版本
Worker node 1dbec809-1ab0-4406-accc-ed6c993d2251 (AI用户代理：表达个性化旅游需求、偏好和限制条件) get task ai_user_personalized_tokyo_trip.0: Subtask 1 (1dbec809-1ab0-4406-accc-ed6c993d2251): 表达具体个性化需求，包括对动漫文化、科技产品的兴趣， 以及拍照分享的习惯；同时说明时间偏好（10点后开始 活动）、预算水平（中等预算，注重性价比和独特体验 ）和其他特殊要求。
======
Reply from Worker node 1dbec809-1ab0-4406-accc-ed6c993d2251 (AI用户代理：表达个性化旅游需求、偏好 和限制条件):

## 我的个性化旅游需求

### 基本偏好
- 我对日本动漫文化和科技产品非常感兴趣，希望能参 观一些与这些主题相关的地点。
- 我喜欢拍照，并且会经常在社交媒体上分享照片，所 以希望行程中能包含一些适合拍照的网红打卡点。     

### 时间安排偏好
- 我不太喜欢太早起床，希望每天的行程从上午10点开 始。

### 特殊兴趣
- 我希望能找到一些小众但很有特色的动漫主题咖啡店 。
- 我想体验一次传统的日式早餐，但希望是在酒店附近 。
- 我对寺庙很感兴趣，但希望选择不需要爬太多台阶的 。
- 希望能安排一些适合拍照的网红打卡点，特别是现代 建筑。
- 我想买一些日本独有的科技产品，但不要太贵的。   
- 希望能体验一次日本的温泉或者传统澡堂。

### 限制条件
- 我的预算是中等水平，更注重性价比和独特的体验。 
- 我对传统文化有兴趣，但不想走太多路。
- 我希望体验地道的日本生活方式。

### 期望体验
- 我希望能深入体验东京的现代与传统文化，尤其是在 动漫和科技方面。
- 我希望通过这次旅行获得一些难忘的回忆和独特的体 验。
======
🎯 Task ai_user_personalized_tokyo_trip.0 completed successfully.
Worker node fa3a5315-0238-4ac3-a568-08d65bc71790 (个性化信息收集专员：根据AI用户的具体需求收集相关旅游信息) get task ai_user_personalized_tokyo_trip.1: Subtask 2 (fa3a5315-0238-4ac3-a568-08d65bc71790): 根据AI用户代理提供的个性化需求，收集相关的 旅游信息，包括但不限于动漫文化地点、科技展览、摄 影友好的景点等。
======
Reply from Worker node fa3a5315-0238-4ac3-a568-08d65bc71790 (个性化信息收集专员：根据AI用户的具体 需求收集相关旅游信息):

## 个性化信息收集报告

### 针对用户兴趣的特色推荐
**动漫文化相关**
- **动漫主题咖啡店**：位于秋叶原的『AniCafe』，环境布置充满动漫元素，提供特色饮品和轻食，非常适合 动漫爱好者。
- **参观地点**：『东京动漫中心』，位于池袋，不仅 有最新的动漫资讯，还有丰富的周边商品可以购买。   

**科技产品购物**
- **购物地点**：位于秋叶原的『Yodobashi Camera』 ，这里可以买到各种电子产品，价格合理，适合中等预 算的游客。

**拍照打卡点**
- **现代建筑**：『六本木之丘』，这里有许多设计感 极强的现代建筑，是拍照的好地方。

### 符合用户限制条件的选择
**10点后开始的活动**
- **六本木之丘**：开放时间为10:00至23:00，无需早 起即可享受。

**步行较少的景点**
- **新宿御苑**：位于市中心，交通便利，可轻松到达 ，园内有许多美丽的景观，适合散步。

### 实用信息
- 价格区间：动漫主题咖啡店消费约为1000-2000日元，东京动漫中心入场免费，Yodobashi Camera的产品价格 因商品而异。
- 交通方式：秋叶原、池袋、六本木之丘均有地铁站直 达，新宿御苑邻近新宿站，出行十分方便。
- 营业时间：AniCafe营业时间为11:00-22:00，东京动 漫中心为10:00-21:00，Yodobashi Camera为10:00-21:00。
======
🎯 Task ai_user_personalized_tokyo_trip.1 completed successfully.
Worker node de9603b3-574e-4a2b-9259-01afe46df728 (个性化行程规划师：整合用户需求制定高度个性化的旅游行程) get task ai_user_personalized_tokyo_trip.2: Subtask 3 (de9603b3-574e-4a2b-9259-01afe46df728): 整合从个性化信息收集专员处获得的信息，制定符 合用户个性的3日旅游行程，确保行程中的每个活动都能满足用户的特定偏好和时间安排。
======
Reply from Worker node de9603b3-574e-4a2b-9259-01afe46df728 (个性化行程规划师：整合用户需求制定高 度个性化的旅游行程):

## 个性化东京3日旅游行程

### 行程设计理念
- 基于用户需求：26岁的软件工程师，首次访问东京， 对动漫文化和科技产品感兴趣，喜欢拍照分享，不喜欢 早起，偏好10点后开始活动，预算中等，注重性价比和 独特体验。
- 个性化特色：结合用户的兴趣和限制条件，安排了动 漫主题咖啡店、科技产品购物、现代建筑拍照打卡点、 步行较少的景点等。

### 第一天：动漫与现代建筑之旅
**上午 (10:00-12:00)** - 考虑用户不喜欢早起      
- 景点：六本木之丘
- 个性化理由：六本木之丘有许多设计感极强的现代建 筑，非常适合拍照打卡。
- 交通：乘坐地铁从酒店出发，直达六本木站，交通便 利。
- 拍照建议：六本木之丘的摩天轮和户外广场是拍照的 最佳地点，建议在上午光线柔和时拍摄。

**中午 (12:00-13:30)**
- 用餐：六本木之丘内的『森大厦』
- 特色：提供多样的餐饮选择，可以在高楼上俯瞰东京 全景，体验独特的用餐环境。

**下午 (13:30-17:00)**
- 活动：参观东京动漫中心
- 用户兴趣匹配：东京动漫中心不仅有最新的动漫资讯 ，还有丰富的周边商品可以购买，非常适合动漫爱好者 。
- 交通：乘坐地铁从六本木站到池袋站，约20分钟。   

**晚上 (17:00-21:00)**
- 安排：体验秋叶原的动漫主题咖啡店『AniCafe』    
- 个性化理由：AniCafe环境布置充满动漫元素，提供特色饮品和轻食，非常适合拍照分享。

### 第二天：科技与传统文化体验
**上午 (10:00-12:00)**
- 景点：Yodobashi Camera
- 个性化理由：秋叶原的Yodobashi Camera可以买到各 种电子产品，价格合理，适合中等预算的游客。       
- 交通：继续留在秋叶原，交通便利。
- 拍照建议：秋叶原的街头有很多动漫和游戏元素，适 合拍照。

**中午 (12:00-13:30)**
- 用餐：秋叶原附近的『秋叶原电波塔』
- 特色：提供日式传统美食，同时可以欣赏到秋叶原的 繁华景象。

**下午 (13:30-17:00)**
- 活动：参观新宿御苑
- 用户兴趣匹配：新宿御苑位于市中心，交通便利，园 内有许多美丽的景观，适合散步。
- 交通：乘坐地铁从秋叶原站到新宿站，约15分钟。   

**晚上 (17:00-21:00)**
- 安排：体验日式温泉
- 个性化理由：在新宿区的『大江户温泉物语』体验日 式温泉，放松身心。

### 第三天：传统文化与现代生活融合
**上午 (10:00-12:00)**
- 景点：浅草寺
- 个性化理由：浅草寺是东京著名的寺庙，但可以选择 不需要爬太多台阶的入口。
- 交通：乘坐地铁从新宿站到浅草站，约30分钟。     
- 拍照建议：雷门和五重塔是拍照的最佳地点，建议在 上午光线柔和时拍摄。

**中午 (12:00-13:30)**
- 用餐：浅草寺附近的『天妇罗』
- 特色：提供地道的日式天妇罗，体验传统的日本美食 。

**下午 (13:30-17:00)**
- 活动：参观上野公园
- 用户兴趣匹配：上野公园内有许多博物馆和文化设施 ，适合深入了解日本文化。
- 交通：步行即可到达上野公园。

**晚上 (17:00-21:00)**
- 安排：体验日式澡堂
- 个性化理由：在上野区的『汤岛温泉』体验传统的日 式澡堂，感受地道的日本生活方式。

======
🎯 Task ai_user_personalized_tokyo_trip.2 completed successfully.
Worker node 3644bbd1-8ef3-4732-8af8-5989b421cdaf (个性化质量评审员：评估行程的个性化程度和用户需求满足度) get task ai_user_personalized_tokyo_trip.3: Subtask 4 (3644bbd1-8ef3-4732-8af8-5989b421cdaf): 评估个性化行程的个性化程度和用户需求满足度， 提供具体的改进建议，确保行程能够最大化地反映用户 的个性化需求。
======
Reply from Worker node 3644bbd1-8ef3-4732-8af8-5989b421cdaf (个性化质量评审员：评估行程的个性化程 度和用户需求满足度):

## 个性化行程评审报告

### 整体个性化评分：[8/10分]

### 详细评估：
**用户需求满足度** [8/10分]
- 满足的需求：
  - 行程从10点开始
  - 参观动漫主题咖啡店和东京动漫中心
  - 体验日式温泉和传统澡堂
  - 购买科技产品
  - 参观现代建筑拍照打卡点
- 未满足的需求：
  - 体验传统的日式早餐（未安排在酒店附近）       
  - 访问小众但有特色的动漫主题咖啡店（只安排了一 个普通的AniCafe）
  - 选择不需要爬太多台阶的寺庙（浅草寺可能需要爬 一些台阶）

**时间偏好遵守** [9/10分]
- 优点：
  - 所有活动都从10点开始，符合用户的时间偏好     
- 问题：
  - 个别活动时间安排较为紧凑，可能会有些赶       

**兴趣匹配度** [8/10分]
- 动漫文化：
  - 匹配程度较高，安排了动漫主题咖啡店和东京动漫 中心
- 科技购物：
  - 匹配程度较高，安排了Yodobashi Camera
- 拍照需求：
  - 匹配程度较高，安排了六本木之丘和浅草寺等拍照 打卡点

**限制条件考虑** [7/10分]
- 步行限制：
  - 大部分活动交通便利，但浅草寺可能需要步行较多 
- 预算限制：
  - 价格合理，符合中等预算的要求

### 个性化改进建议：
1. **针对用户需求的具体改进**：
   - 在第一天的早晨安排一次传统的日式早餐，最好在酒店附近。
   - 考虑安排一个小众但有特色的动漫主题咖啡店，而不是常见的AniCafe。
   - 选择一个不需要爬太多台阶的寺庙，如增上寺。  
2. **提高个性化程度的建议**：
   - 增加一些独特的体验，如参加一次动漫角色扮演活动或参观一些独立的科技创业公司。
3. **更好满足用户兴趣的建议**：
   - 在行程中增加一些摄影工作坊或摄影导游，帮助用户更好地拍摄照片。

### 个性化优化重点：
- **增强体验的多样性和独特性**：通过增加小众和独 特的活动来提升整体体验。
- **优化时间和交通安排**：确保活动之间的交通更加 便捷，减少不必要的赶时间。
======
🎯 Task ai_user_personalized_tokyo_trip.3 completed successfully.
Worker node 4f38663a-1423-4aa2-bf15-9e714d3d1f6a (个性化最终整合专员：生成符合用户个性的标准化最终行程) get task ai_user_personalized_tokyo_trip.4: Subtask 5 (4f38663a-1423-4aa2-bf15-9e714d3d1f6a): 根据个性化质量评审员的反馈，调整并优化行程，生 成最终的高度个性化旅游行程，并确保其格式规范，便 于用户查看和使用。
======
Reply from Worker node 4f38663a-1423-4aa2-bf15-9e714d3d1f6a (个性化最终整合专员：生成符合用户个性 的标准化最终行程):

# 个性化东京3日旅游行程 - 最终版本

## 用户画像与需求
- 用户类型：26岁软件工程师，首次访问东京
- 核心需求：对动漫文化和科技产品感兴趣，喜欢拍照 分享
- 特殊偏好：不喜欢早起，偏好10点后开始活动，预算 中等，注重性价比和独特体验
- 限制条件：对传统文化有兴趣，但不想走太多路，希 望体验地道的日本生活方式

## 个性化行程概览
- 设计理念：基于用户需求，结合用户的兴趣和限制条 件，安排了动漫主题咖啡店、科技产品购物、现代建筑 拍照打卡点、步行较少的景点等。
- 主要特色：深度体验东京的现代与传统文化，特别是 在动漫和科技方面。
- 预算水平：中等预算，注重性价比和独特体验       

## 详细个性化行程

### 第一天：动漫与现代建筑之旅
**时间安排** (遵循用户10点后开始的偏好)
- 10:00-12:00 | 六本木之丘
  - 选择理由：六本木之丘有许多设计感极强的现代建 筑，非常适合拍照打卡。
  - 个性化体验：摩天轮和户外广场是拍照的最佳地点 ，建议在上午光线柔和时拍摄。
  - 拍照建议：六本木之丘的摩天轮和户外广场是拍照 的最佳地点，建议在上午光线柔和时拍摄。
  - 交通：乘坐地铁从酒店出发，直达六本木站，交通 便利。
  - 预算：免费进入，拍照无需额外费用。

- 12:00-13:30 | 个性化午餐
  - 推荐：六本木之丘内的『森大厦』
  - 特色：提供多样的餐饮选择，可以在高楼上俯瞰东 京全景，体验独特的用餐环境。
  - 用户匹配：符合用户喜欢拍照和体验独特环境的需 求。

- 13:30-17:00 | 东京动漫中心
  - 选择理由：东京动漫中心不仅有最新的动漫资讯， 还有丰富的周边商品可以购买，非常适合动漫爱好者。 
  - 个性化体验：可以购买到最新的动漫周边商品，了 解最新动漫资讯。
  - 交通：乘坐地铁从六本木站到池袋站，约20分钟。 
  - 预算：入场免费，周边商品价格适中。

- 17:00-21:00 | 小众动漫主题咖啡店
  - 推荐：秋叶原的『Maidreamin』
  - 选择理由：Maidreamin是一家以女仆服务为主题的 咖啡店，环境布置充满动漫元素，提供特色饮品和轻食 ，非常适合拍照分享。
  - 个性化体验：可以体验独特的女仆服务，拍照分享 。
  - 交通：乘坐地铁从池袋站到秋叶原站，约15分钟。 
  - 预算：消费约为1000-2000日元。

### 第二天：科技与传统文化体验
**时间安排** (遵循用户10点后开始的偏好)
- 10:00-12:00 | Yodobashi Camera
  - 选择理由：秋叶原的Yodobashi Camera可以买到各 种电子产品，价格合理，适合中等预算的游客。       
  - 个性化体验：可以购买到日本独有的科技产品，体 验科技购物的乐趣。
  - 拍照建议：秋叶原的街头有很多动漫和游戏元素， 适合拍照。
  - 交通：继续留在秋叶原，交通便利。
  - 预算：产品价格因商品而异，但总体价格合理。   

- 12:00-13:30 | 个性化午餐
  - 推荐：秋叶原附近的『秋叶原电波塔』
  - 特色：提供日式传统美食，同时可以欣赏到秋叶原 的繁华景象。
  - 用户匹配：符合用户喜欢体验地道日本生活方式的 需求。

- 13:30-17:00 | 新宿御苑
  - 选择理由：新宿御苑位于市中心，交通便利，园内 有许多美丽的景观，适合散步。
  - 个性化体验：可以在园内漫步，欣赏美丽的自然风 光。
  - 交通：乘坐地铁从秋叶原站到新宿站，约15分钟。 
  - 预算：门票价格适中。

- 17:00-21:00 | 日式温泉体验
  - 推荐：新宿区的『大江户温泉物语』
  - 选择理由：体验日式温泉，放松身心。
  - 个性化体验：可以享受传统的日式温泉，放松身心 。
  - 交通：从新宿站步行即可到达。
  - 预算：消费约为2000-3000日元。

### 第三天：传统文化与现代生活融合
**时间安排** (遵循用户10点后开始的偏好)
- 10:00-12:00 | 增上寺
  - 选择理由：增上寺是东京著名的寺庙，但可以选择 不需要爬太多台阶的入口。
  - 个性化体验：可以在寺庙内参观，体验宁静的氛围 。
  - 拍照建议：寺庙内的建筑和景观是拍照的最佳地点 ，建议在上午光线柔和时拍摄。
  - 交通：乘坐地铁从新宿站到增上寺站，约20分钟。 
  - 预算：门票免费。

- 12:00-13:30 | 个性化午餐
  - 推荐：增上寺附近的『天妇罗』
  - 特色：提供地道的日式天妇罗，体验传统的日本美 食。
  - 用户匹配：符合用户喜欢体验地道日本生活方式的 需求。

- 13:30-17:00 | 上野公园
  - 选择理由：上野公园内有许多博物馆和文化设施， 适合深入了解日本文化。
  - 个性化体验：可以参观博物馆，了解日本的历史和 文化。
  - 交通：乘坐地铁从增上寺站到上野站，约30分钟。 
  - 预算：公园免费进入，博物馆门票价格适中。     

- 17:00-21:00 | 日式澡堂体验
  - 推荐：上野区的『汤岛温泉』
  - 选择理由：体验传统的日式澡堂，感受地道的日本 生活方式。
  - 个性化体验：可以享受传统的日式澡堂，放松身心 。
  - 交通：从上野站步行即可到达。
  - 预算：消费约为1000-2000日元。

## 个性化实用信息
### 用户专属建议
- 动漫文化体验：参观东京动漫中心和小众动漫主题咖 啡店，体验动漫文化。
- 科技产品购物：在Yodobashi Camera购买日本独有的 科技产品。
- 拍照打卡攻略：六本木之丘的摩天轮和户外广场、增 上寺的建筑和景观、上野公园的自然风光都是拍照的最 佳地点。

### 个性化预算参考
- 符合用户预算的费用分配：
  - 住宿：中等预算酒店
  - 交通：地铁为主，部分步行
  - 餐饮：中等预算餐厅和特色小吃
  - 门票：免费或价格适中的景点
- 性价比最高的选择：
  - 东京动漫中心（免费入场）
  - 新宿御苑（门票适中）
  - 上野公园（免费进入）

### 用户专属贴心提醒
- 体验日式早餐：建议在酒店附近的小餐馆尝试传统的 日式早餐。
- 选择不需要爬太多台阶的寺庙：增上寺是一个不错的 选择。
- 保持相机电量充足：拍照是旅行的重要部分，确保相 机电量充足。
- 注意天气变化：东京夏季多雨，建议携带雨具。     
======
🎯 Task ai_user_personalized_tokyo_trip.4 completed successfully.

========================================================================================================================
🎯 AI用户个性化任务处理完成
========================================================================================================================
任务ID: ai_user_personalized_tokyo_trip

🎉Workforce 演示成功！

我们可以看到系统的基础功能均已基本实现
需求结构化完整：按照基本偏好、时间安排、特殊兴趣、限制条件、期望体验分类

且agent角色分工明确无重叠
信息收集专员：只收集信息，没有制定行程
行程规划师：专门制定行程，整合用户需求
质量评审员：专业评估，给出具体评分和建议
最终整合专员：生成标准化最终版本

个性化程度高
深度个性化：每个安排都说明了如何满足用户需求
时间偏好严格遵守：所有活动都从10点开始
兴趣匹配精准：动漫文化、科技产品、拍照需求都得到满足

Task2

在Workforce系统中加入具备不同种类工具的RolePlaying和ChatAgent作为worker，实现一个你自己的多智能体系统来解决复杂场景问题。我们仍然选择之前在第二章研究的运动场地推荐系统继续搭建并完善功能

from camel.agents import ChatAgent, TaskSpecifyAgent
from camel.models import ModelFactory
from camel.prompts import TextPrompt
from camel.types import ModelPlatformType, TaskType
from camel.societies import RolePlaying
from camel.societies.workforce import Workforce
from camel.toolkits import SearchToolkit, MathToolkit
from camel.memories import ChatHistoryBlock
from camel.memories.records import MemoryRecord
from camel.messages import BaseMessage
from camel.types import OpenAIBackendRole
from camel.tasks import Task
from colorama import Fore
import os
import random
import json
import re
import time
import traceback
from typing import Dict, List, Tuple, Optional, Callable, Any
from datetime import datetime
from functools import wraps
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 重试装饰器和错误处理系统（保持原有的错误处理机制）
class RetryConfig:
    """重试配置类"""
    def __init__(self, max_retries: int = 3, base_delay: float = 1.0, max_delay: float = 60.0, 
                 backoff_factor: float = 2.0, jitter: bool = True):
        self.max_retries = max_retries
        self.base_delay = base_delay
        self.max_delay = max_delay
        self.backoff_factor = backoff_factor
        self.jitter = jitter

class RetryableError(Exception):
    """可重试的错误类型"""
    pass

class NonRetryableError(Exception):
    """不可重试的错误类型"""
    pass

def smart_retry(config: RetryConfig = None, 
                retryable_exceptions: Tuple = (Exception,),
                non_retryable_exceptions: Tuple = (KeyboardInterrupt, SystemExit)):
    """智能重试装饰器"""
    if config is None:
        config = RetryConfig()
    
    def decorator(func: Callable) -> Callable:
        @wraps(func)
        def wrapper(*args, **kwargs) -> Any:
            last_exception = None
            
            for attempt in range(config.max_retries + 1):
                try:
                    return func(*args, **kwargs)
                    
                except non_retryable_exceptions as e:
                    print(Fore.RED + f"不可重试错误: {e}")
                    raise e
                    
                except retryable_exceptions as e:
                    last_exception = e
                    
                    if attempt == config.max_retries:
                        print(Fore.RED + f"重试{config.max_retries}次后仍然失败: {e}")
                        break
                    
                    # 计算延迟时间
                    delay = min(
                        config.base_delay * (config.backoff_factor ** attempt),
                        config.max_delay
                    )
                    
                    # 添加随机抖动
                    if config.jitter:
                        delay *= (0.5 + random.random() * 0.5)
                    
                    print(Fore.YELLOW + f"第{attempt + 1}次尝试失败: {e}")
                    print(Fore.CYAN + f"{delay:.1f}秒后重试...")
                    
                    time.sleep(delay)
            
            # 如果所有重试都失败了，抛出最后一个异常
            if last_exception:
                raise last_exception
                
        return wrapper
    return decorator

# 错误处理和分类系统
class ErrorHandler:
    """错误处理和分类系统"""
    
    @staticmethod
    def classify_error(error: Exception) -> str:
        """分类错误类型"""
        error_str = str(error).lower()
        error_type = type(error).__name__
        
        # 网络相关错误
        if any(keyword in error_str for keyword in ['connection', 'timeout', 'network', 'http']):
            return "network_error"
        
        # API相关错误
        if any(keyword in error_str for keyword in ['api', 'rate limit', 'quota', 'unauthorized']):
            return "api_error"
        
        # 模型相关错误
        if any(keyword in error_str for keyword in ['model', 'inference', 'generation']):
            return "model_error"
        
        # 数据相关错误
        if any(keyword in error_str for keyword in ['json', 'parse', 'format', 'decode']):
            return "data_error"
        
        # 内存相关错误
        if any(keyword in error_str for keyword in ['memory', 'out of memory', 'oom']):
            return "memory_error"
        
        return "unknown_error"
    
    @staticmethod
    def get_retry_config(error_type: str) -> RetryConfig:
        """根据错误类型获取重试配置"""
        configs = {
            "network_error": RetryConfig(max_retries=5, base_delay=2.0, backoff_factor=1.5),
            "api_error": RetryConfig(max_retries=3, base_delay=5.0, backoff_factor=2.0),
            "model_error": RetryConfig(max_retries=2, base_delay=3.0, backoff_factor=2.0),
            "data_error": RetryConfig(max_retries=2, base_delay=1.0, backoff_factor=1.5),
            "memory_error": RetryConfig(max_retries=1, base_delay=10.0, backoff_factor=1.0),
            "unknown_error": RetryConfig(max_retries=2, base_delay=2.0, backoff_factor=2.0)
        }
        return configs.get(error_type, RetryConfig())
    
    @staticmethod
    def handle_error_with_fallback(error: Exception, fallback_func: Callable = None) -> Any:
        """带降级策略的错误处理"""
        error_type = ErrorHandler.classify_error(error)
        
        print(Fore.RED + f"❌ 检测到错误类型: {error_type}")
        print(Fore.RED + f"❌ 错误详情: {error}")
        
        if fallback_func:
            try:
                print(Fore.YELLOW + "🔄 尝试使用降级策略...")
                return fallback_func()
            except Exception as fallback_error:
                print(Fore.RED + f"❌ 降级策略也失败了: {fallback_error}")
        
        return None

# 创建模型实例（带重试机制和错误处理）
@smart_retry(RetryConfig(max_retries=3, base_delay=2.0))
def create_model_with_retry():
    """带重试机制的模型创建"""
    try:
        return ModelFactory.create(
            model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
            model_type="Qwen/Qwen2.5-72B-Instruct",
            url='https://api-inference.modelscope.cn/v1/',
            api_key=api_key
        )
    except Exception as e:
        error_type = ErrorHandler.classify_error(e)
        print(Fore.RED + f"❌ 模型创建失败 ({error_type}): {e}")
        raise RetryableError(f"模型创建失败: {e}")

model = create_model_with_retry()

# 需求优先级管理系统
class RequirementPriorityManager:
    """用户需求优先级管理系统"""
    
    def __init__(self):
        # 定义需求类型和默认优先级
        self.requirement_types = {
            'sport_preference': {'priority': 10, 'name': '运动类型', 'negotiable': False},
            'location': {'priority': 9, 'name': '地理位置', 'negotiable': True},
            'budget_range': {'priority': 8, 'name': '预算范围', 'negotiable': True},
            'preferred_time': {'priority': 7, 'name': '运动时间', 'negotiable': True},
            'transport_mode': {'priority': 6, 'name': '交通方式', 'negotiable': True},
            'special_needs': {'priority': 5, 'name': '特殊需求', 'negotiable': True},
            'frequency': {'priority': 4, 'name': '运动频率', 'negotiable': True},
            'experience_level': {'priority': 3, 'name': '经验水平', 'negotiable': True}
        }
    
    def get_priority_questions(self, user_needs: Dict) -> List[str]:
        """生成优先级确认问题"""
        questions = []
        negotiable_requirements = []
        
        for req_key, req_info in self.requirement_types.items():
            if req_info['negotiable'] and req_key in user_needs:
                negotiable_requirements.append({
                    'key': req_key,
                    'name': req_info['name'],
                    'value': user_needs[req_key],
                    'priority': req_info['priority']
                })
        
        # 按优先级排序
        negotiable_requirements.sort(key=lambda x: x['priority'], reverse=True)
        
        questions.append("为了帮您找到最合适的运动场馆，请告诉我以下需求的重要程度：")
        
        for i, req in enumerate(negotiable_requirements[:5]):  # 只询问前5个最重要的
            questions.append(f"{i+1}. {req['name']}（当前：{req['value']}）- 这个要求对您有多重要？（必须满足/希望满足/可以妥协）")
        
        return questions
    
    def parse_priority_response(self, response: str, user_needs: Dict) -> Dict:
        """解析用户的优先级回答"""
        priority_levels = {
            'must_have': [],  # 必须满足
            'prefer_have': [],  # 希望满足
            'can_compromise': []  # 可以妥协
        }
        
        # 简化的解析逻辑（实际应用中可以使用更复杂的NLP）
        response_lower = response.lower()
        
        for req_key, req_info in self.requirement_types.items():
            if req_key in user_needs and req_info['negotiable']:
                req_name = req_info['name']
                
                if '必须' in response and req_name in response:
                    priority_levels['must_have'].append(req_key)
                elif '希望' in response and req_name in response:
                    priority_levels['prefer_have'].append(req_key)
                elif '妥协' in response and req_name in response:
                    priority_levels['can_compromise'].append(req_key)
                else:
                    # 默认分类
                    if req_info['priority'] >= 8:
                        priority_levels['must_have'].append(req_key)
                    elif req_info['priority'] >= 6:
                        priority_levels['prefer_have'].append(req_key)
                    else:
                        priority_levels['can_compromise'].append(req_key)
        
        return priority_levels

# 地理范围扩展管理系统
class GeographicExpansionManager:
    """地理搜索范围扩展管理系统"""
    
    def __init__(self):
        # 北京市区域层级结构
        self.beijing_areas = {
            '东城区': {
                'adjacent': ['西城区', '朝阳区', '丰台区'],
                'nearby': ['海淀区', '石景山区'],
                'districts': ['东华门街道', '景山街道', '交道口街道', '安定门街道', '北新桥街道', '东四街道', '朝阳门街道', '建国门街道', '东直门街道', '和平里街道', '前门街道', '崇文门外街道', '东花市街道', '龙潭街道', '体育馆路街道', '天坛街道', '永定门外街道']
            },
            '西城区': {
                'adjacent': ['东城区', '海淀区', '丰台区'],
                'nearby': ['朝阳区', '石景山区'],
                'districts': ['西长安街街道', '新街口街道', '月坛街道', '展览路街道', '德胜街道', '金融街街道', '什刹海街道', '大栅栏街道', '天桥街道', '椿树街道', '陶然亭街道', '广安门内街道', '牛街街道', '白纸坊街道', '广安门外街道']
            },
            '朝阳区': {
                'adjacent': ['东城区', '西城区', '海淀区', '丰台区'],
                'nearby': ['石景山区', '通州区'],
                'districts': ['建外街道', '朝外街道', '呼家楼街道', '三里屯街道', '左家庄街道', '香河园街道', '和平街街道', '安贞街道', '亚运村街道', '小关街道', '酒仙桥街道', '麦子店街道', '团结湖街道', '六里屯街道', '八里庄街道', '双井街道', '劲松街道', '潘家园街道', '垡头街道', '南磨房街道', '高碑店街道', '将台街道', '太阳宫街道', '大屯街道', '望京街道', '小红门街道', '十八里店街道', '平房街道', '东风街道', '奥运村街道', '来广营街道', '常营街道', '三间房街道', '管庄街道', '金盏街道', '孙河街道', '崔各庄街道', '东坝街道', '黑庄户街道', '豆各庄街道', '王四营街道', '东风街道', '六里屯街道']
            },
            '海淀区': {
                'adjacent': ['西城区', '朝阳区', '丰台区', '石景山区'],
                'nearby': ['东城区', '昌平区'],
                'districts': ['万寿路街道', '永定路街道', '羊坊店街道', '甘家口街道', '八里庄街道', '紫竹院街道', '北下关街道', '北太平庄街道', '学院路街道', '中关村街道', '海淀街道', '青龙桥街道', '清华园街道', '燕园街道', '香山街道', '清河街道', '花园路街道', '西三旗街道', '马连洼街道', '田村路街道', '上地街道', '万柳街道', '东升街道', '曙光街道', '温泉镇', '四季青镇', '西北旺镇', '苏家坨镇', '上庄镇']
            },
            '丰台区': {
                'adjacent': ['东城区', '西城区', '朝阳区', '海淀区', '石景山区'],
                'nearby': ['大兴区', '房山区'],
                'districts': ['右安门街道', '太平桥街道', '西罗园街道', '大红门街道', '南苑街道', '东高地街道', '东铁匠营街道', '卢沟桥街道', '丰台街道', '新村街道', '长辛店街道', '云岗街道', '方庄街道', '宛平城地区', '马家堡街道', '和义街道', '长辛店镇', '王佐镇', '卢沟桥乡', '花乡', '南苑乡', '长辛店镇']
            },
            '石景山区': {
                'adjacent': ['海淀区', '丰台区'],
                'nearby': ['西城区', '朝阳区', '门头沟区'],
                'districts': ['八宝山街道', '老山街道', '八角街道', '古城街道', '苹果园街道', '金顶街街道', '广宁街道', '五里坨街道', '鲁谷街道']
            }
        }
    
    def get_expansion_areas(self, original_area: str, expansion_level: int = 1) -> List[str]:
        """获取扩展搜索区域"""
        if original_area not in self.beijing_areas:
            return [original_area]
        
        expansion_areas = [original_area]
        area_info = self.beijing_areas[original_area]
        
        if expansion_level >= 1:
            # 添加相邻区域
            expansion_areas.extend(area_info.get('adjacent', []))
        
        if expansion_level >= 2:
            # 添加附近区域
            expansion_areas.extend(area_info.get('nearby', []))
        
        return list(set(expansion_areas))  # 去重
    
    def get_districts_in_area(self, area: str) -> List[str]:
        """获取区域内的街道列表"""
        if area in self.beijing_areas:
            return self.beijing_areas[area].get('districts', [])
        return []

# 真实性验证系统
class VenueVerificationSystem:
    """运动场馆真实性验证系统"""
    
    def __init__(self):
        # 已知的真实场馆数据库（扩展版）
        self.verified_venues = {
            '北京': {
                '东城区': [
                    {'name': '北京体育馆', 'address': '北京市东城区体育馆路4号', 'sports': ['篮球', '羽毛球', '游泳', '跑步', '健身'], 'verified': True},
                    {'name': '地坛体育馆', 'address': '北京市东城区安定门外大街168号', 'sports': ['篮球', '羽毛球', '乒乓球', '健身'], 'verified': True},
                    {'name': '东城区全民健身中心', 'address': '北京市东城区东直门内大街', 'sports': ['跑步', '健身', '瑜伽', '乒乓球'], 'verified': True},
                ],
                '西城区': [
                    {'name': '首都体育馆', 'address': '北京市西城区中关村南大街54号', 'sports': ['冰球', '花样滑冰', '篮球', '健身'], 'verified': True},
                    {'name': '北京游泳馆', 'address': '北京市西城区北三环中路11号', 'sports': ['游泳', '健身'], 'verified': True},
                    {'name': '西城区体育中心', 'address': '北京市西城区广安门内大街', 'sports': ['跑步', '健身', '篮球', '羽毛球'], 'verified': True},
                ],
                '朝阳区': [
                    {'name': '工人体育馆', 'address': '北京市朝阳区工人体育场北路', 'sports': ['篮球', '排球', '羽毛球', '健身'], 'verified': True},
                    {'name': '朝阳体育中心', 'address': '北京市朝阳区六里屯西里甲1号', 'sports': ['游泳', '健身', '篮球', '跑步'], 'verified': True},
                    {'name': '奥林匹克体育中心', 'address': '北京市朝阳区安定路1号', 'sports': ['游泳', '田径', '足球', '跑步'], 'verified': True},
                    {'name': '朝阳公园体育中心', 'address': '北京市朝阳区朝阳公园南路', 'sports': ['跑步', '健身', '网球', '瑜伽'], 'verified': True},
                    {'name': '三里屯攀岩俱乐部', 'address': '北京市朝阳区三里屯路19号', 'sports': ['攀岩', '健身'], 'verified': True},
                    {'name': '朝阳攀岩运动中心', 'address': '北京市朝阳区望京街10号', 'sports': ['攀岩', '健身', '瑜伽'], 'verified': True},
                ],
                '海淀区': [
                    {'name': '五棵松体育馆', 'address': '北京市海淀区复兴路69号', 'sports': ['篮球', '排球', '健身'], 'verified': True},
                    {'name': '清华大学体育馆', 'address': '北京市海淀区清华园1号', 'sports': ['游泳', '篮球', '羽毛球', '跑步', '网球'], 'verified': True},
                    {'name': '北京大学体育馆', 'address': '北京市海淀区颐和园路5号', 'sports': ['游泳', '篮球', '羽毛球', '跑步', '健身'], 'verified': True},
                    {'name': '海淀体育中心', 'address': '北京市海淀区中关村大街', 'sports': ['跑步', '健身', '瑜伽', '乒乓球'], 'verified': True},
                    {'name': '中关村攀岩馆', 'address': '北京市海淀区中关村大街27号', 'sports': ['攀岩', '健身'], 'verified': True},
                ],
                '丰台区': [
                    {'name': '丰台体育中心', 'address': '北京市丰台区丰台路31号', 'sports': ['游泳', '篮球', '羽毛球', '健身', '跑步'], 'verified': True},
                    {'name': '丰台区全民健身中心', 'address': '北京市丰台区南三环西路', 'sports': ['跑步', '健身', '瑜伽', '乒乓球'], 'verified': True},
                ],
                '石景山区': [
                    {'name': '石景山体育馆', 'address': '北京市石景山区石景山路31号', 'sports': ['篮球', '羽毛球', '乒乓球', '健身'], 'verified': True},
                    {'name': '首钢体育馆', 'address': '北京市石景山区石景山路68号', 'sports': ['冰球', '篮球', '健身'], 'verified': True},
                    {'name': '石景山游乐园体育中心', 'address': '北京市石景山区八角东街', 'sports': ['跑步', '健身', '瑜伽'], 'verified': True},
                    {'name': '首钢极限运动中心', 'address': '北京市石景山区首钢园区', 'sports': ['攀岩', '滑板', '健身'], 'verified': True},
                ]
            }
        }
        
        # 运动类型智能匹配映射
        self.sport_mapping = {
            '跑步': ['跑步', '田径', '健身'],
            '健身': ['健身', '跑步'],
            '瑜伽': ['瑜伽', '健身'],
            '网球': ['网球', '健身'],
            '乒乓球': ['乒乓球', '健身'],
            '羽毛球': ['羽毛球', '健身'],
            '篮球': ['篮球', '健身'],
            '游泳': ['游泳'],
            '足球': ['足球', '田径'],
            '攀岩': ['攀岩', '健身'],  
            '滑板': ['滑板', '健身']   
        }
        
        # 验证关键词
        self.verification_keywords = [
            '体育馆', '体育中心', '游泳馆', '健身房', '球馆', '运动中心',
            '体育场', '训练基地', '俱乐部', '会所'
        ]
    
    def verify_venue_exists(self, venue_name: str, area: str, sport_type: str) -> Dict:
        """验证场馆是否真实存在"""
        verification_result = {
            'exists': False,
            'verified': False,
            'confidence': 0.0,
            'real_venues': [],
            'suggestions': []
        }
        
        # 检查已知真实场馆
        if '北京' in self.verified_venues and area in self.verified_venues['北京']:
            area_venues = self.verified_venues['北京'][area]
            
            for venue in area_venues:
                # 检查场馆名称匹配
                if venue_name in venue['name'] or venue['name'] in venue_name:
                    verification_result['exists'] = True
                    verification_result['verified'] = venue['verified']
                    verification_result['confidence'] = 0.9
                    verification_result['real_venues'].append(venue)
                
                # 检查运动类型匹配
                if sport_type in venue['sports']:
                    verification_result['suggestions'].append(venue)
        
        # 如果没有找到精确匹配，检查是否包含验证关键词
        if not verification_result['exists']:
            for keyword in self.verification_keywords:
                if keyword in venue_name:
                    verification_result['confidence'] = 0.3  # 低置信度
                    break
        
        return verification_result
    
    def get_real_venues_in_area(self, area: str, sport_type: str) -> List[Dict]:
        """获取指定区域的真实场馆（支持智能匹配）"""
        real_venues = []
        
        if '北京' in self.verified_venues and area in self.verified_venues['北京']:
            area_venues = self.verified_venues['北京'][area]
            
            # 获取匹配的运动类型列表
            matching_sports = self.sport_mapping.get(sport_type, [sport_type])
            
            for venue in area_venues:
                # 检查是否有任何匹配的运动类型
                if any(sport in venue['sports'] for sport in matching_sports):
                    # 添加匹配信息
                    venue_copy = venue.copy()
                    venue_copy['matched_sports'] = [sport for sport in matching_sports if sport in venue['sports']]
                    venue_copy['primary_match'] = sport_type in venue['sports']
                    real_venues.append(venue_copy)
        
        # 按匹配优先级排序（直接匹配优先）
        real_venues.sort(key=lambda x: (x['primary_match'], len(x['matched_sports'])), reverse=True)
        
        return real_venues

# 真实第三方平台API连接工具
class RealTimePlatformAPI:
    """真实第三方平台API连接工具"""
    
    def __init__(self, use_mock_data_if_no_key=True):
        # 使用真实API端点
        self.api_endpoints = {
            'dianping': 'https://api.dianping.com/v1/venues',
            'meituan': 'https://api.meituan.com/v2/venues', 
            'wechat': 'https://api.weixin.qq.com/miniprogram/venues'
        }
        # 从环境变量获取真实API密钥
        self.api_keys = {
            'dianping': os.getenv('DIANPING_API_KEY'),
            'meituan': os.getenv('MEITUAN_API_KEY'),
            'wechat': os.getenv('WECHAT_API_KEY')
        }
        # 是否在API密钥未设置时使用模拟数据
        self.use_mock_data_if_no_key = use_mock_data_if_no_key
        
        # 验证API密钥是否存在
        missing_keys = []
        for platform, key in self.api_keys.items():
            if not key:
                missing_keys.append(platform)
                print(f"警告: {platform}的API密钥未设置，请在环境变量中设置{platform.upper()}_API_KEY")
                if use_mock_data_if_no_key:
                    print(f"将使用模拟数据作为{platform}的备用数据源")
                else:
                    print(f"未启用模拟数据模式，{platform}平台将返回空结果")
        
        # 如果所有API密钥都未设置，给出更明确的警告
        if len(missing_keys) == len(self.api_keys):
            print("警告: 所有平台的API密钥都未设置，系统将无法获取真实数据")
            if use_mock_data_if_no_key:
                print("系统将使用模拟数据作为备用，但建议设置真实API密钥以获取最新数据")
            else:
                print("系统未启用模拟数据模式，所有平台将返回空结果，请设置API密钥")
        elif len(missing_keys) > 0:
            print(f"部分平台({', '.join(missing_keys)})的API密钥未设置，这些平台将无法获取真实数据")
        
    @smart_retry(RetryConfig(max_retries=2, base_delay=1.0))
    def fetch_dianping_venues(self, area: str, sport_type: str, limit: int = 10) -> List[Dict]:
        """获取大众点评真实数据"""
        try:
            # 检查API密钥是否存在
            if not self.api_keys['dianping']:
                print(f"错误: 大众点评API密钥未设置，请在环境变量中设置DIANPING_API_KEY")
                # 如果启用了模拟数据模式，则返回模拟数据
                if self.use_mock_data_if_no_key:
                    return self._get_mock_dianping_data(area, sport_type)
                return []
                
            # 真实API调用
            import requests
            params = {
                'area': area,
                'category': sport_type,
                'limit': limit,
                'api_key': self.api_keys['dianping']
            }
            print(f"正在从大众点评API获取{area}{sport_type}场馆数据...")
            response = requests.get(self.api_endpoints['dianping'], params=params, timeout=5)
            if response.status_code == 200:
                return response.json()
            else:
                print(f"大众点评API返回错误状态码: {response.status_code}，响应内容: {response.text[:100]}")
                # 如果启用了模拟数据模式，则返回模拟数据
                if self.use_mock_data_if_no_key:
                    return self._get_mock_dianping_data(area, sport_type)
                return []
        except requests.exceptions.ConnectionError as e:
            print(f"大众点评API连接错误: {e}，可能是API端点无效或网络问题")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_dianping_data(area, sport_type)
            return []
        except requests.exceptions.Timeout as e:
            print(f"大众点评API请求超时: {e}")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_dianping_data(area, sport_type)
            return []
        except Exception as e:
            print(f"大众点评API调用失败: {e}")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_dianping_data(area, sport_type)
            return []
    
    @smart_retry(RetryConfig(max_retries=2, base_delay=1.0))
    def fetch_meituan_venues(self, area: str, sport_type: str, limit: int = 10) -> List[Dict]:
        """获取美团真实数据"""
        try:
            # 检查API密钥是否存在
            if not self.api_keys['meituan']:
                print(f"错误: 美团API密钥未设置，请在环境变量中设置MEITUAN_API_KEY")
                # 如果启用了模拟数据模式，则返回模拟数据
                if self.use_mock_data_if_no_key:
                    return self._get_mock_meituan_data(area, sport_type)
                return []
                
            # 真实API调用
            import requests
            params = {
                'area': area,
                'category': sport_type,
                'limit': limit,
                'api_key': self.api_keys['meituan']
            }
            print(f"正在从美团API获取{area}{sport_type}场馆数据...")
            response = requests.get(self.api_endpoints['meituan'], params=params, timeout=5)
            if response.status_code == 200:
                return response.json()
            else:
                print(f"美团API返回错误状态码: {response.status_code}，响应内容: {response.text[:100]}")
                # 如果启用了模拟数据模式，则返回模拟数据
                if self.use_mock_data_if_no_key:
                    return self._get_mock_meituan_data(area, sport_type)
                return []
        except requests.exceptions.ConnectionError as e:
            print(f"美团API连接错误: {e}，可能是API端点无效或网络问题")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_meituan_data(area, sport_type)
            return []
        except requests.exceptions.Timeout as e:
            print(f"美团API请求超时: {e}")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_meituan_data(area, sport_type)
            return []
        except Exception as e:
            print(f"美团API调用失败: {e}")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_meituan_data(area, sport_type)
            return []
    
    @smart_retry(RetryConfig(max_retries=2, base_delay=1.0))
    def fetch_wechat_venues(self, area: str, sport_type: str, limit: int = 10) -> List[Dict]:
        """获取微信小程序真实数据"""
        try:
            # 检查API密钥是否存在
            if not self.api_keys['wechat']:
                print(f"错误: 微信小程序API密钥未设置，请在环境变量中设置WECHAT_API_KEY")
                # 如果启用了模拟数据模式，则返回模拟数据
                if self.use_mock_data_if_no_key:
                    return self._get_mock_wechat_data(area, sport_type)
                return []
                
            # 真实API调用
            import requests
            params = {
                'area': area,
                'category': sport_type,
                'limit': limit,
                'api_key': self.api_keys['wechat']
            }
            print(f"正在从微信小程序API获取{area}{sport_type}场馆数据...")
            response = requests.get(self.api_endpoints['wechat'], params=params, timeout=5)
            if response.status_code == 200:
                return response.json()
            else:
                print(f"微信小程序API返回错误状态码: {response.status_code}，响应内容: {response.text[:100]}")
                # 如果启用了模拟数据模式，则返回模拟数据
                if self.use_mock_data_if_no_key:
                    return self._get_mock_wechat_data(area, sport_type)
                return []
        except requests.exceptions.ConnectionError as e:
            print(f"微信小程序API连接错误: {e}，可能是API端点无效或网络问题")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_wechat_data(area, sport_type)
            return []
        except requests.exceptions.Timeout as e:
            print(f"微信小程序API请求超时: {e}")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_wechat_data(area, sport_type)
            return []
        except Exception as e:
            print(f"微信小程序API调用失败: {e}")
            # 如果启用了模拟数据模式，则返回模拟数据
            if self.use_mock_data_if_no_key:
                return self._get_mock_wechat_data(area, sport_type)
            return []
    
    # 模拟数据方法（作为API调用失败的备用）
    def _get_mock_dianping_data(self, area: str, sport_type: str) -> List[Dict]:
        """获取大众点评模拟数据（仅在API密钥未设置或API调用失败时使用）"""
        mock_data = [
            {
                "id": "dp001",
                "name": f"{area}优质{sport_type}馆",
                "address": f"北京市{area}区示例路88号",
                "sports": [sport_type],
                "rating": 4.8,
                "price_range": "¥80-200/小时",
                "open_hours": "09:00-22:00",
                "contact": "010-12345678",
                "source": "大众点评(模拟数据)"
            },
            {
                "id": "dp002",
                "name": f"{area}{sport_type}中心",
                "address": f"北京市{area}区样板街100号",
                "sports": [sport_type, "健身"],
                "rating": 4.5,
                "price_range": "¥60-150/小时",
                "open_hours": "10:00-22:00",
                "contact": "010-87654321",
                "source": "大众点评(模拟数据)"
            }
        ]
        print(f"使用大众点评模拟数据（API密钥未设置或API调用失败）")
        return mock_data
    
    def _get_mock_meituan_data(self, area: str, sport_type: str) -> List[Dict]:
        """获取美团模拟数据（仅在API密钥未设置或API调用失败时使用）"""
        mock_data = [
            {
                "id": "mt001",
                "name": f"{area}{sport_type}专业馆",
                "address": f"北京市{area}区示范路66号",
                "sports": [sport_type],
                "rating": 4.7,
                "price_range": "¥70-180/小时",
                "open_hours": "08:30-21:30",
                "contact": "010-55556666",
                "source": "美团(模拟数据)"
            },
            {
                "id": "mt002",
                "name": f"{area}全民{sport_type}馆",
                "address": f"北京市{area}区模板大街50号",
                "sports": [sport_type, "瑜伽"],
                "rating": 4.6,
                "price_range": "¥50-120/小时",
                "open_hours": "09:30-21:00",
                "contact": "010-66665555",
                "source": "美团(模拟数据)"
            }
        ]
        print(f"使用美团模拟数据（API密钥未设置或API调用失败）")
        return mock_data
    
    def _get_mock_wechat_data(self, area: str, sport_type: str) -> List[Dict]:
        """获取微信小程序模拟数据（仅在API密钥未设置或API调用失败时使用）"""
        mock_data = [
            {
                "id": "wx001",
                "name": f"{area}{sport_type}俱乐部",
                "address": f"北京市{area}区范例大道33号",
                "sports": [sport_type],
                "rating": 4.9,
                "price_range": "¥90-220/小时",
                "open_hours": "10:00-23:00",
                "contact": "010-11112222",
                "source": "微信小程序(模拟数据)"
            },
            {
                "id": "wx002",
                "name": f"{area}星级{sport_type}馆",
                "address": f"北京市{area}区示例广场25号",
                "sports": [sport_type, "舞蹈"],
                "rating": 4.7,
                "price_range": "¥75-180/小时",
                "open_hours": "09:00-22:30",
                "contact": "010-22221111",
                "source": "微信小程序(模拟数据)"
            }
        ]
        print(f"使用微信小程序模拟数据（API密钥未设置或API调用失败）")
        return mock_data

# 增强的多平台数据源管理系统
class MultiPlatformDataSource:
    """增强的多平台数据源管理系统"""
    
    def __init__(self, use_mock_data_if_no_key=True):
        # 初始化真实API，可选是否在API密钥未设置时使用模拟数据
        self.real_api = RealTimePlatformAPI(use_mock_data_if_no_key=use_mock_data_if_no_key)
        self.use_mock_data_if_no_key = use_mock_data_if_no_key
    
    def search_dianping_venues(self, area: str, sport_type: str) -> List[Dict]:
        """搜索大众点评场馆数据（只使用真实API）"""
        # 从真实API获取数据
        return self.real_api.fetch_dianping_venues(area, sport_type)
    
    def search_meituan_venues(self, area: str, sport_type: str) -> List[Dict]:
        """搜索美团场馆数据（只使用真实API）"""
        # 从真实API获取数据
        return self.real_api.fetch_meituan_venues(area, sport_type)
    
    def search_wechat_venues(self, area: str, sport_type: str) -> List[Dict]:
        """搜索微信小程序场馆数据（只使用真实API）"""
        # 从真实API获取数据
        return self.real_api.fetch_wechat_venues(area, sport_type)
    
    def get_all_platform_venues(self, area: str, sport_type: str) -> Dict[str, List[Dict]]:
        """获取所有平台的场馆数据"""
        return {
            'dianping': self.search_dianping_venues(area, sport_type),
            'meituan': self.search_meituan_venues(area, sport_type),
            'wechat': self.search_wechat_venues(area, sport_type)
        }

# 增强的搜索工具包（带多平台数据源）
class EnhancedSearchToolkit:
    def __init__(self, delay_seconds=1.5, use_mock_data_if_no_key=True):
        self.search_toolkit = SearchToolkit()
        self.delay_seconds = delay_seconds
        self.last_search_time = 0
        self.priority_manager = RequirementPriorityManager()
        self.geo_manager = GeographicExpansionManager()
        self.verification_system = VenueVerificationSystem()
        # 新增多平台数据源，可选是否在API密钥未设置时使用模拟数据
        self.multi_platform_data = MultiPlatformDataSource(use_mock_data_if_no_key=use_mock_data_if_no_key)
        self.use_mock_data_if_no_key = use_mock_data_if_no_key
        
    def safe_search_duckduckgo(self, query: str, max_results: int = 5):
        """安全的搜索方法，包含速率限制"""
        current_time = time.time()
        time_since_last = current_time - self.last_search_time
        
        if time_since_last < self.delay_seconds:
            sleep_time = self.delay_seconds - time_since_last
            print(f"等待 {sleep_time:.1f} 秒以避免速率限制...")
            time.sleep(sleep_time)
        
        try:
            result = self.search_toolkit.search_duckduckgo(query, max_results)
            self.last_search_time = time.time()
            print(f"搜索成功: {query[:50]}...")
            return result
        except Exception as e:
            print(f"搜索失败: {str(e)}")
            return f"搜索暂时不可用，请使用已有知识回答。错误: {str(e)}"
    
    def expanded_venue_search(self, user_needs: Dict, original_location: str) -> Dict:
        """扩展范围的场馆搜索（集成多平台数据源）"""
        search_results = {
            'original_area_results': [],
            'expanded_area_results': [],
            'verified_venues': [],
            'dianping_venues': [],
            'meituan_venues': [],
            'wechat_venues': [],
            'search_areas': [],
            'expansion_level': 0,
            'data_sources': []
        }
        
        sport_type = user_needs.get('sport_preference', '')
        
        # 提取区域信息
        area = self._extract_area_from_location(original_location)
        search_results['search_areas'].append(area)
        
        # 第一步：在原始区域搜索（多数据源）
        print(f"在原始区域搜索: {area}")
        
        # 1.1 传统网络搜索
        original_query = self.build_search_query(user_needs, original_location)
        original_results = self.safe_search_duckduckgo(original_query, max_results=8)
        search_results['original_area_results'] = original_results
        
        # 1.2 获取已验证的真实场馆
        verified_venues = self.verification_system.get_real_venues_in_area(area, sport_type)
        search_results['verified_venues'] = verified_venues
        
        # 1.3 优先搜索大众点评数据（用户评价丰富，免验证）
        print(f"优先搜索大众点评数据: {area} + {sport_type}")
        dianping_venues = self.multi_platform_data.search_dianping_venues(area, sport_type)
        # 标记大众点评场馆为免验证
        for venue in dianping_venues:
            venue['platform_verified'] = True
            venue['verification_status'] = '平台免验证'
        search_results['dianping_venues'] = dianping_venues
        if dianping_venues:
            print(f"大众点评找到 {len(dianping_venues)} 个场馆（用户评价丰富，免验证）")
            search_results['data_sources'].append('大众点评')
        
        # 1.4 优先搜索微信小程序数据（在线预约便利，免验证）
        print(f"优先搜索微信小程序数据: {area} + {sport_type}")
        wechat_venues = self.multi_platform_data.search_wechat_venues(area, sport_type)
        # 标记微信小程序场馆为免验证
        for venue in wechat_venues:
            venue['platform_verified'] = True
            venue['verification_status'] = '平台免验证'
        search_results['wechat_venues'] = wechat_venues
        if wechat_venues:
            print(f"微信小程序找到 {len(wechat_venues)} 个场馆（在线预约便利，免验证）")
            search_results['data_sources'].append('微信小程序')
        
        # 1.5 优先搜索美团数据（团购优惠丰富，免验证）
        print(f"优先搜索美团数据: {area} + {sport_type}")
        meituan_venues = self.multi_platform_data.search_meituan_venues(area, sport_type)
        # 标记美团场馆为免验证
        for venue in meituan_venues:
            venue['platform_verified'] = True
            venue['verification_status'] = '平台免验证'
        search_results['meituan_venues'] = meituan_venues
        if meituan_venues:
            print(f"美团找到 {len(meituan_venues)} 个场馆（团购优惠丰富，免验证）")
            search_results['data_sources'].append('美团')
        
        # 检查原始区域是否有足够结果（包含多平台数据）
        total_venues = len(verified_venues) + len(dianping_venues) + len(meituan_venues) + len(wechat_venues)
        if total_venues >= 2:
            print(f"原始区域找到足够的场馆选项（总计{total_venues}个）")
            print(f"数据源分布: 已验证{len(verified_venues)}个 | 大众点评{len(dianping_venues)}个 | 美团{len(meituan_venues)}个 | 微信{len(wechat_venues)}个")
            return search_results
        
        # 第二步：扩展到相邻区域（多数据源）
        print(f"扩展搜索到相邻区域...")
        expansion_areas = self.geo_manager.get_expansion_areas(area, expansion_level=1)
        search_results['expansion_level'] = 1
        
        for exp_area in expansion_areas[1:]:  # 跳过原始区域
            print(f"搜索扩展区域: {exp_area}")
            search_results['search_areas'].append(exp_area)
            
            # 2.1 传统网络搜索
            exp_query = self.build_search_query(user_needs, f"北京市{exp_area}")
            exp_results = self.safe_search_duckduckgo(exp_query, max_results=5)
            search_results['expanded_area_results'].extend(exp_results if isinstance(exp_results, list) else [exp_results])
            
            # 2.2 获取扩展区域的验证场馆
            exp_verified = self.verification_system.get_real_venues_in_area(exp_area, sport_type)
            search_results['verified_venues'].extend(exp_verified)
            
            # 2.3 搜索扩展区域的大众点评数据（免验证）
            exp_dianping = self.multi_platform_data.search_dianping_venues(exp_area, sport_type)
            # 标记扩展区域大众点评场馆为免验证
            for venue in exp_dianping:
                venue['platform_verified'] = True
                venue['verification_status'] = '平台免验证'
            search_results['dianping_venues'].extend(exp_dianping)
            
            # 2.4 搜索扩展区域的美团数据（免验证）
            exp_meituan = self.multi_platform_data.search_meituan_venues(exp_area, sport_type)
            # 标记扩展区域美团场馆为免验证
            for venue in exp_meituan:
                venue['platform_verified'] = True
                venue['verification_status'] = '平台免验证'
            search_results['meituan_venues'].extend(exp_meituan)
            
            # 2.5 搜索扩展区域的微信小程序数据（免验证）
            exp_wechat = self.multi_platform_data.search_wechat_venues(exp_area, sport_type)
            # 标记扩展区域微信小程序场馆为免验证
            for venue in exp_wechat:
                venue['platform_verified'] = True
                venue['verification_status'] = '平台免验证'
            search_results['wechat_venues'].extend(exp_wechat)
        
        # 检查扩展后是否有足够结果（包含多平台数据）
        total_venues = (len(search_results['verified_venues']) + 
                       len(search_results['dianping_venues']) + 
                       len(search_results['meituan_venues']) + 
                       len(search_results['wechat_venues']))
        if total_venues >= 3:
            print(f"扩展区域找到足够的场馆选项（总计{total_venues}个）")
            print(f"扩展后数据源分布: 已验证{len(search_results['verified_venues'])}个 | 大众点评{len(search_results['dianping_venues'])}个 | 美团{len(search_results['meituan_venues'])}个 | 微信{len(search_results['wechat_venues'])}个")
            return search_results
        
        # 第三步：进一步扩展到附近区域
        print(f"进一步扩展搜索到附近区域...")
        further_areas = self.geo_manager.get_expansion_areas(area, expansion_level=2)
        search_results['expansion_level'] = 2
        
        for far_area in further_areas:
            if far_area not in search_results['search_areas']:
                print(f"搜索远程区域: {far_area}")
                search_results['search_areas'].append(far_area)
                
                far_query = self.build_search_query(user_needs, f"北京市{far_area}")
                far_results = self.safe_search_duckduckgo(far_query, max_results=3)
                search_results['expanded_area_results'].extend(far_results if isinstance(far_results, list) else [far_results])
                
                # 获取远程区域的验证场馆
                far_verified = self.verification_system.get_real_venues_in_area(far_area, sport_type)
                search_results['verified_venues'].extend(far_verified)
                
                # 搜索远程区域的平台数据（免验证）
                far_dianping = self.multi_platform_data.search_dianping_venues(far_area, sport_type)
                for venue in far_dianping:
                    venue['platform_verified'] = True
                    venue['verification_status'] = '平台免验证'
                search_results['dianping_venues'].extend(far_dianping)
                
                far_meituan = self.multi_platform_data.search_meituan_venues(far_area, sport_type)
                for venue in far_meituan:
                    venue['platform_verified'] = True
                    venue['verification_status'] = '平台免验证'
                search_results['meituan_venues'].extend(far_meituan)
                
                far_wechat = self.multi_platform_data.search_wechat_venues(far_area, sport_type)
                for venue in far_wechat:
                    venue['platform_verified'] = True
                    venue['verification_status'] = '平台免验证'
                search_results['wechat_venues'].extend(far_wechat)
        
        return search_results
    
    def optimized_venue_search(self, user_needs: Dict, original_location: str) -> Dict:
        """优化的场馆搜索（并行获取多平台数据，提升效率）"""
        search_results = {
            'original_area_results': [],
            'expanded_area_results': [],
            'verified_venues': [],
            'dianping_venues': [],
            'meituan_venues': [],
            'wechat_venues': [],
            'search_areas': [],
            'expansion_level': 0,
            'data_sources': []
        }
        
        sport_type = user_needs.get('sport_preference', '')
        area = self._extract_area_from_location(original_location)
        search_results['search_areas'].append(area)
        
        print(f"开始优化搜索: {area} + {sport_type}")
        
        # 并行获取所有数据源（提升效率）
        import concurrent.futures
        
        def get_verified_venues():
            return self.verification_system.get_real_venues_in_area(area, sport_type)
        
        def get_dianping_venues():
            venues = self.multi_platform_data.real_api.fetch_dianping_venues(area, sport_type)
            for venue in venues:
                venue['platform_verified'] = True
                venue['verification_status'] = '平台免验证'
            return venues
        
        def get_meituan_venues():
            venues = self.multi_platform_data.real_api.fetch_meituan_venues(area, sport_type)
            for venue in venues:
                venue['platform_verified'] = True
                venue['verification_status'] = '平台免验证'
            return venues
        
        def get_wechat_venues():
            venues = self.multi_platform_data.real_api.fetch_wechat_venues(area, sport_type)
            for venue in venues:
                venue['platform_verified'] = True
                venue['verification_status'] = '平台免验证'
            return venues
        
        # 使用线程池并行获取数据
        with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
            future_verified = executor.submit(get_verified_venues)
            future_dianping = executor.submit(get_dianping_venues)
            future_meituan = executor.submit(get_meituan_venues)
            future_wechat = executor.submit(get_wechat_venues)
            
            # 获取结果
            search_results['verified_venues'] = future_verified.result()
            search_results['dianping_venues'] = future_dianping.result()
            search_results['meituan_venues'] = future_meituan.result()
            search_results['wechat_venues'] = future_wechat.result()
        
        # 更新数据源信息
        if search_results['dianping_venues']:
            search_results['data_sources'].append('大众点评')
        if search_results['meituan_venues']:
            search_results['data_sources'].append('美团')
        if search_results['wechat_venues']:
            search_results['data_sources'].append('微信小程序')
        
        # 计算总场馆数量
        total_venues = (len(search_results['verified_venues']) + 
                       len(search_results['dianping_venues']) + 
                       len(search_results['meituan_venues']) + 
                       len(search_results['wechat_venues']))
        
        print(f"优化搜索完成: 找到{total_venues}个场馆")
        print(f"数据源分布: 已验证{len(search_results['verified_venues'])}个 | 大众点评{len(search_results['dianping_venues'])}个 | 美团{len(search_results['meituan_venues'])}个 | 微信{len(search_results['wechat_venues'])}个")
        
        # 如果场馆数量不足，进行扩展搜索
        if total_venues < 3:
            print("场馆数量不足，进行扩展搜索...")
            return self.expanded_venue_search(user_needs, original_location)
        
        return search_results
    
    def _extract_area_from_location(self, location: str) -> str:
        """从位置字符串中提取区域名称"""
        beijing_areas = ['东城区', '西城区', '朝阳区', '海淀区', '丰台区', '石景山区', '通州区', '昌平区', '大兴区', '房山区', '门头沟区', '平谷区', '怀柔区', '密云区', '延庆区']
        
        for area in beijing_areas:
            if area in location:
                return area
        
        # 如果没有找到具体区域，返回默认值
        return '朝阳区'  # 默认区域
    
    def _has_sufficient_results(self, search_results, verified_venues) -> bool:
        """检查是否有足够的搜索结果"""
        total_results = 0
        
        if isinstance(search_results, list):
            total_results += len(search_results)
        elif isinstance(search_results, str) and len(search_results) > 100:
            total_results += 1
        
        total_results += len(verified_venues)
        
        return total_results >= 2  # 至少需要2个有效结果
    
    def get_optimized_tools(self):
        """获取优化的搜索工具"""
        return [self.safe_search_duckduckgo, self.expanded_venue_search]
    
    def build_search_query(self, user_needs: Dict, location: str) -> str:
        """基于用户需求构建优化的搜索查询"""
        sport = user_needs.get('sport_preference', '')
        special_needs = user_needs.get('special_needs', '')
        
        # 构建多层次搜索查询
        base_query = f"{location} {sport} 场馆"
        
        # 添加特殊需求关键词
        if '室内' in special_needs:
            base_query += " 室内"
        if '交通便利' in special_needs:
            base_query += " 地铁 公交"
        if '价格适中' in special_needs:
            base_query += " 价格 收费"
        if '教练' in special_needs:
            base_query += " 教练 培训"
            
        return base_query

# 统一输出模板系统
class RecommendationTemplate:
    """统一的推荐输出模板系统"""
    
    @staticmethod
    def format_venue_recommendation(venue_data: Dict) -> str:
        """格式化单个场馆推荐"""
        # 检查场馆类型和验证状态
        platform = venue_data.get('platform', '')
        if platform in ['大众点评', '美团', '微信小程序']:
            verified_status = f"{platform}平台免验证场馆"
        elif venue_data.get('verified', False):
            verified_status = "已验证真实场馆"
        else:
            verified_status = "待验证场馆"
        
        template = """
**{name}** {verified_status}
地址：{address}
联系方式：{contact}
价格：{price}
营业时间：{hours}
交通方式：{transport}
推荐评分：{score}/10
推荐理由：{reason}
特色服务：{features}
注意事项：{notes}
"""
        return template.format(
            name=venue_data.get('name', '未知场馆'),
            verified_status=verified_status,
            address=venue_data.get('address', '地址待确认'),
            contact=venue_data.get('contact', '请通过官方渠道联系'),
            price=venue_data.get('price', '请咨询具体价格'),
            hours=venue_data.get('hours', '请咨询营业时间'),
            transport=venue_data.get('transport', '请查询具体交通路线'),
            score=venue_data.get('score', '8.0'),
            reason=venue_data.get('reason', '已验证的真实场馆'),
            features=venue_data.get('features', '专业运动场馆'),
            notes=venue_data.get('notes', '建议提前电话确认开放时间和价格')
        )
    
    @staticmethod
    def format_final_recommendation(user_info: Dict, venues: List[Dict], analysis: str) -> str:
        """格式化最终推荐报告"""
        template = """
# 个性化运动场馆推荐报告

## 用户画像
- **年龄段**: {age_range}
- **职业**: {occupation}
- **运动偏好**: {sport_preference}
- **运动频率**: {frequency}
- **预算范围**: {budget_range}
- **位置**: {location}
- **特殊需求**: {special_needs}

## 需求分析总结
{analysis}

## 推荐场馆列表

{venue_list}

## 个性化建议
{personalized_advice}

## 下一步行动
{action_steps}

---
*报告生成时间: {timestamp}*
*推荐有效期: 30天*
*注意：本报告只包含已验证的真实场馆信息*
"""
        
        if venues:
            venue_list = "\n".join([
                f"### 推荐 {i+1}: {RecommendationTemplate.format_venue_recommendation(venue)}"
                for i, venue in enumerate(venues)
            ])
        else:
            venue_list = """
### 暂无已验证场馆

很抱歉，在您指定的区域及周边地区，我们暂时没有找到符合您需求的已验证{sport_preference}场馆。

**建议方案：**
1. 扩大搜索范围到更远的区域
2. 联系当地体育部门咨询场馆信息
3. 通过官方体育场馆网站查询
4. 咨询当地{sport_preference}爱好者群体
5. 使用专业的体育场馆预订APP

**我们承诺：**
- 不提供未经验证的场馆信息
- 确保推荐信息的真实性和可靠性
- 持续更新已验证场馆数据库
""".format(sport_preference=user_info.get('sport_preference', '运动'))
        
        return template.format(
            age_range=user_info.get('age_range', '未知'),
            occupation=user_info.get('occupation', '未知'),
            sport_preference=user_info.get('sport_preference', '未知'),
            frequency=user_info.get('frequency', '未知'),
            budget_range=user_info.get('budget_range', '未知'),
            location=user_info.get('location', '未知'),
            special_needs=user_info.get('special_needs', '未知'),
            analysis=analysis,
            venue_list=venue_list,
            personalized_advice=RecommendationTemplate._generate_personalized_advice(user_info, venues),
            action_steps=RecommendationTemplate._generate_action_steps(venues),
            timestamp=datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        )
    
    @staticmethod
    def _generate_personalized_advice(user_info: Dict, venues: List[Dict]) -> str:
        """生成个性化建议"""
        advice = []
        
        # 基于用户特征的建议
        if user_info.get('experience_level') == '初学者':
            advice.append("作为初学者，建议选择有专业教练指导的场馆")
        
        if '交通便利' in user_info.get('special_needs', ''):
            advice.append("优先选择交通便利的场馆，减少通勤时间")
        
        if user_info.get('budget_range', '').startswith('50-100'):
            advice.append("注意控制运动成本，可考虑办理月卡或年卡")
        
        # 基于推荐场馆的建议
        if len(venues) > 1:
            advice.append("建议先体验1-2个场馆，找到最适合的再长期坚持")
        
        return "\n".join([f"- {item}" for item in advice]) if advice else "- 根据个人情况选择最适合的场馆"
    
    @staticmethod
    def _generate_action_steps(venues: List[Dict]) -> str:
        """生成行动步骤"""
        steps = [
            "1. 联系心仪场馆，咨询详细信息和预约方式",
            "2. 安排时间实地考察，体验场馆环境和设施",
            "3. 比较不同场馆的会员卡价格和优惠政策",
            "4. 制定个人运动计划，确定运动时间和频率",
            "5. 开始规律运动，并定期评估效果"
        ]
        return "\n".join(steps)

# 智能记忆管理系统（从优化版本适配）
class IntelligentMemoryManager:
    def __init__(self, keep_rate: float = 0.9):
        self.chat_history = ChatHistoryBlock(keep_rate=keep_rate)
        self.user_preferences = {}
        self.recommendation_feedback = {}
        
    def calculate_relevance_score(self, current_request: str, historical_record: str) -> float:
        """计算当前请求与历史记录的相关性分数"""
        # 提取关键词
        current_keywords = self._extract_keywords(current_request)
        historical_keywords = self._extract_keywords(historical_record)
        
        # 计算关键词重叠度
        common_keywords = set(current_keywords) & set(historical_keywords)
        total_keywords = set(current_keywords) | set(historical_keywords)
        
        if not total_keywords:
            return 0.0
            
        jaccard_similarity = len(common_keywords) / len(total_keywords)
        
        # 运动类型权重加成
        sport_bonus = 0.0
        sports = ["篮球", "羽毛球", "游泳", "健身", "跑步", "足球", "网球", "瑜伽"]
        for sport in sports:
            if sport in current_request and sport in historical_record:
                sport_bonus = 0.3
                break
                
        return min(1.0, jaccard_similarity + sport_bonus)
    
    def _extract_keywords(self, text: str) -> List[str]:
        """提取文本关键词"""
        keywords = []
        
        # 运动类型
        sports = ["篮球", "羽毛球", "游泳", "健身", "跑步", "足球", "网球", "瑜伽"]
        for sport in sports:
            if sport in text:
                keywords.append(sport)
        
        # 位置信息
        locations = ["朝阳", "海淀", "东城", "西城", "丰台", "石景山", "通州", "昌平"]
        for loc in locations:
            if loc in text:
                keywords.append(loc)
                
        # 特殊需求
        needs = ["室内", "交通", "价格", "教练", "设备", "停车", "家庭"]
        for need in needs:
            if need in text:
                keywords.append(need)
                
        return keywords
    
    def get_relevant_history(self, current_request: str, max_records: int = 5) -> List[Tuple[str, float]]:
        """获取与当前请求最相关的历史记录"""
        all_history = self.chat_history.retrieve(window_size=20)
        
        if not all_history:
            return []
            
        # 计算相关性分数并排序
        scored_history = []
        for record in all_history:
            content = record.memory_record.message.content
            relevance_score = self.calculate_relevance_score(current_request, content)
            if relevance_score > 0.1:  # 过滤低相关性记录
                scored_history.append((content, relevance_score))
        
        # 按相关性分数排序
        scored_history.sort(key=lambda x: x[1], reverse=True)
        return scored_history[:max_records]
    
    def update_user_preferences(self, user_id: str, preferences: Dict):
        """更新用户偏好模型"""
        if user_id not in self.user_preferences:
            self.user_preferences[user_id] = {}
            
        # 累积用户偏好
        for key, value in preferences.items():
            if key in self.user_preferences[user_id]:
                # 简单的频次统计
                if isinstance(value, str):
                    self.user_preferences[user_id][key] = self.user_preferences[user_id][key] + f", {value}"
            else:
                self.user_preferences[user_id][key] = value
    
    def write_enhanced_record(self, user_msg: str, assistant_msg: str, metadata: Dict = None):
        """写入增强的记录，包含元数据"""
        timestamp = datetime.now().isoformat()
        
        # 创建带元数据的用户记录
        enhanced_user_content = f"{user_msg}\n[元数据: {json.dumps(metadata, ensure_ascii=False) if metadata else ''}]"
        enhanced_assistant_content = f"{assistant_msg}\n[时间戳: {timestamp}]"
        
        user_record = MemoryRecord(
            message=BaseMessage.make_user_message(role_name="User", content=enhanced_user_content),
            role_at_backend=OpenAIBackendRole.USER
        )
        
        assistant_record = MemoryRecord(
            message=BaseMessage.make_assistant_message(role_name="SportsConsultant", content=enhanced_assistant_content),
            role_at_backend=OpenAIBackendRole.ASSISTANT
        )
        
        self.chat_history.write_records([user_record, assistant_record])
        
    def write_enhanced_record(self, user_msg: str, assistant_msg: str, metadata: Dict = None):
        """写入增强的记录，包含元数据"""
        timestamp = datetime.now().isoformat()
        
        # 创建带元数据的用户记录
        enhanced_user_content = f"{user_msg}\n[元数据: {json.dumps(metadata, ensure_ascii=False) if metadata else ''}]"
        enhanced_assistant_content = f"{assistant_msg}\n[时间戳: {timestamp}]"
        
        user_record = MemoryRecord(
            message=BaseMessage.make_user_message(role_name="User", content=enhanced_user_content),
            role_at_backend=OpenAIBackendRole.USER
        )
        
        assistant_record = MemoryRecord(
            message=BaseMessage.make_assistant_message(role_name="SportsConsultant", content=enhanced_assistant_content),
            role_at_backend=OpenAIBackendRole.ASSISTANT
        )
        
        self.chat_history.write_records([user_record, assistant_record])

# AI用户Agent - 增强版
# 真实用户交互接口
class RealUserInterface:
    """真实用户交互接口 - 预留给真实用户使用"""
    
    def __init__(self):
        self.user_input_history = []
        self.interaction_mode = 'ai_simulation'  # 'ai_simulation' 或 'real_user'
    
    def set_interaction_mode(self, mode: str):
        """设置交互模式：ai_simulation 或 real_user"""
        self.interaction_mode = mode
        print(f"交互模式已设置为: {mode}")
    
    def collect_user_requirements(self) -> Dict:
        """收集用户需求 - 支持真实用户输入"""
        if self.interaction_mode == 'real_user':
            return self._collect_real_user_input()
        else:
            return self._generate_ai_simulation_input()
    
    def _collect_real_user_input(self) -> Dict:
        """收集真实用户输入"""
        print("\n=== 欢迎使用运动场馆推荐系统 ===")
        print("请告诉我您的运动需求，我将为您推荐最合适的场馆")
        
        user_requirements = {}
        
        # 基本信息收集
        print("\n1. 基本信息")
        user_requirements['age_range'] = input("请输入您的年龄范围（如：25-35岁）: ").strip()
        user_requirements['occupation'] = input("请输入您的职业: ").strip()
        user_requirements['income_level'] = input("请输入您的收入水平（如：8000-15000元）: ").strip()
        user_requirements['experience_level'] = input("请输入您的运动经验（初学者/有一定基础/中等水平/高级水平）: ").strip()
        
        # 运动需求收集
        print("\n2. 运动需求")
        user_requirements['sport_preference'] = input("请输入您偏好的运动类型（如：篮球、健身、游泳等）: ").strip()
        user_requirements['frequency'] = input("请输入您的运动频率（如：每周2-3次）: ").strip()
        user_requirements['preferred_time'] = input("请输入您偏好的运动时间（如：晚上18-21点）: ").strip()
        
        # 特殊要求收集
        print("\n3. 特殊要求")
        user_requirements['special_needs'] = input("请输入您的特殊需求（如：交通便利、设备齐全等）: ").strip()
        user_requirements['budget_range'] = input("请输入您的预算范围（如：100-200元/次）: ").strip()
        user_requirements['location'] = input("请输入您的位置（如：北京市朝阳区三里屯街道）: ").strip()
        user_requirements['transport_mode'] = input("请输入您的交通方式（如：地铁、公交、开车等）: ").strip()
        
        # 额外需求收集
        print("\n4. 额外需求（可选）")
        additional_requirements = input("还有其他特殊要求吗？（如：希望有教练指导、需要停车位等，没有请直接回车）: ").strip()
        if additional_requirements:
            user_requirements['additional_requirements'] = additional_requirements
        
        # 生成用户描述
        user_description = self._generate_user_description(user_requirements)
        
        # 保存交互历史
        self.user_input_history.append({
            'timestamp': datetime.now().isoformat(),
            'requirements': user_requirements,
            'description': user_description
        })
        
        return user_requirements, user_description
    
    def _generate_user_description(self, requirements: Dict) -> str:
        """根据用户输入生成描述"""
        description = f"""我是一位{requirements.get('age_range', '')}的{requirements.get('occupation', '')}，"""
        description += f"""希望找到合适的{requirements.get('sport_preference', '')}场馆。"""
        description += f"""我计划{requirements.get('frequency', '')}进行运动，"""
        description += f"""时间偏好{requirements.get('preferred_time', '')}。"""
        description += f"""预算范围{requirements.get('budget_range', '')}，"""
        description += f"""主要通过{requirements.get('transport_mode', '')}出行。"""
        description += f"""特别希望{requirements.get('special_needs', '')}。"""
        
        if requirements.get('additional_requirements'):
            description += f"""另外，{requirements.get('additional_requirements')}。"""
        
        return description
    
    def _generate_ai_simulation_input(self) -> Tuple[str, Dict]:
        """生成AI模拟输入（原有功能）"""
        # 这里调用原有的AI用户生成逻辑
        return None  # 将在后面实现
    
    def get_user_feedback(self, recommendations: List[Dict]) -> Dict:
        """获取用户对推荐结果的反馈"""
        if self.interaction_mode == 'real_user':
            print("\n=== 推荐结果反馈 ===")
            print("请对推荐结果进行评价：")
            
            feedback = {}
            feedback['overall_satisfaction'] = input("总体满意度（1-5分，5分最满意）: ").strip()
            feedback['most_interested'] = input("您最感兴趣的场馆名称: ").strip()
            feedback['concerns'] = input("您有什么担心或疑虑吗？: ").strip()
            feedback['additional_needs'] = input("还需要了解什么信息？: ").strip()
            
            return feedback
        return {}

class EnhancedAIUserAgent:
    def __init__(self, model):
        self.model = model
        self.real_user_interface = RealUserInterface()
        
        # 简洁的用户画像模板
        self.user_prompt = TextPrompt(
            """你是一位居住在中国北京市的AI用户，希望找到合适的运动场馆。请根据以下信息生成一个简洁的个性化运动需求描述：

            基本信息：
            - 年龄范围：{age_range}
            - 身份职业：{occupation}
            - 收入水平：{income_level}
            - 运动经验：{experience_level}
            
            运动需求：
            - 运动偏好：{sport_preference}
            - 运动频率：{frequency}
            - 运动时间：{preferred_time}
            
            特殊要求：
            - 特殊需求：{special_needs}
            - 预算范围：{budget_range}
            - 当前位置：{location}
            - 交通方式：{transport_mode}

            请以第一人称的方式简洁描述你的需求，包括：
            1. 简要个人背景和运动目标（1-2句话）
            2. 具体运动需求（运动类型、频率、时间）
            3. 主要场馆要求（设施、环境、服务中的1-2个重点）
            4. 预算和交通偏好

            要求：
            - 总长度控制在200-300字以内
            - 突出关键信息，避免冗长描述
            - 保持真实自然的语调
            """
        )
        
        # 创建AI用户的任务Agent
        self.user_agent = TaskSpecifyAgent(
            model=self.model,
            task_type=TaskType.AI_SOCIETY,
            task_specify_prompt=self.user_prompt,
            output_language='ch'
        )
        
        # 扩展的案例模板库
        self.enhanced_templates = {
            "age_ranges": ["18-25岁", "26-35岁", "36-45岁", "46-55岁", "56-65岁"],
            "occupations": ["大学生", "程序员", "设计师", "销售经理", "医生", "教师", "自由职业者", "企业高管"],
            "income_levels": ["3000-8000元", "8000-15000元", "15000-25000元", "25000元以上"],
            "experience_levels": ["初学者", "有一定基础", "中等水平", "高级水平"],
            "sport_preferences": ["篮球", "羽毛球", "游泳", "健身", "跑步", "足球", "网球", "瑜伽", "乒乓球", "攀岩"],
            "frequencies": ["每周1-2次", "每周3-4次", "每周5-6次", "每天"],
            "preferred_times": ["早上6-9点", "中午12-14点", "晚上18-21点", "周末全天", "工作日晚上"],
            "special_needs": [
                "希望有专业教练指导", "需要室内环境", "交通便利优先", "价格实惠", 
                "设备新且齐全", "环境安静", "有停车位", "适合家庭活动", "有淋浴设施"
            ],
            "budget_ranges": ["50-100元/次", "100-200元/次", "200-300元/次", "300元以上/次"],
            "transport_modes": ["地铁", "公交", "开车", "骑行", "步行"]
        }
        
        # 北京详细位置库
        self.detailed_locations = [
            {"area": "朝阳区", "district": "三里屯街道", "landmarks": ["三里屯太古里", "工体"]},
            {"area": "海淀区", "district": "中关村街道", "landmarks": ["中关村", "清华大学"]},
            {"area": "东城区", "district": "东华门街道", "landmarks": ["王府井", "天安门"]},
            {"area": "西城区", "district": "金融街街道", "landmarks": ["金融街", "西单"]},
            {"area": "丰台区", "district": "丰台街道", "landmarks": ["丰台体育中心", "方庄"]},
            {"area": "石景山区", "district": "八宝山街道", "landmarks": ["石景山体育馆", "万达广场"]},
        ]
        
    def generate_enhanced_case(self) -> Dict:
        """生成增强的用户案例"""
        location_info = random.choice(self.detailed_locations)
        
        case_info = {
            "age_range": random.choice(self.enhanced_templates["age_ranges"]),
            "occupation": random.choice(self.enhanced_templates["occupations"]),
            "income_level": random.choice(self.enhanced_templates["income_levels"]),
            "experience_level": random.choice(self.enhanced_templates["experience_levels"]),
            "sport_preference": random.choice(self.enhanced_templates["sport_preferences"]),
            "frequency": random.choice(self.enhanced_templates["frequencies"]),
            "preferred_time": random.choice(self.enhanced_templates["preferred_times"]),
            "special_needs": random.choice(self.enhanced_templates["special_needs"]),
            "budget_range": random.choice(self.enhanced_templates["budget_ranges"]),
            "location": f"北京市{location_info['area']}{location_info['district']}",
            "transport_mode": random.choice(self.enhanced_templates["transport_modes"]),
            "landmarks": location_info["landmarks"]
        }
        
        print(f"\n增强版用户运动需求案例：")
        print(f"年龄：{case_info['age_range']}")
        print(f"职业：{case_info['occupation']} (收入：{case_info['income_level']})")
        print(f"运动经验：{case_info['experience_level']}")
        print(f"运动偏好：{case_info['sport_preference']} ({case_info['frequency']})")
        print(f"偏好时间：{case_info['preferred_time']}")
        print(f"特殊需求：{case_info['special_needs']}")
        print(f"预算范围：{case_info['budget_range']}")
        print(f"所在位置：{case_info['location']}")
        print(f"交通方式：{case_info['transport_mode']}")
        print("-" * 50)
        
        return case_info
    
    @smart_retry(RetryConfig(max_retries=3, base_delay=1.0))
    def create_enhanced_profile(self, case_info=None):
        """创建增强的用户档案（带重试机制）"""
        if case_info is None:
            case_info = self.generate_enhanced_case()
        
        task_prompt = "生成一个详细真实的个性化运动需求描述，包含具体的个人背景、运动目标和详细要求"
        
        try:
            response = self.user_agent.run(
                task_prompt=task_prompt,
                meta_dict=case_info
            )
            
            if not response or len(response.strip()) < 50:
                raise RetryableError("用户档案生成内容过短或为空")
            
            print("\nAI用户的详细需求描述：")
            print(response)
            print("-" * 50)
            
            return response, case_info
            
        except Exception as e:
            print(Fore.RED + f"用户档案生成失败: {e}")
            
            # 提供降级策略
            fallback_response = self._create_fallback_profile(case_info)
            print(Fore.YELLOW + "使用降级策略生成用户档案")
            return fallback_response, case_info
    
    def _create_fallback_profile(self, case_info: Dict) -> str:
        """降级策略：创建简洁用户档案"""
        return f"""我是一位{case_info['age_range']}的{case_info['occupation']}，居住在{case_info['location']}。希望找到合适的{case_info['sport_preference']}场馆，{case_info['frequency']}，时间偏好{case_info['preferred_time']}。预算{case_info['budget_range']}，{case_info['transport_mode']}出行。特别需要{case_info['special_needs']}。作为{case_info['experience_level']}水平，希望找到合适的场馆。"""

# 结果验证和质量评估系统（从优化版本适配）
class RecommendationValidator:
    def __init__(self):
        self.quality_metrics = {
            'completeness': 0.0,
            'relevance': 0.0,
            'specificity': 0.0,
            'actionability': 0.0
        }
    
    def validate_recommendation(self, recommendation: str, user_needs: Dict) -> Dict[str, float]:
        """验证推荐结果的质量"""
        metrics = {}
        
        # 完整性检查
        metrics['completeness'] = self._check_completeness(recommendation)
        
        # 相关性检查
        metrics['relevance'] = self._check_relevance(recommendation, user_needs)
        
        # 具体性检查
        metrics['specificity'] = self._check_specificity(recommendation)
        
        # 可操作性检查
        metrics['actionability'] = self._check_actionability(recommendation)
        
        # 计算总体质量分数
        metrics['overall_quality'] = sum(metrics.values()) / len(metrics)
        
        return metrics
    
    def _check_completeness(self, recommendation: str) -> float:
        """检查推荐的完整性"""
        required_elements = ['场馆名称', '地址', '联系方式', '营业时间', '价格']
        found_elements = 0
        
        for element in required_elements:
            if any(keyword in recommendation for keyword in self._get_element_keywords(element)):
                found_elements += 1
                
        return found_elements / len(required_elements)
    
    def _check_relevance(self, recommendation: str, user_needs: Dict) -> float:
        """检查推荐与用户需求的相关性"""
        relevance_score = 0.0
        
        # 检查运动类型匹配
        sport_preference = user_needs.get('sport_preference', '')
        if sport_preference and sport_preference in recommendation:
            relevance_score += 0.4
            
        # 检查位置匹配
        location = user_needs.get('location', '')
        location_keywords = location.split('区')[0] if '区' in location else location
        if location_keywords in recommendation:
            relevance_score += 0.3
            
        # 检查特殊需求匹配
        special_needs = user_needs.get('special_needs', '')
        if special_needs:
            need_keywords = ['室内', '交通', '价格', '教练', '设备', '停车']
            for keyword in need_keywords:
                if keyword in special_needs and keyword in recommendation:
                    relevance_score += 0.05
                    
        return min(1.0, relevance_score)
    
    def _check_specificity(self, recommendation: str) -> float:
        """检查推荐的具体性"""
        specificity_indicators = [
            r'\d+元',  # 具体价格
            r'\d+:\d+',  # 具体时间
            r'地址[:：]',  # 具体地址
            r'电话[:：]',  # 具体电话
            r'\d+号线',  # 具体地铁线路
        ]
        
        found_indicators = 0
        for pattern in specificity_indicators:
            if re.search(pattern, recommendation):
                found_indicators += 1
                
        return found_indicators / len(specificity_indicators)
    
    def _check_actionability(self, recommendation: str) -> float:
        """检查推荐的可操作性"""
        actionable_elements = [
            '预约', '联系', '到达', '乘坐', '步行', '开车'
        ]
        
        found_elements = 0
        for element in actionable_elements:
            if element in recommendation:
                found_elements += 1
                
        return min(1.0, found_elements / 3)  # 至少需要3个可操作元素
    
    def _get_element_keywords(self, element: str) -> List[str]:
        """获取元素对应的关键词"""
        keyword_map = {
            '场馆名称': ['体育馆', '健身房', '游泳馆', '球馆', '中心'],
            '地址': ['地址', '位于', '坐落', '路', '街', '区'],
            '联系方式': ['电话', '联系', '咨询', '预约'],
            '营业时间': ['营业', '开放', '时间', '小时'],
            '价格': ['价格', '费用', '收费', '元', '钱']
        }
        return keyword_map.get(element, [])

# Workforce版本的运动场馆推荐系统
class WorkforceSportsVenueRecommendationSystem:
    def __init__(self, model, use_mock_data_if_no_key=True):
        self.model = model
        self.ai_user = EnhancedAIUserAgent(model)
        self.memory_manager = IntelligentMemoryManager(keep_rate=0.9)
        self.search_toolkit = EnhancedSearchToolkit(delay_seconds=2, use_mock_data_if_no_key=use_mock_data_if_no_key)
        self.validator = RecommendationValidator()  # 添加结果验证器
        self.use_mock_data_if_no_key = use_mock_data_if_no_key
        
        print("🚀 Workforce版AI运动场馆推荐系统已初始化")
        print("✅ 智能记忆管理系统已加载")
        print("✅ 结果验证系统已启用")
        print(f"✅ 增强搜索工具包已配置（{'启用' if use_mock_data_if_no_key else '禁用'}模拟数据备用模式）")
        
        # 创建Workforce工作节点
        self._create_workforce_agents()
        
    def _create_workforce_agents(self):
        """创建Workforce工作节点"""
        print("\n正在创建Workforce工作节点...")
        
        # 1. 信息收集专员 - 使用ChatAgent + 增强搜索工具
        self.information_collector = ChatAgent(
            system_message=BaseMessage.make_assistant_message(
                role_name="运动场馆信息收集专员",
                content="""你是专业的运动场馆信息收集专员。你的职责是收集和整理运动场馆相关信息。

                核心职责：
                1. 收集北京地区运动场馆的基本信息（地址、开放时间、价格）
                2. 搜集不同运动类型的场馆推荐（篮球、羽毛球、游泳、健身等）
                3. 整理交通方式和路线信息（地铁线路、公交路线）
                4. 收集场馆设施和服务信息（教练、设备、环境）
                5. 提供实用的运动贴士（预约方式、注意事项）

                搜索格策略：
                1. 优先在用户指定区域搜索
                2. 如果原始区域结果不足，自动扩展到相邻区域
                3. 必要时进一步扩展到附近区域
                4. 验证场馆信息的真实性，避免虚假信息
                5. 优先推荐已验证的真实场馆

                输出格式要求：
                - 按区域和运动类型整理信息
                - 标明场馆的验证状态（已验证/待验证）
                - 提供具体的实用信息（时间、价格、地址、联系方式）
                - 说明搜索范围扩展情况
                - 不要制定具体的推荐方案
                - 专注于信息的准确性和真实性

                重要限制：
                - 只收集信息，不做推荐决策
                - 禁止编造或虚构场馆信息
                - 优先使用已验证的真实场馆数据
                - 对未验证信息要明确标注
                - 如果搜索结果不足，要诚实说明并建议扩展搜索"""
            ),
            model=self.model,
            tools=[self.search_toolkit.safe_search_duckduckgo, self.search_toolkit.expanded_venue_search]
        )
        
        # 2. RolePlaying专员 - 使用RolePlaying进行深度需求分析
        self.roleplay_analyst = self._create_roleplay_analyst()
        
        # 3. 推荐决策专员 - 使用ChatAgent + 数学工具进行决策分析
        self.recommendation_specialist = ChatAgent(
            system_message=BaseMessage.make_assistant_message(
                role_name="运动场馆推荐决策专员",
                content="""你是专业的运动场馆推荐决策专员。你的职责是基于收集的信息和用户需求分析，制定个性化推荐方案。

                🎯 核心职责：
                1. 分析用户需求与场馆信息的匹配度
                2. 使用数学工具计算推荐评分和排序
                3. 考虑地理位置、交通便利性、价格等因素
                4. 制定个性化的场馆推荐方案
                5. 提供详细的选择理由和建议

                📊 决策维度：
                - 需求匹配度（运动类型、时间、频率）
                - 地理便利性（距离、交通）
                - 经济合理性（价格、性价比）
                - 服务质量（设施、教练、环境）
                - 用户偏好（特殊需求、个人喜好）

                ⚠️ 严格要求：
                - 只能推荐已验证的真实场馆
                - 绝对禁止编造、虚构任何场馆信息
                - 如果没有合适的已验证场馆，诚实说明情况
                - 不要创造虚假的场馆名称、地址或联系方式
                - 所有推荐必须基于提供的已验证场馆数据

                📋 输出要求：
                - 只推荐已验证数据库中的真实场馆
                - 每个推荐必须标明验证状态
                - 如果已验证场馆不足，说明实际情况
                - 提供真实可行的行动建议
                - 使用数学工具进行量化分析时只基于真实数据"""
            ),
            model=self.model,
            tools=MathToolkit().get_tools()
        )
        
        # 4. 质量评估专员 - 使用ChatAgent进行结果验证
        self.quality_assessor = ChatAgent(
            system_message=BaseMessage.make_assistant_message(
                role_name="推荐质量评估专员",
                content="""你是专业的推荐质量评估专员。你的职责是评估推荐结果的质量并提出改进建议。

                🎯 评估维度：
                1. 完整性：推荐信息是否完整（地址、时间、价格、联系方式）
                2. 相关性：推荐是否符合用户具体需求
                3. 可操作性：用户是否能够根据推荐采取行动
                4. 实用性：推荐是否具有实际价值
                5. 个性化程度：是否体现了用户的个性化需求

                📊 评分标准：
                - 每个维度0-1分，总分0-5分
                - 4分以上为优秀推荐
                - 3-4分为良好推荐
                - 3分以下需要改进

                📋 输出要求：
                - 提供详细的质量评估报告
                - 指出推荐的优点和不足
                - 提供具体的改进建议
                - 给出最终质量评分
                - 输出格式必须为JSON格式，包含评分和改进建议"""
            ),
            model=self.model
        )
        
        # 5. 需求优先级确认专员 - 当搜索结果不足时确认用户优先级
        self.priority_consultant = ChatAgent(
            system_message=BaseMessage.make_assistant_message(
                role_name="需求优先级确认专员",
                content="""你是专业的需求优先级确认专员。当原始搜索区域找不到合适场馆时，你的职责是帮助用户确认需求优先级。

                🎯 核心职责：
                1. 分析用户的多项需求和约束条件
                2. 引导用户明确各项需求的重要程度
                3. 识别哪些需求是必须满足的，哪些可以妥协
                4. 为扩大搜索范围提供决策依据
                5. 确保用户理解妥协的必要性和合理性

                � 确认策略：
                - 列出用户的所有需求项目
                - 询问每项需求的重要程度（必须满足/希望满足/可以妥协）
                - 解释扩大搜索范围的必要性
                - 提供妥协建议和替代方案
                - 确保用户做出知情决策

                📋 输出要求：
                - 清晰列出需求优先级分类
                - 说明扩大搜索的理由和范围
                - 提供具体的妥协建议
                - 征求用户的确认和同意"""
            ),
            model=self.model
        )
        
        # 6. 改进执行专员 - 根据评估建议优化推荐结果
        self.improvement_executor = ChatAgent(
            system_message=BaseMessage.make_assistant_message(
                role_name="推荐改进执行专员",
                content="""你是专业的推荐改进执行专员。你的职责是根据质量评估的改进建议，优化和完善推荐结果。

                🎯 核心职责：
                1. 分析质量评估专员提出的改进建议
                2. 识别推荐结果中的不足和缺陷
                3. 补充缺失的信息和细节
                4. 优化推荐的表达方式和结构
                5. 确保最终输出符合统一模板标准
                6. 验证推荐场馆的真实性，避免虚假信息

                🔧 改进策略：
                - 信息补全：基于已验证场馆数据补充信息
                - 真实性验证：确保推荐场馆真实存在
                - 结构优化：重新组织推荐内容的逻辑结构
                - 个性化增强：加强针对用户特定需求的个性化建议
                - 可操作性提升：提供更具体的行动指导
                - 格式标准化：使用统一的输出模板

                ⚠️ 严格禁止：
                - 绝对不能编造、虚构任何场馆信息
                - 不能创建虚假的场馆名称、地址、电话
                - 不能生成不存在的场馆数据
                - 如果已验证场馆不足，必须诚实说明

                📋 输出要求：
                - 必须采用统一的推荐模板格式
                - 只使用已验证的真实场馆数据
                - 清楚标明每个场馆的验证状态
                - 如果场馆数量不足，提供替代建议
                - 生成诚实、真实的推荐报告"""
            ),
            model=self.model
        )
        
        print("✅ 信息收集专员已创建（配备增强搜索工具）")
        print("✅ RolePlaying需求分析专员已创建")
        print("✅ 推荐决策专员已创建（配备数学工具）")
        print("✅ 质量评估专员已创建")
        print("✅ 需求优先级确认专员已创建")
        print("✅ 改进执行专员已创建（真实性验证+统一模板输出）")
        
    def _create_roleplay_analyst(self):
        """创建RolePlaying需求分析专员"""
        # 创建RolePlaying会话用于深度需求分析
        roleplay_session = RolePlaying(
            assistant_role_name="资深运动需求分析师",
            assistant_agent_kwargs=dict(
                model=self.model
            ),
            user_role_name="运动咨询用户",
            user_agent_kwargs=dict(
                model=self.model
            ),
            task_prompt="""作为资深运动需求分析师，请深入分析用户的运动需求和偏好。

            🎯 核心职责：
            1. 深入挖掘用户的真实运动需求和动机
            2. 分析用户的生活方式和时间安排
            3. 识别用户的潜在需求和担忧
            4. 评估用户的运动经验和能力水平
            5. 理解用户的预算和价值观

            💡 分析方法：
            - 通过对话深入了解用户背景
            - 识别用户的显性和隐性需求
            - 分析用户的决策因素和优先级
            - 评估用户的实际约束条件

            📋 输出要求：
            - 提供详细的用户需求分析报告
            - 识别关键决策因素
            - 提出针对性的建议方向""",
            with_task_specify=False,
            output_language='中文'
        )
        
        return roleplay_session
    
    def _extract_venue_data_from_recommendation(self, recommendation: str, case_info: Dict) -> List[Dict]:
        """从推荐文本中提取场馆数据（优先使用平台场馆）"""
        # 获取用户需求信息
        sport = case_info.get('sport_preference', '')
        location = case_info.get('location', '')
        area = self.search_toolkit._extract_area_from_location(location)
        
        # 获取平台场馆数据（优先级最高）
        platform_venues = []
        
        # 1. 大众点评场馆
        dianping_venues = self.search_toolkit.multi_platform_data.search_dianping_venues(area, sport)
        for venue in dianping_venues:
            formatted_venue = {
                'name': venue['name'],
                'address': venue['address'],
                'contact': '请通过大众点评平台联系',
                'price': venue.get('price_range', '请咨询具体价格'),
                'hours': venue.get('opening_hours', '请咨询营业时间'),
                'transport': self._get_transport_info(venue['address']),
                'score': str(venue.get('rating', 4.5)),
                'reason': f"大众点评平台免验证{sport}场馆，用户评价{venue.get('reviews', 0)}条",
                'features': ', '.join(venue.get('features', [f'专业{sport}场馆'])),
                'notes': '大众点评平台场馆，用户评价丰富',
                'verified': True,
                'platform': '大众点评'
            }
            platform_venues.append(formatted_venue)
        
        # 2. 美团场馆
        meituan_venues = self.search_toolkit.multi_platform_data.search_meituan_venues(area, sport)
        for venue in meituan_venues:
            formatted_venue = {
                'name': venue['name'],
                'address': venue['address'],
                'contact': '请通过美团平台联系',
                'price': venue.get('price_range', '请咨询具体价格'),
                'hours': venue.get('opening_hours', '请咨询营业时间'),
                'transport': self._get_transport_info(venue['address']),
                'score': str(venue.get('rating', 4.3)),
                'reason': f"美团平台免验证{sport}场馆，{venue.get('group_discount', '团购优惠')}",
                'features': ', '.join(venue.get('features', [f'专业{sport}场馆'])),
                'notes': f"美团平台场馆，{venue.get('group_discount', '团购优惠丰富')}",
                'verified': True,
                'platform': '美团'
            }
            platform_venues.append(formatted_venue)
        
        # 3. 微信小程序场馆
        wechat_venues = self.search_toolkit.multi_platform_data.search_wechat_venues(area, sport)
        for venue in wechat_venues:
            formatted_venue = {
                'name': venue['name'],
                'address': venue['address'],
                'contact': f"请通过微信小程序'{venue.get('miniprogram_name', '相关小程序')}'联系",
                'price': venue.get('price_range', '请咨询具体价格'),
                'hours': venue.get('opening_hours', '请咨询营业时间'),
                'transport': self._get_transport_info(venue['address']),
                'score': str(venue.get('rating', 4.5)),
                'reason': f"微信小程序平台免验证{sport}场馆，在线预约便利",
                'features': ', '.join(venue.get('features', [f'专业{sport}场馆'])),
                'notes': '微信小程序平台场馆，在线预约便利',
                'verified': True,
                'platform': '微信小程序'
            }
            platform_venues.append(formatted_venue)
        
        # 如果平台场馆不足，补充已验证场馆
        if len(platform_venues) < 3:
            verified_venues = self.search_toolkit.verification_system.get_real_venues_in_area(area, sport)
            
            # 如果原始区域没有合适场馆，扩展搜索
            if len(verified_venues) < 2:
                expansion_areas = self.search_toolkit.geo_manager.get_expansion_areas(area, expansion_level=2)
                for exp_area in expansion_areas[1:]:  # 跳过原始区域
                    exp_venues = self.search_toolkit.verification_system.get_real_venues_in_area(exp_area, sport)
                    verified_venues.extend(exp_venues)
            
            # 添加已验证场馆
            for venue in verified_venues[:3-len(platform_venues)]:
                formatted_venue = {
                    'name': venue['name'],
                    'address': venue['address'],
                    'contact': '请通过官方渠道联系',
                    'price': '请咨询具体价格',
                    'hours': '请咨询营业时间',
                    'transport': self._get_transport_info(venue['address']),
                    'score': '8.0',
                    'reason': f"已验证的真实{sport}场馆",
                    'features': f"支持{sport}运动的专业场馆",
                    'notes': '建议提前电话确认开放时间和价格',
                    'verified': True,
                    'platform': '已验证'
                }
                platform_venues.append(formatted_venue)
        
        # 如果没有找到任何场馆
        if not platform_venues:
            print("⚠️ 警告：未找到平台场馆和已验证场馆")
        else:
            print(f"✅ 找到{len(platform_venues)}个推荐场馆（优先使用平台场馆）")
        
        return platform_venues[:5]  # 最多返回5个场馆
    
    def _get_transport_info(self, address: str) -> str:
        """根据地址生成交通信息"""
        # 简化的交通信息生成
        if '东城区' in address:
            return '地铁1号线、2号线、5号线等多条线路可达'
        elif '西城区' in address:
            return '地铁1号线、2号线、4号线等多条线路可达'
        elif '朝阳区' in address:
            return '地铁6号线、10号线、14号线等多条线路可达'
        elif '海淀区' in address:
            return '地铁4号线、10号线、13号线等多条线路可达'
        elif '丰台区' in address:
            return '地铁9号线、10号线、14号线等多条线路可达'
        elif '石景山区' in address:
            return '地铁1号线、6号线可达'
        else:
            return '请查询具体交通路线'
    
    def _extract_quality_score(self, assessment: str) -> float:
        """从评估文本中提取质量分数"""
        try:
            # 尝试从文本中提取分数
            import re
            score_match = re.search(r'(\d+\.?\d*)/5', assessment)
            if score_match:
                return float(score_match.group(1))
            
            # 如果找不到分数，返回默认值
            return 4.0
        except:
            return 4.0
        
    def _create_workforce(self):
        """创建Workforce实例"""
        # 创建任务列表
        tasks = [
            Task(
                content="收集用户所需运动类型的场馆信息",
                id="task_1",
                additional_info="使用搜索工具收集最新的场馆信息"
            ),
            Task(
                content="深度分析用户运动需求和偏好",
                id="task_2", 
                additional_info="通过RolePlaying进行需求挖掘"
            ),
            Task(
                content="基于信息和需求分析制定推荐方案",
                id="task_3",
                additional_info="使用数学工具进行量化决策"
            ),
            Task(
                content="评估推荐质量并提出改进建议",
                id="task_4",
                additional_info="全面评估推荐结果的质量"
            )
        ]
        
        # 创建工作节点映射
        workers = [
            self.information_collector,
            self.roleplay_analyst,
            self.recommendation_specialist,
            self.quality_assessor
        ]
        
        # 创建Workforce实例
        workforce = Workforce(
            workers=workers,
            tasks=tasks
        )
        
        return workforce
        
    @smart_retry(RetryConfig(max_retries=3, base_delay=2.0, backoff_factor=1.5))
    def start_workforce_recommendation(self, use_random_case=True, custom_case=None):
        """启动Workforce版推荐流程（增强版）"""
        print("\n🎯 Workforce版AI运动场馆推荐系统启动")
        print("=" * 80)
        
        # 生成用户需求
        if use_random_case:
            user_description, case_info = self.ai_user.create_enhanced_profile()
        else:
            user_description, case_info = self.ai_user.create_enhanced_profile(custom_case)
        
        # 获取相关历史记录（智能记忆功能）
        relevant_history = self.memory_manager.get_relevant_history(user_description, max_records=3)
        
        # 构建智能上下文
        history_context = ""
        if relevant_history:
            history_context = "📚 相关历史经验:\n"
            for i, (content, score) in enumerate(relevant_history):
                history_context += f"历史记录{i+1}(相关度:{score:.2f}): {content[:200]}...\n"
            print(f"🧠 找到{len(relevant_history)}条相关历史记录")
        else:
            history_context = "这是新用户的首次咨询"
            print("🆕 新用户首次咨询")
        
        print(f"\n🔄 开始Workforce协作流程...")
        print("=" * 60)
        
        # 阶段1：信息收集（带扩展搜索）
        print(f"\n📊 阶段1：信息收集（智能扩展搜索）")
        print("-" * 40)
        
        # 使用优化的扩展搜索功能（并行获取多平台数据）
        expanded_search_results = self.search_toolkit.optimized_venue_search(case_info, case_info['location'])
        
        collection_prompt = f"""
        请收集以下用户需求相关的运动场馆信息：
        
        用户需求：{user_description}
        
        搜索重点：
        - 运动类型：{case_info['sport_preference']}
        - 位置区域：{case_info['location']}
        - 特殊需求：{case_info['special_needs']}
        - 预算范围：{case_info['budget_range']}
        
        扩展搜索结果：
        - 搜索区域：{expanded_search_results['search_areas']}
        - 扩展级别：{expanded_search_results['expansion_level']}
        - 已验证场馆数量：{len(expanded_search_results['verified_venues'])}
        - 大众点评场馆数量：{len(expanded_search_results['dianping_venues'])}（免验证）
        - 美团场馆数量：{len(expanded_search_results['meituan_venues'])}（免验证）
        - 微信小程序场馆数量：{len(expanded_search_results['wechat_venues'])}（免验证）
        
        已验证的真实场馆：
        {json.dumps(expanded_search_results['verified_venues'], ensure_ascii=False, indent=2)}
        
        大众点评平台场馆（免验证）：
        {json.dumps(expanded_search_results['dianping_venues'], ensure_ascii=False, indent=2)}
        
        美团平台场馆（免验证）：
        {json.dumps(expanded_search_results['meituan_venues'], ensure_ascii=False, indent=2)}
        
        微信小程序平台场馆（免验证）：
        {json.dumps(expanded_search_results['wechat_venues'], ensure_ascii=False, indent=2)}
        
        请基于扩展搜索结果和所有场馆信息（包括平台免验证场馆），整理完整的场馆信息。
        重要：
        1. 已验证场馆和平台场馆（大众点评/美团/微信小程序）都可以直接使用
        2. 平台场馆已经过平台审核，无需额外验证
        3. 不要编造任何场馆数据
        """
        
        collection_result = self.information_collector.step(
            BaseMessage.make_user_message(role_name="User", content=collection_prompt)
        )
        
        collected_info = collection_result.msg.content if collection_result.msg else "信息收集失败"
        total_platform_venues = (len(expanded_search_results['dianping_venues']) + 
                                len(expanded_search_results['meituan_venues']) + 
                                len(expanded_search_results['wechat_venues']))
        total_venues = len(expanded_search_results['verified_venues']) + total_platform_venues
        
        print(f"信息收集完成：搜索了{len(expanded_search_results['search_areas'])}个区域")
        print(f"找到{len(expanded_search_results['verified_venues'])}个已验证场馆")
        print(f"找到{total_platform_venues}个平台免验证场馆（大众点评{len(expanded_search_results['dianping_venues'])}个，美团{len(expanded_search_results['meituan_venues'])}个，微信{len(expanded_search_results['wechat_venues'])}个）")
        print(f"总计{total_venues}个可用场馆")
        
        # 检查是否需要优先级确认（考虑平台场馆）
        needs_priority_check = (
            total_venues < 3 or 
            expanded_search_results['expansion_level'] > 0
        )
        
        priority_confirmation = ""
        if needs_priority_check:
            print(f"\n阶段1.5：需求优先级确认")
            print("-" * 40)
            
            priority_prompt = f"""
            由于在用户指定区域（{case_info['location']}）找到的合适场馆较少，
            我们已经扩展搜索到{len(expanded_search_results['search_areas'])}个区域。
            
            用户需求：
            - 运动类型：{case_info['sport_preference']}（核心需求，不可妥协）
            - 位置区域：{case_info['location']}（已扩展搜索）
            - 特殊需求：{case_info['special_needs']}
            - 预算范围：{case_info['budget_range']}
            - 运动时间：{case_info['preferred_time']}
            - 交通方式：{case_info['transport_mode']}
            
            请帮助用户确认需求优先级：
            1. 分析哪些需求是必须满足的
            2. 哪些需求可以适当妥协
            3. 为扩大搜索范围提供建议
            4. 说明妥协的合理性和必要性
            
            目标：在保证核心需求的前提下，找到最适合的运动场馆。
            """
            
            priority_result = self.priority_consultant.step(
                BaseMessage.make_user_message(role_name="User", content=priority_prompt)
            )
            
            priority_confirmation = priority_result.msg.content if priority_result.msg else "优先级确认失败"
            print(f"需求优先级确认完成")
        
        # 阶段2：需求分析（使用RolePlaying）
        print(f"\n阶段2：深度需求分析（RolePlaying模式）")
        print("-" * 40)
        
        # 初始化RolePlaying会话
        analysis_prompt = f"""
        请对以下用户进行深度需求分析：
        
        用户基本信息：{user_description}
        
        请通过对话深入了解用户的真实需求、偏好和约束条件。
        """
        
        # 设置RolePlaying的初始消息
        roleplay_input = self.roleplay_analyst.init_chat()
        
        # 进行几轮RolePlaying对话
        analysis_results = []
        for i in range(3):  # 进行3轮深度分析对话
            try:
                assistant_response, user_response = self.roleplay_analyst.step(roleplay_input)
                
                if assistant_response.msg:
                    analysis_results.append(assistant_response.msg.content)
                    print(f"分析师第{i+1}轮：{assistant_response.msg.content[:150]}...")
                
                if user_response.msg:
                    print(f"用户第{i+1}轮：{user_response.msg.content[:150]}...")
                    roleplay_input = assistant_response.msg
                else:
                    break
                    
                if assistant_response.terminated or user_response.terminated:
                    break
                    
            except Exception as e:
                print(f"RolePlaying第{i+1}轮出现问题：{e}")
                break
        
        needs_analysis = "\n".join(analysis_results) if analysis_results else "需求分析未完成"
        print(f"需求分析完成")
        
        # 阶段3：推荐决策制定（基于真实场馆）
        print(f"\n阶段3：推荐决策制定（真实场馆优先）")
        print("-" * 40)
        
        decision_prompt = f"""
        基于以下信息制定个性化推荐方案：
        
        用户需求：{user_description}
        
        收集的场馆信息：{collected_info}
        
        深度需求分析：{needs_analysis}
        
        需求优先级确认：{priority_confirmation}
        
        已验证的真实场馆数据：
        {json.dumps(expanded_search_results['verified_venues'], ensure_ascii=False, indent=2)}
        
        大众点评平台场馆（免验证）：
        {json.dumps(expanded_search_results['dianping_venues'], ensure_ascii=False, indent=2)}
        
        美团平台场馆（免验证）：
        {json.dumps(expanded_search_results['meituan_venues'], ensure_ascii=False, indent=2)}
        
        微信小程序平台场馆（免验证）：
        {json.dumps(expanded_search_results['wechat_venues'], ensure_ascii=False, indent=2)}
        
        搜索范围信息：
        - 搜索区域：{expanded_search_results['search_areas']}
        - 扩展级别：{expanded_search_results['expansion_level']}
        
        请使用数学工具进行量化分析，制定3-5个具体的场馆推荐方案。
        
        重要要求：
        1. 优先推荐平台免验证场馆（大众点评/美团/微信小程序），其次推荐已验证场馆
        2. 平台场馆已经过平台审核，质量有保障，可以直接推荐
        3. 每个推荐必须包含：场馆名称、地址、联系方式、价格、推荐理由
        4. 标明场馆的验证状态（平台免验证/已验证）
        5. 说明推荐场馆与用户需求的匹配度
        6. 如果推荐了扩展区域的场馆，要说明交通方案
        7. 绝对不要编造或虚构场馆信息
        
        推荐优先级：大众点评场馆 > 美团场馆 > 微信小程序场馆 > 已验证场馆 > 其他场馆
        """
        
        decision_result = self.recommendation_specialist.step(
            BaseMessage.make_user_message(role_name="User", content=decision_prompt)
        )
        
        recommendation = decision_result.msg.content if decision_result.msg else "推荐生成失败"
        print(f"推荐方案完成：基于{len(expanded_search_results['verified_venues'])}个已验证场馆")
        
        # 阶段4：质量评估
        print(f"\n阶段4：质量评估")
        print("-" * 40)
        
        assessment_prompt = f"""
        请评估以下推荐结果的质量：
        
        原始用户需求：{user_description}
        
        最终推荐方案：{recommendation}
        
        请从完整性、相关性、可操作性、实用性、个性化程度等维度进行评估，
        并给出具体的评分和改进建议。
        
        请以JSON格式输出评估结果，包含：
        {{
            "scores": {{
                "completeness": 0.0-1.0,
                "relevance": 0.0-1.0,
                "actionability": 0.0-1.0,
                "practicality": 0.0-1.0,
                "personalization": 0.0-1.0
            }},
            "overall_score": 0.0-5.0,
            "improvement_suggestions": ["建议1", "建议2", "建议3"],
            "missing_information": ["缺失信息1", "缺失信息2"],
            "optimization_areas": ["优化方向1", "优化方向2"]
        }}
        """
        
        assessment_result = self.quality_assessor.step(
            BaseMessage.make_user_message(role_name="User", content=assessment_prompt)
        )
        
        quality_assessment = assessment_result.msg.content if assessment_result.msg else "质量评估失败"
        print(f"质量评估完成：{quality_assessment[:200]}...")
        
        # 阶段5：改进执行
        print(f"\n阶段5：改进执行与标准化输出")
        print("-" * 40)
        
        improvement_prompt = f"""
        根据质量评估的结果，请优化和完善推荐方案：
        
        原始用户信息：{case_info}
        
        用户需求描述：{user_description}
        
        收集的场馆信息：{collected_info}
        
        需求分析结果：{needs_analysis}
        
        初始推荐方案：{recommendation}
        
        质量评估结果：{quality_assessment}
        
        请根据评估建议进行以下改进：
        1. 补充缺失的场馆详细信息
        2. 优化推荐内容的结构和逻辑
        3. 增强个性化建议
        4. 提供更具体的行动指导
        5. 使用统一的标准化模板格式
        
        请生成最终的标准化推荐报告，确保信息完整、结构清晰、个性化程度高。
        """
        
        improvement_result = self.improvement_executor.step(
            BaseMessage.make_user_message(role_name="User", content=improvement_prompt)
        )
        
        final_recommendation = improvement_result.msg.content if improvement_result.msg else "改进执行失败"
        print(f"改进执行完成：{final_recommendation[:200]}...")
        
        # 使用统一模板格式化最终输出
        try:
            # 解析场馆信息（简化处理）
            venues_data = self._extract_venue_data_from_recommendation(final_recommendation, case_info)
            
            # 生成标准化报告
            standardized_report = RecommendationTemplate.format_final_recommendation(
                user_info=case_info,
                venues=venues_data,
                analysis=needs_analysis[:500] + "..." if len(needs_analysis) > 500 else needs_analysis
            )
            
            print(f"标准化报告生成完成")
            
        except Exception as e:
            print(f"标准化处理出现问题，使用改进后的推荐: {e}")
            standardized_report = final_recommendation
        
        # 验证推荐结果质量（使用优化版本的验证器）
        quality_metrics = self.validator.validate_recommendation(final_recommendation, case_info)
        
        print(f"\n📊 推荐质量评估:")
        print(f"完整性: {quality_metrics['completeness']:.2f}")
        print(f"相关性: {quality_metrics['relevance']:.2f}")
        print(f"具体性: {quality_metrics['specificity']:.2f}")
        print(f"可操作性: {quality_metrics['actionability']:.2f}")
        print(f"总体质量: {quality_metrics['overall_quality']:.2f}")
        
        # 保存到增强记忆系统
        metadata = {
            "case_info": case_info,
            "workflow_type": "workforce_enhanced",
            "stages_completed": 5,
            "quality_score": self._extract_quality_score(quality_assessment),
            "quality_metrics": quality_metrics,
            "tool_usage": "workforce_collaboration",
            "history_context_used": len(relevant_history) > 0,
            "timestamp": datetime.now().isoformat()
        }
        
        self.memory_manager.write_enhanced_record(
            user_description, 
            standardized_report, 
            metadata
        )
        
        # 更新用户偏好模型
        user_id = f"user_{hash(user_description) % 10000}"
        self.memory_manager.update_user_preferences(user_id, case_info)
        
        print("\n💾 增强版Workforce协作结果已保存到记忆系统")
        print("🎯 用户偏好模型已更新")
        print("=" * 80)
        
        # 返回完整结果
        return {
            "case_info": case_info,
            "user_description": user_description,
            "search_results": expanded_search_results,
            "priority_confirmation": priority_confirmation,
            "collected_info": collected_info,
            "needs_analysis": needs_analysis,
            "initial_recommendation": recommendation,
            "quality_assessment": quality_assessment,
            "final_recommendation": final_recommendation,
            "standardized_report": standardized_report,
            "verified_venues_count": len(expanded_search_results['verified_venues']),
            "platform_venues_count": {
                "dianping": len(expanded_search_results['dianping_venues']),
                "meituan": len(expanded_search_results['meituan_venues']),
                "wechat": len(expanded_search_results['wechat_venues'])
            },
            "total_venues_count": len(expanded_search_results['verified_venues']) + 
                                len(expanded_search_results['dianping_venues']) + 
                                len(expanded_search_results['meituan_venues']) + 
                                len(expanded_search_results['wechat_venues']),
            "search_areas": expanded_search_results['search_areas'],
            "expansion_level": expanded_search_results['expansion_level'],
            "timestamp": datetime.now().isoformat()
        }
    
    def get_enhanced_memory_analysis(self):
        """增强的记忆分析（从优化版本适配）"""
        all_history = self.memory_manager.chat_history.retrieve(window_size=20)
        if not all_history:
            print("📊 暂无历史记录")
            return
        
        print("\n📊 增强记忆系统分析报告:")
        print("=" * 60)
        
        # 统计分析
        user_requests = []
        recommendations = []
        quality_scores = []
        
        for record in all_history:
            content = record.memory_record.message.content
            if record.memory_record.message.role_name == "User":
                user_requests.append(content)
                # 提取质量分数
                if "[元数据:" in content:
                    try:
                        metadata_str = content.split("[元数据:")[1].split("]")[0]
                        metadata = json.loads(metadata_str)
                        if "quality_metrics" in metadata:
                            quality_scores.append(metadata["quality_metrics"]["overall_quality"])
                    except:
                        pass
            elif record.memory_record.message.role_name == "SportsConsultant":
                recommendations.append(content)
        
        print(f"📈 总处理请求数: {len(user_requests)}")
        print(f"📋 总推荐方案数: {len(recommendations)}")
        
        if quality_scores:
            avg_quality = sum(quality_scores) / len(quality_scores)
            print(f"⭐ 平均推荐质量: {avg_quality:.2f}")
            print(f"🏆 最高质量分数: {max(quality_scores):.2f}")
            print(f"📉 最低质量分数: {min(quality_scores):.2f}")
        
        # 用户偏好分析
        sport_preferences = {}
        location_preferences = {}
        
        for request in user_requests:
            # 运动偏好统计
            sports = ["篮球", "羽毛球", "游泳", "健身", "跑步", "足球", "网球", "瑜伽", "乒乓球", "攀岩"]
            for sport in sports:
                if sport in request:
                    sport_preferences[sport] = sport_preferences.get(sport, 0) + 1
            
            # 位置偏好统计
            locations = ["朝阳", "海淀", "东城", "西城", "丰台", "石景山"]
            for location in locations:
                if location in request:
                    location_preferences[location] = location_preferences.get(location, 0) + 1
        
        if sport_preferences:
            print(f"🏃 运动偏好排行: {dict(sorted(sport_preferences.items(), key=lambda x: x[1], reverse=True))}")
        
        if location_preferences:
            print(f"📍 区域偏好排行: {dict(sorted(location_preferences.items(), key=lambda x: x[1], reverse=True))}")
        
        print("=" * 60)
    
    def benchmark_system_performance(self, num_tests: int = 3):
        """系统性能基准测试（从优化版本适配）"""
        print(f"\n🧪 开始Workforce系统性能基准测试 ({num_tests}次测试)")
        print("=" * 60)
        
        results = []
        total_start_time = datetime.now()
        
        for i in range(num_tests):
            print(f"\n测试 {i+1}/{num_tests}")
            start_time = datetime.now()
            
            result = self.start_workforce_recommendation(use_random_case=True)
            
            end_time = datetime.now()
            duration = (end_time - start_time).total_seconds()
            
            # 提取质量分数
            quality_score = 0.0
            try:
                if 'quality_assessment' in result:
                    # 简化的质量分数提取
                    quality_score = self._extract_quality_score(result['quality_assessment'])
            except:
                quality_score = 0.5  # 默认分数
            
            test_result = {
                "test_id": i+1,
                "duration": duration,
                "quality_score": quality_score,
                "total_venues": result.get('total_venues_count', 0),
                "verified_venues": result.get('verified_venues_count', 0),
                "platform_venues": sum(result.get('platform_venues_count', {}).values()),
                "expansion_level": result.get('expansion_level', 0)
            }
            
            results.append(test_result)
            print(f"⏱️  耗时: {duration:.2f}秒")
            print(f"⭐ 质量: {test_result['quality_score']:.2f}")
            print(f"🏢 场馆数: {test_result['total_venues']}个")
        
        total_end_time = datetime.now()
        total_duration = (total_end_time - total_start_time).total_seconds()
        
        # 计算统计数据
        avg_duration = sum(r["duration"] for r in results) / len(results)
        avg_quality = sum(r["quality_score"] for r in results) / len(results)
        avg_venues = sum(r["total_venues"] for r in results) / len(results)
        avg_verified = sum(r["verified_venues"] for r in results) / len(results)
        avg_platform = sum(r["platform_venues"] for r in results) / len(results)
        
        print(f"\n📊 Workforce系统基准测试结果汇总:")
        print(f"总耗时: {total_duration:.2f}秒")
        print(f"平均单次耗时: {avg_duration:.2f}秒")
        print(f"平均质量分数: {avg_quality:.2f}")
        print(f"平均场馆数量: {avg_venues:.1f}个")
        print(f"平均已验证场馆: {avg_verified:.1f}个")
        print(f"平均平台场馆: {avg_platform:.1f}个")
        print(f"系统稳定性: {'优秀' if avg_quality > 0.7 else '良好' if avg_quality > 0.5 else '需要改进'}")
        print("=" * 60)
        
        return results

# 主函数
def main(use_mock_data_if_no_key=True):
    """主函数 - 演示Workforce版运动场馆推荐系统
    
    Args:
        use_mock_data_if_no_key: 是否在API密钥未设置或API调用失败时使用模拟数据作为备用
    """
    print("启动Workforce版运动场馆推荐系统")
    print("=" * 80)
    print(f"API调用模式: {'优先使用真实API，备用模拟数据' if use_mock_data_if_no_key else '仅使用真实API，无备用数据'}")
    print("=" * 80)
    
    try:
        # 创建系统实例
        system = WorkforceSportsVenueRecommendationSystem(model, use_mock_data_if_no_key=use_mock_data_if_no_key)
        
        # 运行推荐流程
        result = system.start_workforce_recommendation(use_random_case=True)
        
        print("\n增强版Workforce协作完成！")
        print("=" * 80)
        print(f"用户画像：{result['case_info']['occupation']} - {result['case_info']['sport_preference']}")
        print(f"信息收集：完成（搜索{len(result['search_areas'])}个区域）")
        print(f"扩展搜索：级别{result['expansion_level']}（找到{result['verified_venues_count']}个已验证场馆）")
        print(f"平台场馆：大众点评{result['platform_venues_count']['dianping']}个，美团{result['platform_venues_count']['meituan']}个，微信{result['platform_venues_count']['wechat']}个（免验证）")
        print(f"总计场馆：{result['total_venues_count']}个可用场馆")
        if result['priority_confirmation']:
            print(f"优先级确认：完成")
        print(f"需求分析：完成（RolePlaying模式）")
        print(f"推荐决策：完成（基于真实场馆数据）")
        print(f"质量评估：完成")
        print(f"改进执行：完成（真实性验证+统一模板输出）")
        
        print(f"\n初始推荐方案：")
        print("-" * 60)
        print(result['initial_recommendation'][:300] + "..." if len(result['initial_recommendation']) > 300 else result['initial_recommendation'])
        
        print(f"\n质量评估结果：")
        print("-" * 60)
        print(result['quality_assessment'][:300] + "..." if len(result['quality_assessment']) > 300 else result['quality_assessment'])
        
        print(f"\n改进后推荐方案：")
        print("-" * 60)
        print(result['final_recommendation'][:300] + "..." if len(result['final_recommendation']) > 300 else result['final_recommendation'])
        
        print(f"\n标准化推荐报告：")
        print("-" * 60)
        print(result['standardized_report'])
        
        # 记忆分析演示
        print(f"\n🧠 记忆系统分析演示：")
        print("=" * 80)
        system.get_enhanced_memory_analysis()
        
        # 询问是否进行性能基准测试
        print(f"\n🧪 是否进行系统性能基准测试？")
        print("这将运行多次推荐流程来评估系统性能")
        print("输入 'y' 或 'yes' 确认，其他键跳过")
        
        # 在实际使用中可以取消注释以下代码来启用交互式测试
        # user_input = input("请选择: ").strip().lower()
        # if user_input in ['y', 'yes']:
        #     system.benchmark_system_performance(num_tests=3)
        # else:
        #     print("跳过性能基准测试")
        
        print("\n🎉 Workforce版增强系统演示完成！")
        print("✅ 智能记忆管理系统成功实现用户偏好学习")
        print("✅ 多Agent协作提升了推荐准确度和完整性")
        print("✅ 结果验证系统确保了推荐质量")
        print("✅ 真实平台数据源提供了可靠的场馆信息")
        
    except Exception as e:
        print(Fore.RED + f"❌ 系统运行出错: {e}")
        traceback.print_exc()

if __name__ == "__main__":
    import argparse
    
    # 创建命令行参数解析器
    parser = argparse.ArgumentParser(description='Workforce版运动场馆推荐系统')
    parser.add_argument('--no-mock', action='store_true', help='禁用模拟数据备用模式，仅使用真实API')
    parser.add_argument('--mock', action='store_true', help='启用模拟数据备用模式（默认）')
    
    args = parser.parse_args()
    
    # 确定是否使用模拟数据作为备用
    use_mock_data = not args.no_mock if not args.mock else True
    
    # 运行主函数
    main(use_mock_data_if_no_key=use_mock_data)

代码比较长，我们直接试运行一下：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Prompt_task2_workforce.py
启动Workforce版运动场馆推荐系统
================================================================================
API调用模式: 优先使用真实API，备用模拟数据
================================================================================ 
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_linkup'. The parameter definition is {'enum': ['searchResults', 'sourcedAnswer', 'structured'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'enum': ['OneDay', 'OneWeek', 'OneMonth', 'OneYear', 'NoLimit'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'anyOf': [{'enum': ['finance', 'law', 'medical', 'internet', 'tax', 'news_province', 'news_center'], 'type': 'string'}, {'type': 'null'}], 'type': ['null']}. This may affect the quality of tool calling.
  warnings.warn(
🚀 Workforce版AI运动场馆推荐系统已初始化
✅ 智能记忆管理系统已加载
✅ 结果验证系统已启用
✅ 增强搜索工具包已配置（启用模拟数据备用模式）

正在创建Workforce工作节点...
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'safe_search_duckduckgo'. The parameter definition is {'type': 'string'}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'safe_search_duckduckgo'. The parameter definition is {'type': ['integer', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'expanded_venue_search'. The parameter definition is {'additionalProperties': True, 'type': 'object'}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'expanded_venue_search'. The parameter definition is {'type': 'string'}. This may affect the quality of tool calling.
  warnings.warn(
✅ 信息收集专员已创建（配备增强搜索工具）
✅ RolePlaying需求分析专员已创建
✅ 推荐决策专员已创建（配备数学工具）
✅ 质量评估专员已创建
✅ 需求优先级确认专员已创建
✅ 改进执行专员已创建（真实性验证+统一模板输出）

🎯 Workforce版AI运动场馆推荐系统启动
================================================================================ 

增强版用户运动需求案例：
年龄：56-65岁
职业：自由职业者 (收入：3000-8000元)
运动经验：初学者
运动偏好：网球 (每周1-2次)
偏好时间：周末全天
特殊需求：交通便利优先
预算范围：100-200元/次
所在位置：北京市海淀区中关村街道
交通方式：开车
--------------------------------------------------

AI用户的详细需求描述：
我是一名56-65岁的自由职业者，住在北京市海淀区中关村街道，打算开始学习网球，希望能通过这项运动增强体质，丰富业余生活。我的运动计划是每周周末全天进行1-2次网球训练，作为初学者，我希望选择一个设施齐全、环境舒适的网球馆，最好能提供专业的教练指导。 考虑到我通常开车出行，因此交通便利性是我选择场馆的重要考量之一。我的预算大约在100-200元每次，希望能在北京海淀区附近找到符合这些条件的网球馆。
--------------------------------------------------
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\memories\blocks\chat_history_block.py:73: UserWarning: The `ChatHistoryMemory` is empty.
  warnings.warn("The `ChatHistoryMemory` is empty.")
🆕 新用户首次咨询

🔄 开始Workforce协作流程...
============================================================

📊 阶段1：信息收集（智能扩展搜索）
----------------------------------------
开始优化搜索: 海淀区 + 网球
正在从大众点评API获取海淀区网球场馆数据...
正在从美团API获取海淀区网球场馆数据...
正在从微信小程序API获取海淀区网球场馆数据...
美团API返回错误状态码: 404，响应内容: <html>
<head><title>404 Not Found</title></head>
<body>
<center><h1>404 Not Found</h1></center>

使用美团模拟数据（API密钥未设置或API调用失败）
大众点评API调用失败: Expecting value: line 1 column 1 (char 0)
使用大众点评模拟数据（API密钥未设置或API调用失败）
微信小程序API返回错误状态码: 404，响应内容: 
使用微信小程序模拟数据（API密钥未设置或API调用失败）
优化搜索完成: 找到11个场馆
数据源分布: 已验证5个 | 大众点评2个 | 美团2个 | 微信2个
信息收集完成：搜索了1个区域
找到5个已验证场馆
找到6个平台免验证场馆（大众点评2个，美团2个，微信2个）
总计11个可用场馆

阶段2：深度需求分析（RolePlaying模式）
----------------------------------------
分析师第1轮：Solution: 为了更好地了解您的运动需求和偏好，我需要先了解一下您的基本信息。请您分享一下您的年龄、性别、职业等方面的信息，这将帮助我为您提供更个性化的 建议。如果您有任何隐私方面的顾虑，您可以选择不提供某些信息，但提供的信息越多，我 的分析就越准确。

例如，您可以这样回答：“我今年28岁，男性...
用户第1轮：Instruction: 请告诉我您的基本信息，包括年龄、性别、职业等。
Input: None...
分析师第2轮：Solution: 为了更全面地了解您的生活方式和时间安排，我需要您描述一下您的日常生活习惯。具体来说，可以包括以下几个方面：

- 工作日的工作时间和周末的工作情况（如果有加班或远程工作的话也请告知）。
- 您每天的休息时间，比如晚上几点睡觉，早上几点起床。
- 日常活动，比如上下班通勤方式、午休...
用户第2轮：Instruction: 请描述您的日常生活习惯，包括工作时间、休息时间以及日常活 动。
Input: None...
分析师第3轮：Solution: 了解您当前的运动习惯对于分析您的需求和偏好非常重要。请您分享以下信息：

- 您喜欢的运动类型：比如跑步、游泳、健身房锻炼、瑜伽等。
- 您每周进行运动的次数。
- 每次运动的持续时间。
- 您是否参加过任何运动课程或有固定的运动伙伴。
- 您对运动的具体偏好，比如喜欢室内还是室...
用户第3轮：Instruction: 请分享您目前的运动习惯，包括喜欢的运动类型、频率和持续时 间。
Input: None...
需求分析完成

阶段3：推荐决策制定（真实场馆优先）
----------------------------------------
推荐方案完成：基于5个已验证场馆

阶段4：质量评估
----------------------------------------
质量评估完成：```json
{
    "scores": {
        "completeness": 0.85,
        "relevance": 0.95,
        "actionability": 0.9,
        "practicality": 0.9,
        "personalization": 0.9
    },
    "overall_score":...

阶段5：改进执行与标准化输出
----------------------------------------
改进执行完成：### 个性化网球馆推荐方案

根据您的需求分析，结合场馆的位置、价格、设施及交通便利性，以下是为您精心挑选的3-5个网球馆推荐方案。所有推荐场馆均已验证或来自知名平台，具有较高的可信度。

#### 1. 海淀区优质网球馆
- **地址**: 北京市海淀区示例路88号
- **联系方式**: 010-12345678
- **价格范围**: ¥80-200/小时
- **开放时间**: 周末全天...
正在从大众点评API获取海淀区网球场馆数据...
大众点评API调用失败: Expecting value: line 1 column 1 (char 0)
使用大众点评模拟数据（API密钥未设置或API调用失败）
正在从美团API获取海淀区网球场馆数据...
美团API返回错误状态码: 404，响应内容: <html>
<head><title>404 Not Found</title></head>
<body>
<center><h1>404 Not Found</h1></center>

使用美团模拟数据（API密钥未设置或API调用失败）
正在从微信小程序API获取海淀区网球场馆数据...
微信小程序API返回错误状态码: 404，响应内容: 
使用微信小程序模拟数据（API密钥未设置或API调用失败）
✅ 找到6个推荐场馆（优先使用平台场馆）
标准化报告生成完成

📊 推荐质量评估:
完整性: 1.00
相关性: 0.75
具体性: 0.40
可操作性: 0.67
总体质量: 0.70

💾 增强版Workforce协作结果已保存到记忆系统
🎯 用户偏好模型已更新
================================================================================ 

增强版Workforce协作完成！
================================================================================ 
用户画像：自由职业者 - 网球
信息收集：完成（搜索1个区域）
扩展搜索：级别0（找到5个已验证场馆）
平台场馆：大众点评2个，美团2个，微信2个（免验证）
总计场馆：11个可用场馆
需求分析：完成（RolePlaying模式）
推荐决策：完成（基于真实场馆数据）
质量评估：完成
改进执行：完成（真实性验证+统一模板输出）

初始推荐方案：
------------------------------------------------------------
### 个性化网球馆推荐方案

根据您的需求分析，结合场馆的位置、价格、设施及交通便利性，以下是为您精心挑选的3-5个网球馆推荐方案：

1. **海淀区优质网球馆**
   - **地址**: 北京市海淀区示例路88号
   - **联系方式**: 010-12345678
   - **价格范围**: ¥80-200/小时
   - **推荐理由**: 该场馆专为网球爱好者设计，设施齐全，环境舒适。价格适中，符合您的预算。由于其位于海淀区，交通便利，适合驾车前往。此外，该场馆提供专业的教练指导 ，非常适合初学者。
   - **验证状态**: 平台免验证
   - **需求匹配度**:
  ...

质量评估结果：
------------------------------------------------------------
json
{
    "scores": {
        "completeness": 0.85,
        "relevance": 0.95,
        "actionability": 0.9,
        "practicality": 0.9,
        "personalization": 0.9
    },
    "overall_score": 4.5,
    "improvement_suggestions": [
        "为每个场馆提供更详细的开放时间，尤其是周末的具体时间段。",
        "补充每个场馆的教练资质和...

改进后推荐方案：
------------------------------------------------------------
### 个性化网球馆推荐方案

根据您的需求分析，结合场馆的位置、价格、设施及交通便利性，以下是为您精心挑选的3-5个网球馆推荐方案。所有推荐场馆均已验证或来自知名平台，具有较高的可信度。

#### 1. 海淀区优质网球馆
- **地址**: 北京市海淀区示例路88号
- **联系方式**: 010-12345678
- **价格范围**: ¥80-200/小时
- **开放时间**: 周末全天（09:00-22:00）
- **教练资质**: 持有国家网球教练证书，平均教学经验超过5年
- **交通便利性**: 位于海淀区，适合驾车前往，周边有地铁10号线知春路站
- **用户评价**: ...

标准化推荐报告：
------------------------------------------------------------

# 个性化运动场馆推荐报告

## 用户画像
- **年龄段**: 56-65岁
- **职业**: 自由职业者
- **运动偏好**: 网球
- **运动频率**: 每周1-2次
- **预算范围**: 100-200元/次
- **位置**: 北京市海淀区中关村街道
- **特殊需求**: 交通便利优先

## 需求分析总结
Solution: 为了更好地了解您的运动需求和偏好，我需要先了解一下您的基本信息。请您分 享一下您的年龄、性别、职业等方面的信息，这将帮助我为您提供更个性化的建议。如果您 有任何隐私方面的顾虑，您可以选择不提供某些信息，但提供的信息越多，我的分析就越准 确。

例如，您可以这样回答：“我今年28岁，男性，是一名软件工程师。”

请您分享一些基本信息吧！
Next request.
Solution: 为了更全面地了解您的生活方式和时间安排，我需要您描述一下您的日常生活习 惯。具体来说，可以包括以下几个方面：

- 工作日的工作时间和周末的工作情况（如果有加班或远程工作的话也请告知）。
- 您每天的休息时间，比如晚上几点睡觉，早上几点起床。
- 日常活动，比如上下班通勤方式、午休习惯、晚餐后的活动等。

这些信息有助于我了解您的生活节奏，从而为您制定合适的运动计划。例如，您可以这样描 述：“我通常早上9点上班，晚上6点下班，每周工作五天。工作日我会在公司吃午饭，然后午休一小时。晚上回家后，我喜欢看看书或者玩玩游戏放松一下，一般晚上11点左右睡觉。”  

请您描述一下您的日常生活习惯吧！
Next ...

## 推荐场馆列表

### 推荐 1:
**海淀区优质网球馆** 大众点评平台免验证场馆
地址：北京市海淀区区示例路88号
联系方式：请通过大众点评平台联系
价格：¥80-200/小时
营业时间：请咨询营业时间
交通方式：地铁4号线、10号线、13号线等多条线路可达
推荐评分：4.8/10
推荐理由：大众点评平台免验证网球场馆，用户评价0条
特色服务：专业网球场馆
注意事项：大众点评平台场馆，用户评价丰富

### 推荐 2:
**海淀区网球中心** 大众点评平台免验证场馆
地址：北京市海淀区区样板街100号
联系方式：请通过大众点评平台联系
价格：¥60-150/小时
营业时间：请咨询营业时间
交通方式：地铁4号线、10号线、13号线等多条线路可达
推荐评分：4.5/10
推荐理由：大众点评平台免验证网球场馆，用户评价0条
特色服务：专业网球场馆
注意事项：大众点评平台场馆，用户评价丰富

### 推荐 3:
**海淀区网球专业馆** 美团平台免验证场馆
地址：北京市海淀区区示范路66号
联系方式：请通过美团平台联系
价格：¥70-180/小时
营业时间：请咨询营业时间
交通方式：地铁4号线、10号线、13号线等多条线路可达
推荐评分：4.7/10
推荐理由：美团平台免验证网球场馆，团购优惠
特色服务：专业网球场馆
注意事项：美团平台场馆，团购优惠丰富

### 推荐 4:
**海淀区全民网球馆** 美团平台免验证场馆
地址：北京市海淀区区模板大街50号
联系方式：请通过美团平台联系
价格：¥50-120/小时
营业时间：请咨询营业时间
交通方式：地铁4号线、10号线、13号线等多条线路可达
推荐评分：4.6/10
推荐理由：美团平台免验证网球场馆，团购优惠
特色服务：专业网球场馆
注意事项：美团平台场馆，团购优惠丰富

### 推荐 5:
**海淀区网球俱乐部** 微信小程序平台免验证场馆
地址：北京市海淀区区范例大道33号
联系方式：请通过微信小程序'相关小程序'联系
价格：¥90-220/小时
营业时间：请咨询营业时间
交通方式：地铁4号线、10号线、13号线等多条线路可达
推荐评分：4.9/10
推荐理由：微信小程序平台免验证网球场馆，在线预约便利
特色服务：专业网球场馆
注意事项：微信小程序平台场馆，在线预约便利


## 个性化建议
- 作为初学者，建议选择有专业教练指导的场馆
- 优先选择交通便利的场馆，减少通勤时间
- 建议先体验1-2个场馆，找到最适合的再长期坚持

## 下一步行动
1. 联系心仪场馆，咨询详细信息和预约方式
2. 安排时间实地考察，体验场馆环境和设施
3. 比较不同场馆的会员卡价格和优惠政策
4. 制定个人运动计划，确定运动时间和频率
5. 开始规律运动，并定期评估效果

---
*报告生成时间: 2025-07-20 23:17:52*
*推荐有效期: 30天*
*注意：本报告只包含已验证的真实场馆信息*


🧠 记忆系统分析演示：
================================================================================ 

📊 增强记忆系统分析报告:
============================================================
📈 总处理请求数: 1
📋 总推荐方案数: 1
🏃 运动偏好排行: {'网球': 1}
📍 区域偏好排行: {'海淀': 1}
============================================================

🧪 是否进行系统性能基准测试？
这将运行多次推荐流程来评估系统性能
输入 'y' 或 'yes' 确认，其他键跳过

🎉 Workforce版增强系统演示完成！
✅ 智能记忆管理系统成功实现用户偏好学习
✅ 多Agent协作提升了推荐准确度和完整性
✅ 结果验证系统确保了推荐质量
✅ 真实平台数据源提供了可靠的场馆信息

目前版本仍然存在第三方平台API调用等问题，仍然在解决。

Agent_camel框架练习（2）

Posted on 2025-07-15 Edited on 2025-07-20 In 自主练习

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

Task1

01.1. 角色扮演任务Agent：使用 AISocietyPromptTemplateDict，创建一个角色扮演任务Agent。假设你想让 AI 扮演一个“健康顾问”，为一个“患者”提供饮食和锻炼建议。请用思维链方式分解整个建议过程，逐步提供健康方案。

from camel.agents import TaskSpecifyAgent
from camel.models import ModelFactory
from camel.prompts import TextPrompt
from camel.types import ModelPlatformType, TaskType
import os
import random
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 创建模型实例
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)


# AI患者Agent - 随机生成患者案例
class AIPatientAgent:
    def __init__(self, model):
        self.model = model
        
        # 定义AI患者的提示模板
        self.patient_prompt = TextPrompt(
            """你是一位需要健康咨询的AI患者。请根据以下信息生成一个真实的患者案例：

            年龄范围：{age_range}
            身份职业：{occupation}
            主要症状：{symptoms}
            潜在原因：{potential_causes}
            
            请以第一人称的方式描述你的情况，包括：
            1. 基本信息（年龄、职业、生活方式）
            2. 具体症状和持续时间
            3. 对健康的担忧和期望
            4. 目前的生活习惯（饮食、运动、睡眠等）
            
            请保持真实、详细，就像真正的患者在描述自己的健康状况一样。
            """
        )
        
        # 创建AI患者的任务Agent
        self.patient_agent = TaskSpecifyAgent(
            model=self.model,
            task_type=TaskType.AI_SOCIETY,
            task_specify_prompt=self.patient_prompt,
            output_language='ch'
        )
        
        # 随机案例生成的模板库
        self.case_templates = {
            "age_ranges": [
                "18-25岁", "26-35岁", "36-45岁", "46-55岁", "56-65岁", "65岁以上"
            ],
            "occupations": [
                "大学生", "程序员", "销售经理", "教师", "医生", "律师",
                "会计师", "设计师", "工程师", "护士", "司机", "厨师",
                "记者", "公务员", "退休人员", "家庭主妇", "创业者"
            ],
            "symptoms": [
                "长期疲劳和精神不振", "颈椎疼痛和肩膀僵硬", "失眠和睡眠质量差",
                "消化不良和胃部不适", "体重增加和代谢缓慢", "头痛和注意力不集中",
                "腰背疼痛", "血压偏高", "血糖不稳定", "情绪波动大",
                "皮肤问题", "记忆力下降", "关节疼痛", "呼吸困难",
                "心悸和胸闷", "月经不调", "更年期症状", "视力疲劳"
            ],
            "potential_causes": [
                "长期久坐办公", "工作压力过大", "饮食不规律", "缺乏运动",
                "熬夜和作息紊乱", "过度使用电子产品", "营养不均衡",
                "情绪压力", "环境污染", "遗传因素", "年龄增长",
                "激素变化", "不良生活习惯", "社交压力", "经济压力"
            ]
        }
    
    def generate_random_case(self):
        """随机生成一个患者案例"""
        case_info = {
            "age_range": random.choice(self.case_templates["age_ranges"]),
            "occupation": random.choice(self.case_templates["occupations"]),
            "symptoms": random.choice(self.case_templates["symptoms"]),
            "potential_causes": random.choice(self.case_templates["potential_causes"])
        }
        
        print(f"\n 随机生成患者案例：")
        print(f"年龄：{case_info['age_range']}")
        print(f"职业：{case_info['occupation']}")
        print(f"症状：{case_info['symptoms']}")
        print(f"潜在原因：{case_info['potential_causes']}")
        print("-" * 50)
        
        return case_info
    
    def create_patient_profile(self, case_info=None):
        """创建患者档案"""
        if case_info is None:
            case_info = self.generate_random_case()
        
        task_prompt = "生成一个真实的患者案例描述"
        
        response = self.patient_agent.run(
            task_prompt=task_prompt,
            meta_dict=case_info
        )
        
        print("\n AI患者的自述：")
        print(response)
        print("-" * 50)
        
        return response, case_info


# AI专业健康顾问Agent - 思维链分析
class AIHealthAdvisorAgent:
    def __init__(self, model):
        self.model = model
        
        # 定义AI健康顾问的提示模板
        self.advisor_prompt = TextPrompt(
            """你是一位经验丰富的AI专业健康顾问。面对患者的描述，请使用思维链方式进行专业分析。
            
            患者描述：{patient_description}
            
            请按照以下思维链步骤进行分析：
            
            思维链步骤1：病情分析
            - 仔细分析患者的症状和描述
            - 识别主要健康问题和次要问题
            - 评估症状的严重程度和紧急性
            - 推测可能的病因和风险因素
            
            思维链步骤2：诊断推理
            - 基于症状进行初步诊断推理
            - 考虑可能的疾病或健康状况
            - 分析生活方式对健康的影响
            - 确定需要重点关注的健康指标
            
            思维链步骤3：营养干预策略
            - 分析当前饮食习惯的问题
            - 制定个性化的营养改善方案
            - 推荐具体的食物和营养补充
            - 提供饮食时间和分量建议
            
            思维链步骤4：运动康复方案
            - 评估患者的运动能力和限制
            - 设计适合的运动类型和强度
            - 制定循序渐进的锻炼计划
            - 强调运动安全和注意事项
            
            思维链步骤5：生活方式调整
            - 分析作息和生活习惯问题
            - 提供睡眠质量改善建议
            - 制定压力管理策略
            - 建议环境和工作习惯的调整
            
            思维链步骤6：监测和随访计划
            - 设定健康监测指标
            - 制定定期检查计划
            - 建立健康改善的里程碑
            - 提供长期健康维护建议
            
            请以专业、细致、关怀的态度提供建议，确保每个步骤都有清晰的逻辑和实用的建议。
            """
        )
        
        # 创建AI健康顾问的任务Agent
        self.advisor_agent = TaskSpecifyAgent(
            model=self.model,
            task_type=TaskType.AI_SOCIETY,
            task_specify_prompt=self.advisor_prompt,
            output_language='ch'
        )
    
    def analyze_patient_case(self, patient_description):
        """使用思维链方式分析患者案例"""
        print("\n AI专业健康顾问开始思维链分析：")
        print("=" * 60)
        
        task_prompt = "请对患者案例进行专业的思维链分析"
        
        response = self.advisor_agent.run(
            task_prompt=task_prompt,
            meta_dict={"patient_description": patient_description}
        )
        
        print(response)
        print("=" * 60)
        
        return response
    
    def provide_quick_assessment(self, patient_description):
        """提供快速评估"""
        quick_prompt = TextPrompt(
            """作为专业健康顾问，请对患者情况进行快速评估：
            
            患者描述：{patient_description}
            
            请简要提供：
            1. 主要健康问题识别
            2. 风险等级评估（低/中/高）
            3. 紧急程度判断
            4. 建议的下一步行动
            """
        )
        
        quick_agent = TaskSpecifyAgent(
            model=self.model,
            task_type=TaskType.AI_SOCIETY,
            task_specify_prompt=quick_prompt,
            output_language='ch'
        )
        
        response = quick_agent.run(
            task_prompt="快速评估患者健康状况",
            meta_dict={"patient_description": patient_description}
        )
        
        print("\n 快速评估结果：")
        print(response)
        print("-" * 50)
        
        return response


# 健康咨询会话系统
class HealthConsultationSystem:
    def __init__(self, model):
        self.ai_patient = AIPatientAgent(model)
        self.ai_advisor = AIHealthAdvisorAgent(model)
        self.consultation_history = []
    
    def start_consultation(self, use_random_case=True, custom_case=None):
        """开始健康咨询会话"""
        print("\n AI健康咨询系统启动")
        print("=" * 60)
        
        # 生成或使用患者案例
        if use_random_case:
            patient_description, case_info = self.ai_patient.create_patient_profile()
        else:
            patient_description, case_info = self.ai_patient.create_patient_profile(custom_case)
        
        # 健康顾问快速评估
        quick_assessment = self.ai_advisor.provide_quick_assessment(patient_description)
        
        # 健康顾问详细分析
        detailed_analysis = self.ai_advisor.analyze_patient_case(patient_description)
        
        # 保存咨询记录
        consultation_record = {
            "case_info": case_info,
            "patient_description": patient_description,
            "quick_assessment": quick_assessment,
            "detailed_analysis": detailed_analysis
        }
        
        self.consultation_history.append(consultation_record)
        
        print("\n 健康咨询完成！")
        print("=" * 60)
        
        return consultation_record
    
    def batch_consultation(self, num_cases=3):
        """批量进行健康咨询"""
        print(f"\n 开始批量健康咨询 ({num_cases} 个案例)")
        print("=" * 60)
        
        for i in range(num_cases):
            print(f"\n【案例 {i+1}/{num_cases}】")
            self.start_consultation(use_random_case=True)
            
            # 案例间分隔
            if i < num_cases - 1:
                print("\n" + "" * 30)
    
    def get_consultation_summary(self):
        """获取咨询历史摘要"""
        if not self.consultation_history:
            print("暂无咨询记录")
            return
        
        print(f"\n 咨询历史摘要 (共{len(self.consultation_history)}个案例)")
        print("=" * 60)
        
        for i, record in enumerate(self.consultation_history):
            case_info = record["case_info"]
            print(f"\n案例 {i+1}:")
            print(f"  年龄：{case_info['age_range']}")
            print(f"  职业：{case_info['occupation']}")
            print(f"  症状：{case_info['symptoms']}")
            print(f"  原因：{case_info['potential_causes']}")
            print("-" * 30)


# 主程序运行
def main():
    # 创建健康咨询系统
    consultation_system = HealthConsultationSystem(model)
    
    print(" AI健康咨询系统")
    print("包含AI患者（随机生成案例）和AI专业健康顾问（思维链分析）")
    
    # AI患者随机咨询
    print("\n" + "="*80)
    print(" AI患者随机咨询")
    print("="*80)
    consultation_system.start_consultation(use_random_case=True)

if __name__ == "__main__":
    main()

代码运行输出为：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Prompt_task1.1.py
 AI健康咨询系统
包含AI患者（随机生成案例）和AI专业健康顾问（思维链分析）

================================================================================   
 AI患者随机咨询
================================================================================   

 AI健康咨询系统启动
============================================================

 随机生成患者案例：
年龄：46-55岁
职业：家庭主妇
症状：血糖不稳定
潜在原因：情绪压力
--------------------------------------------------

 AI患者的自述：
我今年49岁，是一名家庭主妇，我的生活大部分时间都是围绕着家庭转的。自从孩子们都长大 成人，家里的事情似乎也变得少了，但我还是每天忙忙碌碌，从早到晚地打理家务。最近这几 个月，我发现自己经常感到疲惫不堪，有时候还会头晕眼花，特别是饭后，这种感觉尤为明显 。

大约是从半年前开始，我发现自己的血糖水平变得非常不稳定。有时候吃完饭后测血糖，数值 会非常高，但到了下一次测量时又恢复正常了。这种情况让我非常担心，因为我家族里有糖尿 病史，我害怕自己也会患上这种病。

我对自己的健康状况感到非常焦虑，尤其是考虑到我最近承受了不少情绪上的压力。孩子们各 自成家立业后，家里显得空荡荡的，我总是担心他们在外过得好不好，有没有受苦。这些忧虑 常常让我夜不能寐，白天也没有精神做事情。

目前，我的生活习惯并不是特别规律。虽然我一直努力保持健康的饮食，尽量少吃甜食和油腻 的食物，但有时候心情不好时，我还是会忍不住吃一些高糖分的东西来安慰自己。运动方面， 我偶尔会在晚饭后出去散步，但这并不固定，有时因为家务或者天气原因就取消了。至于睡眠 ，最近几个月确实不太好，经常是辗转反侧难以入睡，即使睡着了也容易醒来，第二天总是感 觉很累。

我希望通过这次咨询能够找到改善血糖水平的方法，同时也希望能够缓解一下心理上的压力。 我期待医生能给我一些建议，帮助我调整生活方式，让我的身体和心灵都能得到更好的照顾。 
--------------------------------------------------

 快速评估结果：
根据您的描述，以下是对您情况的初步评估：

1. **主要健康问题识别**：
   - 经常感到疲劳、头晕眼花，特别是在饭后。
   - 血糖水平不稳定，有时餐后血糖升高。
   - 家庭和情感压力导致的情绪焦虑和失眠。
   - 生活习惯不规律，包括饮食、运动和睡眠。

2. **风险等级评估**：
   - **中**：您的症状和家族糖尿病史表明您可能有较高的风险发展为糖尿病。同时，情绪压力和不良的生活习惯也可能进一步影响您的健康。

3. **紧急程度判断**：
   - **中**：虽然您的症状目前没有达到需要立即就医的紧急程度，但建议尽快采取措施以防止病情恶化。

4. **建议的下一步行动**：
   - **就医检查**：建议您尽快预约内分泌科医生进行全面检查，包括血糖、血脂等指标，以便及早发现并处理潜在的健康问题。
   - **调整饮食**：继续保持健康的饮食习惯，减少高糖和高脂肪食物的摄入。可以考虑咨询营养师，制定适合您的饮食计划。
   - **增加运动**：尝试将规律的运动纳入日常生活中，如每天散步30分钟。运动不仅有助于控制血糖，还能减轻情绪压力。
   - **管理压力**：学习一些放松技巧，如深呼吸、冥想或瑜伽，帮助缓解情绪压力。如果必要，可以寻求心理咨询师的帮助。
   - **改善睡眠**：建立固定的作息时间，避免晚上过度使用电子设备。睡前可以进行一些轻松的活动，如阅读或听轻音乐，帮助入睡。

希望这些建议对您有所帮助，祝您早日恢复健康！
--------------------------------------------------

 AI专业健康顾问开始思维链分析：
============================================================
### 思维链步骤1：病情分析

**患者症状和描述：**
- 年龄：49岁
- 职业：家庭主妇
- 主要症状：疲劳、头晕眼花（尤其饭后）
- 血糖水平不稳定：餐后血糖升高，随后恢复正常
- 家族史：糖尿病
- 心理状态：焦虑、失眠、担忧子女

**主要健康问题：**
- 血糖水平不稳定
- 慢性疲劳和头晕
- 焦虑和失眠

**次要问题：**
- 不规律的生活习惯
- 饮食不均衡
- 缺乏固定的运动计划

**症状严重程度和紧急性：**
- 血糖水平不稳定需要立即关注，以防发展为糖尿病
- 慢性疲劳和头晕影响日常生活，需进一步检查
- 焦虑和失眠可能导致心理健康问题，需要及时干预

**可能的病因和风险因素：**
- 饮食中高糖分食物的摄入
- 缺乏规律的运动
- 睡眠质量差
- 心理压力大
- 家族遗传因素

### 思维链步骤2：诊断推理

**初步诊断推理：**
- 可能的疾病或健康状况：早期糖尿病、低血糖、贫血、慢性疲劳综合征
- 生活方式对健康的影响：不规律的饮食和运动习惯、缺乏足够的休息和放松时间

**需要重点关注的健康指标：**
- 空腹血糖和餐后2小时血糖
- 血红蛋白水平
- 甲状腺功能
- 维生素D和B12水平

### 思维链步骤3：营养干预策略

**当前饮食习惯的问题：**
- 偶尔摄入高糖分食物
- 饮食不规律，可能缺乏足够的纤维素和维生素

**个性化营养改善方案：**
1. **减少高糖食物的摄入：** 尽量避免含糖饮料、甜点等高糖食品，选择低GI（血糖生成指 数）的食物，如全谷物、豆类、蔬菜和水果。
2. **增加膳食纤维：** 多吃富含纤维的食物，如燕麦、糙米、绿叶蔬菜和坚果，有助于稳定 血糖。
3. **均衡饮食：** 确保每餐都有蛋白质、健康脂肪和复合碳水化合物，例如鸡胸肉、鱼、橄 榄油、全麦面包等。
4. **定时定量：** 每天三餐定时定量，避免长时间不吃或暴饮暴食。

**推荐的具体食物和营养补充：**
- 早餐：燕麦粥 + 鸡蛋 + 新鲜水果
- 午餐：全麦面包 + 烤鸡胸肉 + 绿叶蔬菜沙拉
- 晚餐：糙米饭 + 清蒸鱼 + 蒸蔬菜
- 零食：坚果、酸奶、新鲜水果

**饮食时间和分量建议：**
- 早餐：7:00-8:00
- 午餐：12:00-13:00
- 晚餐：18:00-19:00
- 每餐不要过量，避免饭后立即躺下

### 思维链步骤4：运动康复方案

**评估患者的运动能力和限制：**
- 目前偶尔散步，但不固定
- 需要考虑家务劳动的时间安排

**设计适合的运动类型和强度：**
1. **有氧运动：** 每周至少150分钟的中等强度有氧运动，如快走、慢跑、游泳。
2. **力量训练：** 每周2次，每次20-30分钟，可以使用哑铃或弹力带进行简单的力量训练。 
3. **柔韧性训练：** 每天10-15分钟的伸展运动，如瑜伽或普拉提。

**制定循序渐进的锻炼计划：**
- 第1-2周：每天快走20分钟，每周3次
- 第3-4周：增加到每天快走30分钟，每周4次
- 第5周及以后：加入2次力量训练和10-15分钟的伸展运动

**强调运动安全和注意事项：**
- 运动前后做好热身和拉伸
- 逐渐增加运动强度，避免过度劳累
- 注意补水，特别是在炎热的天气
- 如有任何不适，立即停止运动并咨询医生

### 思维链步骤5：生活方式调整

**分析作息和生活习惯问题：**
- 睡眠质量差，经常失眠
- 心理压力大，担忧子女
- 生活节奏不规律

**提供睡眠质量改善建议：**
1. **建立固定的睡眠时间：** 每天晚上同一时间上床睡觉，早上同一时间起床。
2. **创造良好的睡眠环境：** 保持卧室安静、舒适、黑暗，温度适宜。
3. **避免刺激性物质：** 晚上避免咖啡因和酒精，晚餐不要吃得过饱。
4. **放松身心：** 睡前进行深呼吸、冥想或热水浴，帮助放松。

**制定压力管理策略：**
1. **时间管理：** 合理安排家务和休闲时间，避免过度劳累。
2. **心理支持：** 与家人朋友多沟通，分享自己的感受，必要时寻求心理咨询。
3. **兴趣爱好：** 找到自己喜欢的事情，如阅读、园艺、绘画等，帮助转移注意力。       
4. **正念冥想：** 学习正念冥想技巧，帮助减轻焦虑和压力。

**建议环境和工作习惯的调整：**
- 保持家中整洁，减少杂乱带来的压力
- 定期进行户外活动，接触自然，有助于放松心情
- 学会放手，信任子女，减少不必要的担忧

### 思维链步骤6：监测和随访计划

**设定健康监测指标：**
- 空腹血糖和餐后2小时血糖
- 体重和体脂率
- 血压
- 睡眠质量

**制定定期检查计划：**
- 每月监测一次血糖水平
- 每三个月进行全面体检，包括血常规、肝肾功能、甲状腺功能等
- 每半年进行一次心理评估，了解心理健康状况

**建立健康改善的里程碑：**
- 1个月后：血糖水平趋于稳定，疲劳感减轻
- 3个月后：体重和体脂率有所下降，睡眠质量改善
- 6个月后：整体健康状况明显好转，心理压力减轻

**提供长期健康维护建议：**
- 持续关注饮食和运动，保持良好的生活习惯
- 定期复诊，及时调整治疗方案
- 保持积极的心态，享受生活中的每一刻

希望这些建议能帮助您改善血糖水平，缓解心理压力，提高生活质量。如果有任何疑问或需要 进一步的帮助，请随时联系您的医生。祝您健康！
============================================================

 健康咨询完成！
============================================================

第二个输出样例：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Prompt_task1.1.py
 AI健康咨询系统
包含AI患者（随机生成案例）和AI专业健康顾问（思维链分析）

================================================================================   
 AI患者随机咨询
================================================================================   

 AI健康咨询系统启动
============================================================

 随机生成患者案例：
年龄：65岁以上
职业：程序员
症状：长期疲劳和精神不振
潜在原因：情绪压力
--------------------------------------------------

 AI患者的自述：
我叫张明，今年70岁了，退休前是一名程序员。虽然我已经退休了，但还是喜欢在家里做一些 编程的小项目，偶尔也会帮一些年轻的朋友解决技术问题。我的生活比较规律，每天早上都会 去公园散步，晚上则会看看书或电视。

近几个月来，我感到非常疲劳，即使没有做太多的事情，也总是觉得累，精神也不如以前那样 饱满。这种状态已经持续了大约半年的时间了。我开始担心这不仅仅是年龄增长带来的自然变 化，而是可能有其他的健康问题。

我最担心的是这种长期的疲劳感会影响到我的日常生活，比如减少与家人的互动时间，或者影 响到我享受退休生活的质量。我希望通过适当的治疗或调整生活习惯，能够恢复到以前那种精 力充沛的状态，至少能让我有足够的体力和精神去完成我想做的事情。

目前，我的饮食还算健康，每天都会吃新鲜的蔬菜和水果，很少吃油腻的食物。我每周会去公 园散步三次，每次大约一个小时。但是，最近我发现自己的睡眠质量下降了，经常半夜醒来后 就很难再入睡，这可能是导致我感觉更加疲劳的一个重要原因。

我知道情绪压力也可能是一个因素，因为虽然退休了，但我还是会为一些家庭琐事感到焦虑。 我希望医生能给我一些建议，帮助我改善当前的症状，提高生活质量。
--------------------------------------------------

 快速评估结果：
根据您的描述，以下是对您情况的快速评估：

1. **主要健康问题识别**：
   - **长期疲劳**：持续约半年，即使在进行日常活动时也感到疲惫。
   - **睡眠质量下降**：经常半夜醒来，难以再次入睡。
   - **情绪压力**：因家庭琐事感到焦虑。

2. **风险等级评估**：
   - **中等风险**：长期疲劳和睡眠质量下降可能会对您的生活质量产生显著影响，并可能导致其他健康问题。

3. **紧急程度判断**：
   - **中等紧急**：虽然目前的情况不是立即危及生命的，但需要及时关注和处理，以防止症状进一步恶化。

4. **建议的下一步行动**：
   - **就医检查**：建议您尽快预约家庭医生进行全面的身体检查，包括血液检查、甲状腺功能检查等，以排除潜在的医学问题。
   - **改善睡眠**：尝试建立固定的睡眠时间表，避免晚上摄入咖啡因和大量饮水，可以尝试使用放松技巧，如深呼吸、冥想或轻柔音乐，帮助改善睡眠质量。
   - **管理情绪**：可以考虑进行心理咨询或参加支持小组，学习应对焦虑的方法。同时，与家人多沟通，分享您的感受，寻求他们的理解和支持。
   - **适度运动**：继续保持规律的散步习惯，但也可以尝试其他形式的轻度运动，如瑜伽或太极，有助于提高体能和心情。
   - **营养均衡**：继续保持健康的饮食习惯，确保摄入足够的维生素和矿物质，特别是铁、维生素D和B族维生素，这些对改善疲劳有积极作用。

希望这些建议对您有所帮助，祝您早日恢复健康！
--------------------------------------------------

 AI专业健康顾问开始思维链分析：
============================================================
### 思维链步骤1：病情分析

**患者基本信息**：
- 姓名：张明
- 年龄：70岁
- 职业：退休程序员
- 生活方式：规律，每天早晨散步，晚上看书或看电视
- 饮食习惯：健康，每天吃新鲜蔬菜和水果，很少吃油腻食物
- 运动频率：每周三次，每次一小时

**主要症状**：
- 长期疲劳感（已持续约半年）
- 精神不饱满
- 睡眠质量下降，经常半夜醒来难以再入睡

**次要症状**：
- 情绪压力，为家庭琐事感到焦虑

**症状严重程度和紧急性**：
- 疲劳感持续时间较长，严重影响日常生活和精神状态，需引起重视
- 睡眠质量下降可能进一步加剧疲劳感，需尽快改善
- 情绪压力虽为次要问题，但也会影响整体健康状况

**可能的病因和风险因素**：
- **慢性疲劳综合征**：长期疲劳感，无明显器质性病变
- **贫血**：老年人常见，可能导致疲劳
- **甲状腺功能减退**：代谢减慢，导致疲劳
- **睡眠障碍**：如失眠、睡眠呼吸暂停等
- **心理因素**：如抑郁、焦虑等

### 思维链步骤2：诊断推理

**初步诊断推理**：
- **慢性疲劳综合征**：长期疲劳感，无明显器质性病变
- **贫血**：需检查血常规，排除贫血可能性
- **甲状腺功能减退**：需检查甲状腺功能
- **睡眠障碍**：需详细询问睡眠情况，考虑是否需要睡眠监测
- **心理因素**：需评估情绪状态，排除抑郁症或焦虑症

**可能的疾病或健康状况**：
- 慢性疲劳综合征
- 贫血
- 甲状腺功能减退
- 睡眠障碍
- 抑郁症或焦虑症

**生活方式对健康的影响**：
- 规律的生活方式有助于维持身体机能
- 健康的饮食习惯对身体健康有益
- 适量的运动有助于提高体能和精神状态
- 情绪压力可能影响睡眠质量和整体健康

**需要重点关注的健康指标**：
- 血常规（红细胞、血红蛋白等）
- 甲状腺功能（TSH、T3、T4）
- 睡眠质量（入睡时间、睡眠时长、夜间醒来次数）
- 心理状态（抑郁、焦虑评分）

### 思维链步骤3：营养干预策略

**当前饮食习惯的问题**：
- 虽然饮食健康，但可能缺乏某些特定的营养素，如铁、维生素D等

**个性化营养改善方案**：
- **增加富含铁的食物**：红肉、猪肝、菠菜、豆类等，预防贫血
- **补充维生素D**：晒太阳、食用富含维生素D的食物（如鱼肝油、蛋黄）或考虑补充剂     
- **保证足够的蛋白质摄入**：鸡肉、鱼肉、豆腐等，有助于维持肌肉和能量水平

**推荐具体的食物和营养补充**：
- **早餐**：全麦面包、鸡蛋、牛奶、新鲜水果
- **午餐**：瘦肉、绿叶蔬菜、糙米
- **晚餐**：鱼肉、豆腐、蔬菜汤
- **零食**：坚果、酸奶

**饮食时间和分量建议**：
- **早餐**：7:00-8:00，不要空腹
- **午餐**：12:00-13:00，避免过饱
- **晚餐**：18:00-19:00，尽量清淡
- **加餐**：下午3:00左右，少量坚果或水果

### 思维链步骤4：运动康复方案

**评估患者的运动能力和限制**：
- 每周三次公园散步，每次一小时，基础体能良好
- 需要增加多样性和强度，以提高体能和精神状态

**设计适合的运动类型和强度**：
- **有氧运动**：快走、慢跑、游泳，每次30-45分钟，每周3-4次
- **力量训练**：哑铃、弹力带，每次20-30分钟，每周2-3次
- **柔韧性训练**：瑜伽、拉伸，每次15-20分钟，每周2-3次

**制定循序渐进的锻炼计划**：
- 第1-2周：继续公园散步，增加快走时间
- 第3-4周：加入轻量级力量训练，每周2次
- 第5-6周：尝试游泳或慢跑，每周1-2次
- 第7周以后：根据身体适应情况，逐步增加运动强度和频率

**强调运动安全和注意事项**：
- 运动前做好热身，避免受伤
- 选择合适的运动鞋和服装
- 运动后适当拉伸，缓解肌肉紧张
- 如有任何不适，立即停止运动并咨询医生

### 思维链步骤5：生活方式调整

**分析作息和生活习惯问题**：
- 睡眠质量下降，可能与作息不规律、心理压力有关
- 情绪压力可能影响睡眠和整体健康

**提供睡眠质量改善建议**：
- **建立规律的作息时间**：每天固定时间上床睡觉和起床
- **创造良好的睡眠环境**：保持卧室安静、舒适、黑暗
- **避免睡前刺激**：避免咖啡因、酒精和电子设备
- **放松身心**：睡前进行深呼吸、冥想或热水浴

**制定压力管理策略**：
- **定期进行放松活动**：如听音乐、阅读、园艺等
- **学习应对技巧**：如正念冥想、认知行为疗法
- **寻求支持**：与家人、朋友或专业人士交流，分享压力

**建议环境和工作习惯的调整**：
- **优化居住环境**：保持室内整洁、通风，减少噪音
- **合理安排家务**：分担家庭事务，避免过度劳累
- **培养兴趣爱好**：如绘画、书法、摄影等，丰富退休生活

### 思维链步骤6：监测和随访计划

**设定健康监测指标**：
- **疲劳感**：记录每天的疲劳程度
- **睡眠质量**：记录入睡时间、睡眠时长、夜间醒来次数
- **情绪状态**：定期自我评估抑郁、焦虑评分
- **体重和血压**：每周测量一次

**制定定期检查计划**：
- **初次检查**：血常规、甲状腺功能、心电图、血压
- **随访检查**：每三个月复查一次，根据情况调整检查项目

**建立健康改善的里程碑**：
- **第1个月**：改善睡眠质量，减少夜间醒来次数
- **第3个月**：增加运动量，提高体能和精神状态
- **第6个月**：减轻疲劳感，提高生活质量

**提供长期健康维护建议**：
- **持续关注身体状况**：如有任何异常，及时就医
- **保持积极心态**：乐观面对生活，享受退休时光
- **定期体检**：每年进行全面体检，及时发现潜在问题

希望以上建议能帮助您改善当前的症状，提高生活质量。如果您有任何疑问或需要进一步的帮 助，请随时联系您的医生。祝您早日恢复健康！
============================================================

 健康咨询完成！
============================================================

01.2. 代码生成任务：利用 CodePromptTemplateDict，创建一个任务Agent，帮助用户学习一门新的编程语言（例如 Python）。要求 AI 逐步生成学习计划，包括基本概念、代码示例和练习题目。

from camel.agents import TaskSpecifyAgent
from camel.models import ModelFactory
from camel.prompts import TextPrompt, CodePromptTemplateDict
from camel.types import ModelPlatformType, TaskType
import os
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 生成模型实例
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

# AI编程导师Agent
class AIProgrammingTutorAgent:
    def __init__(self, model):
        self.model = model
        
        # 定义AI编程导师的提示模板（CodePromptTemplateDict）
        self.tutor_prompt_templates = CodePromptTemplateDict(
            {
                "learning_plan": TextPrompt(
                    """你是一位专业的编程导师，旨在帮助用户学习新的编程语言。
                    请为学习 **{language}** 制定一个详细的学习计划。
                    学习计划应该包括以下阶段，每个阶段都提供详细的说明、核心概念和建议的学习资源：

                    1. **基础语法和数据类型**:
                       - 核心概念:
                       - 建议学习资源:

                    2. **控制流和函数**:
                       - 核心概念:
                       - 建议学习资源:

                    3. **数据结构和算法初步**:
                       - 核心概念:
                       - 建议学习资源:

                    4. **面向对象编程 (OOP) 基础**:
                       - 核心概念:
                       - 建议学习资源:

                    5. **模块、包和错误处理**:
                       - 核心概念:
                       - 建议学习资源:

                    6. **文件操作和常用库**:
                       - 核心概念:
                       - 建议学习资源:

                    请确保计划循序渐进，易于理解和实践。
                    """
                ),
                "code_example": TextPrompt(
                    """请为 **{language}** 中的 **{concept}** 提供一个清晰、简洁的代码示例。
                    代码示例应包含必要的注释，并演示该概念的实际应用。
                    """
                ),
                "exercise_problem": TextPrompt(
                    """请为学习 **{language}** 中 **{concept}** 的用户设计一个练习题目。
                    题目应包含明确的描述、输入输出要求和预期结果的示例。
                    并提供一个参考答案（可以是一个简单的函数实现）。
                    """
                )
            }
        )
        
        # 创建AI编程导师的任务Agent
        # 默认使用 "learning_plan" 模板，后续会根据方法动态切换
        self.tutor_agent = TaskSpecifyAgent(
            model=self.model,
            task_type=TaskType.AI_SOCIETY, 
            task_specify_prompt=self.tutor_prompt_templates["learning_plan"], 
            output_language='中文'
        )

    def generate_learning_plan(self, language="Python"):
        """Generates a detailed learning plan for the specified language."""
        print(f"\n为学习 {language} 生成学习计划：")
        print("=" * 60)
        
        # 动态更新 Agent 的提示，使用学习计划模板
        self.tutor_agent.task_specify_prompt = self.tutor_prompt_templates["learning_plan"]
        
        response = self.tutor_agent.run(
            task_prompt=f"生成一个关于学习 {language} 的详细计划",
            meta_dict={"language": language}
        )
        
        print(response)
        print("=" * 60)
        return response

    def generate_code_example(self, language, concept):
        """Generates a code example for a specific concept in the given language."""
        print(f"\n为 {language} 中的 {concept} 生成代码示例：")
        print("-" * 50)
        
        # 动态更新 Agent 的提示，使用练习题目模板
        self.tutor_agent.task_specify_prompt = self.tutor_prompt_templates["code_example"]
        
        response = self.tutor_agent.run(
            task_prompt=f"生成一个关于 {language} 中 {concept} 的代码示例",
            meta_dict={"language": language, "concept": concept}
        )
        
        print(response)
        print("-" * 50)
        return response

    def generate_exercise_problem(self, language, concept):
        """Generates an exercise problem with a reference answer for a specific concept."""
        print(f"\n为 {language} 中的 {concept} 设计练习题目：")
        print("-" * 50)
        
        # 动态更新 Agent 的提示，使用代码示例模板
        self.tutor_agent.task_specify_prompt = self.tutor_prompt_templates["exercise_problem"]
        
        response = self.tutor_agent.run(
            task_prompt=f"为 {language} 中 {concept} 设计一个练习题目",
            meta_dict={"language": language, "concept": concept}
        )
        
        print(response)
        print("-" * 50)
        return response

#主程序
def main():
    # AI编程导师系统
    tutor_system = AIProgrammingTutorAgent(model)
    
    print("AI 编程学习助手")
    print("帮助你逐步学习一门新的编程语言。")
    
    # 1.生成Python学习计划
    python_learning_plan = tutor_system.generate_learning_plan("Python")

    # 2.为特定概念生成代码
    code_example_variables = tutor_system.generate_code_example("Python", "变量和数据类型")

    # 3.为特定概念生成习题
    exercise_problem_functions = tutor_system.generate_exercise_problem("Python", "函数")

if __name__ == "__main__":
    main()

代码运行输出为：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Prompt_task1.2.py
AI 编程学习助手
帮助你逐步学习一门新的编程语言。

为学习 Python 生成学习计划：
============================================================      
### Python 学习计划

#### 1. **基础语法和数据类型**
- **核心概念**:
  - 变量和数据类型（整型、浮点型、字符串、布尔型）
  - 基本的输入输出（`input()` 和 `print()` 函数）
  - 运算符（算术运算符、比较运算符、逻辑运算符）
  - 注释（单行注释和多行注释）
- **建议学习资源**:
  - 官方文档：[Python 官方文档](https://docs.python.org/3/tutorial/index.html)
  - 在线教程：[W3Schools Python 教程](https://www.w3schools.com/python/)
  - 实践练习：[Codecademy Python 课程](https://www.codecademy.com/learn/learn-python)

#### 2. **控制流和函数**
- **核心概念**:
  - 条件语句（`if`, `elif`, `else`）
  - 循环（`for` 和 `while` 循环）
  - 函数定义和调用（`def` 关键字）
  - 参数和返回值
  - 匿名函数（`lambda` 表达式）
- **建议学习资源**:
  - 官方文档：[Python 控制流工具](https://docs.python.org/3/tutorial/controlflow.html)
  - 在线教程：[Real Python 控制流](https://realpython.com/python-control-flow/)
  - 实践练习：[LeetCode 基础题](https://leetcode.com/problemset/all/?difficulty=Easy)

#### 3. **数据结构和算法初步**
- **核心概念**:
  - 列表（`list`）和列表推导
  - 元组（`tuple`）
  - 字典（`dict`）
  - 集合（`set`）
  - 基本的排序和搜索算法
- **建议学习资源**:
  - 官方文档：[Python 数据结构](https://docs.python.org/3/tutorial/datastructures.html)
  - 在线教程：[GeeksforGeeks 数据结构](https://www.geeksforgeeks.org/python-data-structures/)
  - 实践练习：[HackerRank 数据结构挑战](https://www.hackerrank.com/domains/tutorials/10-days-of-python)

#### 4. **面向对象编程 (OOP) 基础**
- **核心概念**:
  - 类和对象
  - 属性和方法
  - 构造函数（`__init__` 方法）
  - 继承和多态
  - 封装和私有属性
- **建议学习资源**:
  - 官方文档：[Python 类](https://docs.python.org/3/tutorial/classes.html)
  - 在线教程：[Real Python 面向对象编程](https://realpython.com/python3-object-oriented-programming/)
  - 实践练习：[Codewars OOP 挑战](https://www.codewars.com/kata/search/python?q=object%20oriented%20programming)

#### 5. **模块、包和错误处理**
- **核心概念**:
  - 模块导入（`import` 语句）
  - 创建和使用包
  - 异常处理（`try`, `except`, `finally`）
  - 自定义异常
- **建议学习资源**:
  - 官方文档：[Python 模块和包](https://docs.python.org/3/tutorial/modules.html)
  - 在线教程：[Real Python 模块和包](https://realpython.com/python-modules-packages/)
  - 实践练习：[Exercism Python 模块练习](https://exercism.io/tracks/python/exercises)

#### 6. **文件操作和常用库**
- **核心概念**:
  - 文件读写（`open()`, `read()`, `write()`, `close()`）
  - CSV 和 JSON 文件处理
  - 常用库介绍（`os`, `sys`, `datetime`, `math`, `random`）       
  - 第三方库安装和使用（`pip` 工具）
- **建议学习资源**:
  - 官方文档：[Python 文件操作](https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files)
  - 在线教程：[Real Python 文件操作](https://realpython.com/read-write-files-python/)
  - 实践练习：[DataCamp Python 数据处理课程](https://www.datacamp.com/courses/importing-data-in-python-part-1)

### 总结
通过以上六个阶段的学习，你将能够掌握 Python 的基本语法、数据结构、面向对象编程、模块和包的使用、文件操作以及常用库的使用。每个阶段都提供了详细的核心概念和建议的学习资源，希望你能够循序渐进地学习并实践，最终成为一名熟练的 Python 程序员。祝你学习顺利！
============================================================      

为 Python 中的 变量和数据类型 生成代码示例：
--------------------------------------------------

# Python中的变量和数据类型示例

# 整型（int）
age = 25  # 定义一个整数变量，表示年龄
print("年龄:", age)

# 浮点型（float）
height = 1.75  # 定义一个浮点数变量，表示身高
print("身高:", height)

# 字符串（str）
name = "张三"  # 定义一个字符串变量，表示名字
print("姓名:", name)

# 布尔型（bool）
is_student = True  # 定义一个布尔型变量，表示是否是学生
print("是否是学生:", is_student)

# 列表（list）
hobbies = ["阅读", "编程", "旅行"]  # 定义一个列表，表示兴趣爱好  
print("兴趣爱好:", hobbies)

# 元组（tuple）
coordinates = (10, 20)  # 定义一个元组，表示坐标
print("坐标:", coordinates)

# 字典（dict）
person = {"name": "李四", "age": 30, "city": "北京"}  # 定义一个字典，表示个人信息
print("个人信息:", person)

# 集合（set）
fruits = {"苹果", "香蕉", "橙子"}  # 定义一个集合，表示水果种类   
print("水果种类:", fruits)


这个示例展示了 Python 中几种基本的数据类型及其用法。每个变量都包含了相应的注释，说明其用途。通过打印输出，可以直观地看到每种数据类型的值。
--------------------------------------------------

为 Python 中的 函数 设计练习题目：
--------------------------------------------------
### 练习题目：计算数字列表的平均值

#### 描述
编写一个 Python 函数 `calculate_average`，该函数接收一个整数或浮点数的列表作为参数，并返回这些数字的平均值。如果列表为空，函数应该返回 0。

#### 输入输出要求
- **输入**：一个包含整数或浮点数的列表。
- **输出**：列表中所有数字的平均值，如果列表为空，则返回 0。      

#### 示例
- 输入: `[1, 2, 3, 4]`
- 输出: `2.5`

- 输入: `[]`
- 输出: `0`

#### 参考答案

def calculate_average(numbers):
    if not numbers:  # 检查列表是否为空
        return 0
    total = sum(numbers)  # 计算总和
    count = len(numbers)  # 计算列表中的元素数量
    average = total / count  # 计算平均值
    return average

# 测试代码
print(calculate_average([1, 2, 3, 4]))  # 应输出 2.5
print(calculate_average([]))  # 应输出 0


这个练习题旨在帮助初学者理解如何处理列表以及如何使用基本的数学运算来计算平均值。同时，通过检查列表是否为空，还可以学习到如何在函数中添加条件判断以增强程序的健壮性。
--------------------------------------------------

Task2

02.利用GoogleMapsToolkit、DappierToolkit，使用RolePlaying。创建一个AI运动场馆推荐规划分析师Agent。创建一个AI用户Agent，限定其所在位置为“中国北京北京市”区域任意随机一点。让AI扮演一个“个性化运动场地顾问”，根据AI“用户”提出的随机个性需求，通过ChatHistoryBlock内对用户的需求进行匹配度计算以及选择。为AI“用户”提出运动场馆选择建议。

from camel.agents import TaskSpecifyAgent
from camel.models import ModelFactory
from camel.prompts import TextPrompt
from camel.types import ModelPlatformType, TaskType
from camel.societies import RolePlaying
from camel.toolkits import SearchToolkit, MathToolkit
from camel.memories import ChatHistoryBlock
from camel.memories.records import MemoryRecord
from camel.messages import BaseMessage
from camel.types import OpenAIBackendRole
from colorama import Fore
import os
import random
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 创建模型实例
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

# AI用户Agent - 随机生成运动需求
class AIUserAgent:
    def __init__(self, model):
        self.model = model
        
        # 定义AI用户的提示模板
        self.user_prompt = TextPrompt(
            """你是一位居住在中国北京市的AI用户，希望找到合适的运动场馆。请根据以下信息生成一个真实的个性化运动需求描述：

            年龄范围：{age_range}
            身份职业：{occupation}
            运动偏好：{sport_preference}
            特殊需求：{special_needs}
            当前位置：{location}

            请以第一人称的方式描述你的需求，包括：
            1. 基本信息（年龄、职业、生活方式）
            2. 具体想进行的运动和期望
            3. 对场馆设施、环境、交通等方面的特殊要求
            4. 预算或时间限制（如果适用）

            请保持真实、详细，就像真正的用户在描述自己的运动需求一样。
            """
        )
        
        # 创建AI用户的任务Agent
        self.user_agent = TaskSpecifyAgent(
            model=self.model,
            task_type=TaskType.AI_SOCIETY,
            task_specify_prompt=self.user_prompt,
            output_language='ch'
        )
        
        # 随机案例生成的模板库
        self.case_templates = {
            "age_ranges": [
                "18-25岁", "26-35岁", "36-45岁", "46-55岁"
            ],
            "occupations": [
                "学生", "白领", "自由职业者", "程序员", "设计师", "销售"
            ],
            "sport_preferences": [
                "篮球", "羽毛球", "游泳", "健身", "跑步", "足球", "网球", "瑜伽"
            ],
            "special_needs": [
                "希望有室内场地", "交通便利", "环境安静", "价格适中", 
                "有教练指导", "设备齐全", "附近有停车场", "适合家庭活动"
            ]
        }
        
        # 随机北京位置点（简化版）
        self.beijing_locations = [
            "北京市朝阳区三里屯街道", "北京市海淀区中关村街道",
            "北京市东城区东华门街道", "北京市西城区金融街街道",
            "北京市丰台区丰台街道", "北京市石景山区八宝山街道",
            "北京市通州区梨园街道", "北京市昌平区回龙观街道"
        ]
        
    def generate_random_case(self):
        """随机生成一个用户运动需求案例"""
        location = random.choice(self.beijing_locations)
        
        case_info = {
            "age_range": random.choice(self.case_templates["age_ranges"]),
            "occupation": random.choice(self.case_templates["occupations"]),
            "sport_preference": random.choice(self.case_templates["sport_preferences"]),
            "special_needs": random.choice(self.case_templates["special_needs"]),
            "location": location
        }
        
        print(f"\n🏃 随机生成用户运动需求案例：")
        print(f"年龄：{case_info['age_range']}")
        print(f"职业：{case_info['occupation']}")
        print(f"运动偏好：{case_info['sport_preference']}")
        print(f"特殊需求：{case_info['special_needs']}")
        print(f"所在位置：{case_info['location']}")
        print("-" * 50)
        
        return case_info
    
    def create_user_profile(self, case_info=None):
        """创建用户运动需求档案"""
        if case_info is None:
            case_info = self.generate_random_case()
        
        task_prompt = "生成一个真实的个性化运动需求描述"
        
        response = self.user_agent.run(
            task_prompt=task_prompt,
            meta_dict=case_info
        )
        
        print("\n AI用户的自述：")
        print(response)
        print("-" * 50)
        
        return response, case_info


# 运动场馆推荐系统 - 使用RolePlaying框架
class SportsVenueRecommendationSystem:
    def __init__(self, model):
        self.model = model
        self.ai_user = AIUserAgent(model)
        
        # 初始化ChatHistoryBlock记忆系统
        self.chat_history = ChatHistoryBlock(keep_rate=0.9)  # 设置权重衰减率
        
        # 定义工具包（模拟GoogleMapsToolkit和DappierToolkit功能）
        self.tools_list = [
            *SearchToolkit().get_tools(),
            *MathToolkit().get_tools()
        ]
        
        print(" ChatHistoryBlock记忆系统已初始化")
        print(" 工具包已加载（搜索工具、数学工具）")
        
    def start_recommendation_with_roleplay(self, use_random_case=True, custom_case=None):
        """使用RolePlaying框架开始运动场馆推荐"""
        print("\n AI运动场馆推荐系统启动（RolePlaying模式）")
        print("=" * 80)
        
        # 生成用户需求
        if use_random_case:
            user_description, case_info = self.ai_user.create_user_profile()
        else:
            user_description, case_info = self.ai_user.create_user_profile(custom_case)
        
        # 获取历史对话记录用于上下文
        retrieved_history = self.chat_history.retrieve(window_size=5)
        history_context = "\n".join([
            f"历史记录{i+1}: {record.memory_record.message.role_name}: {record.memory_record.message.content[:100]}..." 
            for i, record in enumerate(retrieved_history[-3:])  # 只取最近3条记录
        ]) if retrieved_history else "暂无历史记录"
        
        # 构建任务提示，包含用户需求和历史上下文
        task_prompt = f"""
        作为个性化运动场地顾问，请为用户提供专业的运动场馆推荐。
        
        用户需求: {user_description}
        用户位置: {case_info['location']}
        历史对话上下文: {history_context}
        
        请通过思维链方式分析用户需求，并利用地图搜索功能找到最适合的运动场馆。
        """
        
        # 设置RolePlaying会话
        role_play_session = RolePlaying(
            assistant_role_name="个性化运动场地顾问",
            assistant_agent_kwargs=dict(
                model=self.model,
                tools=self.tools_list  # 为助手提供工具
            ),
            user_role_name="运动场馆推荐需求分析师", 
            user_agent_kwargs=dict(model=self.model),
            task_prompt=task_prompt,
            with_task_specify=True,
            task_specify_agent_kwargs=dict(model=self.model),  # 关键修复：为TaskSpecifyAgent提供自定义模型
            output_language='中文'
        )
        
        print(Fore.GREEN + f" 助手角色: {role_play_session.assistant_sys_msg}")
        print(Fore.BLUE + f" 用户角色: {role_play_session.user_sys_msg}")
        print(Fore.YELLOW + f" 任务: {task_prompt[:200]}...")
        print("=" * 80)
        
        # 开始对话
        input_msg = role_play_session.init_chat()
        max_turns = 8
        turn_count = 0
        
        recommendation_result = ""
        
        # 检查初始消息是否有效
        if input_msg is None:
            print(Fore.RED + "无法初始化对话")
            return {
                "case_info": case_info,
                "user_description": user_description, 
                "recommendation": "系统初始化失败"
            }
        
        while turn_count < max_turns:
            try:
                assistant_response, user_response = role_play_session.step(input_msg)
                
                print(Fore.WHITE + f"\n[轮次 {turn_count + 1}]")
                
                # 安全访问消息内容
                assistant_content = assistant_response.msg.content if assistant_response.msg else "无响应"
                user_content = user_response.msg.content if user_response.msg else "无响应"
                
                print(Fore.GREEN + f" 运动场地顾问: {assistant_content}")
                print(Fore.BLUE + f" 需求分析师: {user_content}")
                
                # 显示工具调用信息
                if assistant_response.info.get('tool_calls'):
                    print(Fore.MAGENTA + f" 工具调用: {assistant_response.info['tool_calls']}")
                
                # 检查任务完成
                if assistant_response.terminated or user_response.terminated:
                    print(Fore.RED + " 对话完成")
                    recommendation_result = assistant_content
                    break
                
                if user_response.msg and "CAMEL_TASK_DONE" in user_response.msg.content:
                    print(Fore.GREEN + " 任务成功完成!")
                    recommendation_result = assistant_content
                    break
                
                # 确保下一轮的输入消息有效
                if assistant_response.msg is None:
                    print(Fore.RED + " 助手响应为空，结束对话")
                    break
                    
                input_msg = assistant_response.msg
                turn_count += 1
                print(Fore.YELLOW + "-" * 60)
                
            except Exception as e:
                print(Fore.RED + f" 执行错误: {e}")
                break
        
        # 保存到ChatHistoryBlock记忆系统
        user_record = MemoryRecord(
            message=BaseMessage.make_user_message(role_name="User", content=user_description),
            role_at_backend=OpenAIBackendRole.USER
        )
        
        final_recommendation = recommendation_result or "系统未能完成推荐"
        assistant_record = MemoryRecord(
            message=BaseMessage.make_assistant_message(role_name="SportsConsultant", content=final_recommendation),
            role_at_backend=OpenAIBackendRole.ASSISTANT
        )
        
        self.chat_history.write_records([user_record, assistant_record])
        
        print("\n 对话已保存到记忆系统")
        print(" 运动场馆推荐完成！")
        print("=" * 80)
        
        return {
            "case_info": case_info,
            "user_description": user_description, 
            "recommendation": final_recommendation
        }
    
    def get_memory_analysis(self):
        """基于ChatHistoryBlock进行记忆分析"""
        retrieved_history = self.chat_history.retrieve(window_size=10)
        if not retrieved_history:
            print(" 暂无历史记录")
            return
        
        print("\n ChatHistoryBlock记忆分析:")
        print("=" * 60)
        
        user_requests = []
        recommendations = []
        
        for record in retrieved_history:
            if record.memory_record.message.role_name in ["User"]:
                user_requests.append(record.memory_record.message.content)
            elif record.memory_record.message.role_name in ["SportsConsultant"]:
                recommendations.append(record.memory_record.message.content)
        
        print(f" 总共处理了 {len(user_requests)} 个用户请求")
        print(f" 总共提供了 {len(recommendations)} 个推荐方案")
        
        # 分析用户偏好模式
        sport_preferences = {}
        for request in user_requests:
            for sport in ["篮球", "羽毛球", "游泳", "健身", "跑步", "足球", "网球", "瑜伽"]:
                if sport in request:
                    sport_preferences[sport] = sport_preferences.get(sport, 0) + 1
        
        if sport_preferences:
            print(f" 用户运动偏好统计: {sport_preferences}")
        
        # 展示最近的记录（带权重）
        print("\n 最近的记录（权重衰减机制）:")
        for i, record in enumerate(retrieved_history[-5:]):  # 只显示最近5条
            print(f"记录{i+1}: {record.memory_record.message.role_name}")
            print(f"内容: {record.memory_record.message.content[:150]}...")
            print(f"权重: {record.score:.3f}")
            print("-" * 30)
        print("=" * 60)
    
    def clear_memory(self):
        """清空记忆系统"""
        self.chat_history.clear()
        print(" 记忆系统已清空")


# 主程序运行
def main():
    print(" AI运动场馆推荐规划分析师系统")
    print(" 集成RolePlaying + 工具包 + ChatHistoryBlock记忆")
    print(" 服务区域：中国北京市")
    print("=" * 80)
    
    # 创建推荐系统
    recommendation_system = SportsVenueRecommendationSystem(model)
    
    # 第一次推荐（无历史记录）
    print("\n 第一次推荐 - 新用户咨询")
    print("=" * 60)
    result1 = recommendation_system.start_recommendation_with_roleplay(use_random_case=True)
    
    # 进行记忆分析
    recommendation_system.get_memory_analysis()
    
    # 第二次推荐（有历史记录，体现记忆功能）
    print("\n 第二次推荐 - 基于历史记录的智能推荐")
    print("=" * 60)
    result2 = recommendation_system.start_recommendation_with_roleplay(use_random_case=True)
    
    # 最终记忆分析
    recommendation_system.get_memory_analysis()
    
    print("\n 系统演示完成！")
    print(" ChatHistoryBlock成功实现了用户需求的匹配度计算和历史记录管理")


if __name__ == "__main__":
    main()

运行输出样例：

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/CAMEL_Prompt_task2.py
 AI运动场馆推荐规划分析师系统
 集成RolePlaying + 工具包 + ChatHistoryBlock记忆
 服务区域：中国北京市
================================================================================
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_linkup'. The parameter definition is {'enum': ['searchResults', 'sourcedAnswer', 'structured'], 'type': ['string', 'null']}. This may affect the quality of tool calling.      
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'enum': ['OneDay', 'OneWeek', 'OneMonth', 'OneYear', 'NoLimit'], 'type': ['string', 'null']}. This may affect the quality of tool calling.
  warnings.warn(
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\toolkits\function_tool.py:533: UserWarning: Parameter description is missing for the function 'search_alibaba_tongxiao'. The parameter definition is {'anyOf': [{'enum': ['finance', 'law', 'medical', 'internet', 'tax', 'news_province', 'news_center'], 'type': 'string'}, {'type': 'null'}], 'type': ['null']}. This may affect the quality of tool calling.
  warnings.warn(
 ChatHistoryBlock记忆系统已初始化
 工具包已加载（搜索工具、数学工具）

 第一次推荐 - 新用户咨询
============================================================      

 AI运动场馆推荐系统启动（RolePlaying模式）
================================================================================

🏃 随机生成用户运动需求案例：
年龄：46-55岁
职业：白领
运动偏好：跑步
特殊需求：交通便利
所在位置：北京市丰台区丰台街道
--------------------------------------------------

 AI用户的自述：
大家好，我是一名48岁的白领，目前居住在北京市丰台区丰台街道。由于工作压力大，长时间坐在办公室里，我意识到保持身体健康的重要性。因此，我希望能够在业余时间多参与一些体育活动，尤其是我喜欢的跑步。      

理想情况下，我希望能够找到一个设施齐全、环境舒适的运动场馆，最好是能够提供专业的跑道，让我可以在安全的环境中尽情奔跑。同时，考虑到我每天上下班的时间已经比较紧张，所以特别希望能找到一个交通便利的地方，最好是靠近地铁站或者公交站，这样可以节省往返的时间。

关于预算方面，我愿意每月投入一定费用来保证自己的健康，但希望价格合理，不会给生活带来太大负担。至于时间，我一般会选择在下班后或是周末的空闲时间去锻炼，所以场馆的开放时间如果能覆盖这些时间段就再好不过了。

总之，我希望能够在北京丰台区附近找到一个适合我的运动场所，不仅能满足我对跑步的热情，还能兼顾到生活的其他方面。如果有符合这些条件的地方，欢迎推荐给我，谢谢！
--------------------------------------------------
D:\Download\Python\py-3.11.9\Lib\site-packages\camel\memories\blocks\chat_history_block.py:73: UserWarning: The `ChatHistoryMemory` is empty.
  warnings.warn("The `ChatHistoryMemory` is empty.")
 助手角色: BaseMessage(role_name='个性化运动场地顾问', role_type=<RoleType.ASSISTANT: 'assistant'>, meta_dict={'task': '作为个性化运动场地顾问，根据您的需求，我将为您推荐位于北京市丰台区丰台街道附近的运动场馆，确保设施齐全、环境舒适、交通便利且价格合理，重点满足您对专业跑道的需求。', 'assistant_role': '个性化运动场地顾问', 'user_role': '运动场馆推荐需求分析师'}, content='===== RULES OF ASSISTANT =====\nNever forget you are a 个性化运动场地顾问 and I am a 运 动场馆推荐需求分析师. Never flip roles! Never instruct me!\nWe share a common interest in collaborating to successfully complete a task.\nYou must help me to complete the task.\nHere is the task: 作为个性化运动场地顾问，根据您的需求，我将为您推荐位于北京市丰台区丰台街道附近的运动场馆，确保设施齐全、环境舒适、交通便利且价格合理，重点满足您对专业跑道的需求。. Never forget our task!\nI must instruct you based on your expertise and my needs to complete the task.\n\nI must give you one instruction at a time.\nYou must write a specific solution that appropriately solves the requested instruction and explain your solutions.\nYou must decline my instruction honestly if you cannot perform the instruction due to physical, moral, legal reasons or your capability and explain the reasons.\nUnless I say the task is completed, you should always start with:\n\nSolution: <YOUR_SOLUTION>\n\n<YOUR_SOLUTION> should be very specific, include detailed explanations and provide preferable detailed implementations and examples and lists for task-solving.\nAlways end <YOUR_SOLUTION> with: Next request.\nRegardless of the input language, you must output text in 中文.', video_bytes=None, image_list=None, image_detail='auto', video_detail='auto', parsed=None)    
 用户角色: BaseMessage(role_name='运动场馆推荐需求分析师', role_type=<RoleType.USER: 'user'>, meta_dict={'task': '作为个性化运动场地顾问，根据您的需求，我将为您推荐位于北京市丰台区丰台街道附近的运动场馆，确保设施齐全、环境舒适、交通便利且价格合理，重点满足您对专业跑道的需求。', 'assistant_role': '个性化运动场地顾问', 'user_role': '运动场馆推荐需求分析师'}, content='===== RULES OF USER =====\nNever forget you are a 运动场馆推荐需求分析师 and I am a 个性化运动场地顾问. Never flip roles! You will always instruct me.\nWe share a common interest in collaborating to successfully complete a task.\nI must help you to complete the task.\nHere is the task: 作为 个性化运动场地顾问，根据您的需求，我将为您推荐位于北京市丰台区丰台街道附近的运动场馆，确保设施齐全、环境舒适、交通便利且价格合理，重点满足您对专业跑道的需求。. Never forget our task!\nYou must instruct me based on my expertise and your needs to solve the task ONLY in the following two ways:\n\n1. Instruct with a necessary input:\nInstruction: <YOUR_INSTRUCTION>\nInput: <YOUR_INPUT>\n\n2. Instruct without any input:\nInstruction: <YOUR_INSTRUCTION>\nInput: None\n\nThe "Instruction" describes a task or question. The paired "Input" provides further context or information for the requested "Instruction".\n\nYou must give me one instruction at a time.\nI must write a response that appropriately solves the requested instruction.\nI must decline your instruction honestly if I cannot perform the instruction due to physical, moral, legal reasons or my capability and explain the reasons.\nYou should instruct me not ask me questions.\nNow you must start to instruct me using the two ways described above.\nDo not add anything else other than your instruction and the optional corresponding input!\nKeep giving me instructions and necessary inputs until you think the task is completed.\nWhen the task is completed, you must only reply with a single word <CAMEL_TASK_DONE>.\nNever say <CAMEL_TASK_DONE> unless my responses have solved your task.\nRegardless of the input language, you must output text in 中文.', video_bytes=None, image_list=None, image_detail='auto', video_detail='auto', parsed=None)
 任务:
        作为个性化运动场地顾问，请为用户提供专业的运动场馆推荐。  

        用户需求: 大家好，我是一名48岁的白领，目前居住在北京市丰台区丰台街道。由于工作压力大，长时间坐在办公室里，我意识到保持身体健康的重要性。因此，我希望能够在业余时间多参与一些体育活动，尤其是我喜欢的跑步。

理想情况下，我希望能够找到一个设施齐全、环境舒适的运动场馆，最好是能够提供专业的...
================================================================================

[轮次 1]
 运动场地顾问: 根据搜索结果，这里列出了一些可能符合要求的运动场馆 信息，但请注意这些信息可能并不完全准确，建议您进一步核实：        

1. **丰宜福台公园**
   - **地址**：北京市丰台区丰宜路与南三环西路交叉口东南侧
   - **描述**：公园内设有夜跑活动，适合喜欢在自然环境中跑步的朋友 。

2. **飞跃体育场**
   - **地址**：北京市丰台区体育中心北路
   - **描述**：这是一个综合性的体育场馆，提供多种运动设施，包括跑 道。

3. **绿地+运动场项目**
   - **地址**：具体位置不详，但该项目旨在解决居民健身场所不足的问 题，可能在丰台区内有多个地点。
   - **描述**：项目结合绿地资源建设运动场地，方便市民在家门口进行 锻炼。

4. **老仓库变体育小镇**
   - **地址**：北京市丰台区（具体地址未提及）
   - **描述**：原为老仓库的区域改造成了一个包含多个运动场馆的体育 小镇，可能包括专业的跑道设施。

以上信息来源于网络搜索，建议您联系相关场馆获取更详细的信息，如开放时间、费用等。如果您需要更具体的信息或帮助，请告诉我。Next request.
 需求分析师: Instruction: 根据您的需求，我需要收集丰台区丰台街道附近的专业跑道信息。
Input: 请提供该区域内的运动场馆名称和地址。
 工具调用: [ToolCallingRecord(tool_name='search_google', args={'query': '北京市丰台区丰台街道 专业跑道 运动场馆', 'num_result_pages': 3}, result=[{'error': 'google search failed.'}], tool_call_id='call_b2f4941ebda04b1a800a59'), ToolCallingRecord(tool_name='search_baidu', args={'query': '北京市丰台区丰台街道 专业跑道 运动场馆', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': ' 老仓库变体育小镇,丰台这个地儿可一站打卡10余座运动场馆_腾讯新闻', 'description': '', 'url': 'http://www.baidu.com/link?url=lR1H_oO771EcRgxvQMQBRjdBb9LzqHTmoOC5dcnbqmvn19_lZRBG9xL0ioBuqWOg3BnbnM4WO32GyehBx_xcPa'}, {'result_id': 2, 'title': '“绿地+运动场”破题“健身去 哪儿”——北京市民家门口健身有了好去处_国...', 'description': '', 'url': 'http://www.baidu.com/link?url=NLJqd0BOAtF9gMjzyfgbr-hiZ6feeywm34U3FyDNHsRpHnGUQ5PobCctbgGNkv4RqhvJaEtXAEf7d_ze9tdftD6x_q2r6HdaVerp4aTtg614ulbWtiPwwgGFc_M--hHd'}, {'result_id': 3, 'title': '丰台时报数字报-韵动北京·丰宜福台公园夜跑举行', 'description': '', 'url': 'http://www.baidu.com/link?url=lR1H_oO771EcRgxvQMQBRoe81gNNZb82J0kVk6tR-E4CCTOLmZpz62JQzstVzzNhNyzfZL62FWLFDvismo3d3M-p72JwBqUo2jsz1zg1D1iBrwY8RYcJU3Zgfnwp3R1p'}, {'result_id': 4, 'title': '飞跃 体育场-北京市丰台区人民政府网站', 'description': '', 'url': 'http://www.baidu.com/link?url=XWmLeK3K5QHwvN1ImZ3msJf5W_SkOMt7hvKGbk7eLCfBhh19pVzZIOev8qBIuTQK0eAiggXKg9IJWLTkQ6jUphfBcrJmfd0rVgIkTwm9QIdGURKcAL2QG1uWtykICsv2'}, {'result_id': 5, 'title': '...肖家河·绿动天地开园_各区热点_首都之窗_北京市人民政府门户...', 'description': '', 'url': 'http://www.baidu.com/link?url=z9NWXw3u8jxcRTwTYQRYesLMG47rAcy2KOZ1e0o0ihZCszyUT5C3GkMrJDJTwekfjw7-fdQwjySHZb6onOcKjl2hp_UpqBJxNj9NPjJnMXa'}]}, tool_call_id='call_887ea9b5e4954f51893e3c')]
------------------------------------------------------------      

[轮次 2]
 运动场地顾问: 根据百度搜索的结果，关于“飞跃体育场”的具体信息并不 十分丰富，但我找到了一些相关的资料，可以为您提供参考：

1. **丰台体育中心游泳馆**（虽然不是飞跃体育场，但同属于丰台区体育 中心的一部分）
   - **地址**：北京市丰台区体育中心北路
   - **开放时间**：通常情况下，工作日为上午6:00至晚上21:00；周末及节假日为上午7:00至晚上21:00。具体开放时间可能会因季节调整而有所变 化。
   - **费用**：成人票价大约在30-50元之间，儿童及学生享受半价优惠。具体的收费情况建议您直接咨询场馆。
   - **设施情况**：除了标准泳池外，还设有更衣室、淋浴间等配套设施 。此外，体育中心内还有篮球场、足球场、网球场等多种运动设施，其中可能包括您提到的专业跑道。

对于飞跃体育场本身，由于直接信息较少，建议您直接联系丰台区体育中心获取最准确的信息。您可以尝试拨打体育中心的服务电话或访问其官方网站查询更多详情。

如果需要进一步的帮助，请随时告知。Next request.
 需求分析师: Instruction: 从上述场馆中选择一个最符合您需求的，并了解其详细信息。
Input: 请提供飞跃体育场的具体信息，包括开放时间、费用、设施情况等 。
 工具调用: [ToolCallingRecord(tool_name='search_baidu', args={'query': '飞跃体育场 丰台区 详细信息 开放时间 费用 设施', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': '北京体育馆_360百科', 'description': '', 'url': 'http://www.baidu.com/link?url=ysPAUJ_jv3NxnFd_riaTyQ4aQwLvGhwXGVKnZkPFfqkhv0Q65MwxuVMyv_yM8iIADjHmV_Cdo8xDmMFZ9vAEeq'}, {'result_id': 2, 'title': '...北京丰台体育中心游泳馆门票/地址/图片/开放时间/照片/门票价格...', 'description': '', 'url': 'http://www.baidu.com/link?url=_tCXrrC9Cgp6N4WlvHlSQxypNKSM-xqfoNUmSo5zn4blZeVWlyBqB_Mxb6UREacaHuSrRQp5ofjmNTuQcyXjUa'}, {'result_id': 3, 'title': '北京丰台体育中心游泳馆游玩攻略-丰台体育中心游泳馆门票多少钱/...', 'description': '', 'url': 'http://www.baidu.com/link?url=-1syuRo4YNaHL0J9Yu6s4u8BsJ_cjIvnrkuAnYN4sgqmaIeNViZCmkOU7u-8n0Sd2Lc2rmjM4u9bZ8w_jzbZsjwwc9wJ7dptmfXo0N66LNe'}, {'result_id': 4, 'title': '丰台体育中心-北京市丰台区人民政府网站', 'description': '', 'url': 'http://www.baidu.com/link?url=u6nr7ctKtu6pvpnS5PzRY6v_8zq0OtDb4GtDWa8JEI_zU4IG60HbK5WU1Q0uZlqX5L9fQKyoKbk_VDet5_AgnSuQNVlElRqKKp9wAje7fMhF8cqBbxhFDNtKBH2U0lUS'}, {'result_id': 5, 'title': '...哪里/图片介绍/参观预约/旅游游览顺序攻略及注意事项/营业时间...', 'description': '', 'url': 'http://www.baidu.com/link?url=BZf9SMVvuaZ5jYo-q5bgVgmU5NAIorixCJy_azkoSxrWYizZBW-5vxWIGUh7yB06toHIoSLAfXfFpRMws7EU2RcPy0i8GxKIpA-COjD0avu'}]}, tool_call_id='call_a54628c0496f47379e4241')]
------------------------------------------------------------      

[轮次 3]
 运动场地顾问: 经过搜索，我找到了丰台区体育中心的一些联系方式和官 方网站链接，希望这些信息能帮助您获取飞跃体育场的详细信息：        

1. **官方网站**：
   - [北京市丰台区人民政府网站](http://www.bjft.gov.cn/)
   - 在该网站上，您可以找到有关丰台区体育中心的最新公告和服务信息 。

2. **联系电话**：
   - 丰台区社会体育管理中心：010-83656286
   - 请注意，此电话号码为丰台区社会体育管理中心的办公电话，您可以 尝试联系他们获取飞跃体育场的相关信息。

3. **其他联系方式**：
   - 如果您需要更详细的联系方式或其他服务信息，建议您访问丰台区人 民政府网站并查找相关部门的联系方式。

希望这些信息能够帮助您顺利联系到丰台区体育中心并获取所需的详细信息。如果有任何其他问题或需要进一步的帮助，请随时告诉我。Next request.
 需求分析师: Instruction: 联系丰台区体育中心以获取飞跃体育场的详细信息。
Input: 请提供丰台区体育中心的联系电话或官方网站链接。
 工具调用: [ToolCallingRecord(tool_name='search_baidu', args={'query': '丰台区体育中心 联系电话 官方网站', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': '机构设置-北京市丰台区人民政府网站', 'description': '', 'url': 'http://www.baidu.com/link?url=4G9qsOu7HYAi3uWQkSDJm5f6tnUhnvVF3XbIf9-B6g1MkFa7JYy5HrpLTVOfZTEYos82wwl34NnYObAEoa_F37t03piFt5fkbmMqJUuiiZ6Ovl91hgZR4wYNwNlnlga-'}, {'result_id': 2, 'title': '2023年北京丰台区社会体育管理中心预算 情况说明-北京市丰台区人民...', 'description': '', 'url': 'http://www.baidu.com/link?url=_93EAKcIENWGoM8gceqeK5wLqYZH6HJ8Df9VScIKQMGHHT42b4pMrFw9wLxicUQFdnaBMn9S_QHnS_H9RNjtfzoQFHGF3TuOVZ9kjMmppCgpBP2DoGPYbll9i_IejCKb'}, {'result_id': 3, 'title': '联系我们', 'description': '', 'url': 'http://www.baidu.com/link?url=i0Ftqkwp8Rr-pIiA77ty60ReP0jvonrI6kXYB8BAhm-y0C1ta71m28mEA6Le0DSijXPzIu7j2SA2v_Xj7bGKeK'}, {'result_id': 4, 'title': '丰台区政务服务掌上办事大厅', 'description': '', 'url': 'http://www.baidu.com/link?url=eBfksjwJrc7froN5pvOVvDUXiRQQJ0_u3Uhkvxc0N8edELWBYa8VEswb7wt4V8OOi_Vj9Ab-bV3GTnfekzGC-K'}, {'result_id': 5, 'title': '丰台区政务服务掌上办事大 厅', 'description': '', 'url': 'http://www.baidu.com/link?url=_93EAKcIENWGoM8gceqeKulOrmuy5KLbijvbg9C1puThVHD3IlL69xUMoG1rTLU-bxGN4noe8XkSG8QD2zqmDa'}]}, tool_call_id='call_612fc354b8884974b31974')]
------------------------------------------------------------      

[轮次 4]
 运动场地顾问: 根据目前提供的信息，您已经获得了丰台区体育中心的联 系电话和官方网站链接，这些应该可以帮助您进一步了解飞跃体育场的具体信息，包括开放时间、费用、设施情况等。

如果您还需要其他方面的帮助或有更多具体的问题，请随时告诉我。例如，如果您需要了解其他运动场馆的信息，或者需要关于如何前往这些场馆的交通建议等，我都可以为您提供帮助。

请问您是否还需要进一步的信息或帮助？如果没有其他需求，我们将完成本次任务。Next request.
 需求分析师: Instruction: 确认是否还需要进一步的信息或帮助。      
Input: None
------------------------------------------------------------      

[轮次 5]
 运动场地顾问: 如果您对目前提供的信息感到满意，并且没有其他具体的 需求或问题，那么我们的任务就可以告一段落了。我已经提供了丰台区体育中心的联系电话和官方网站链接，这应该足以帮助您获取飞跃体育场的详细信息。

如果您在未来有任何新的需求或遇到任何问题，无论是关于运动场馆的推荐还是其他方面的问题，都欢迎随时向我咨询。

如果您现在没有其他需求，我们可以结束这次任务。请告诉我您的决定。Next request.
 需求分析师: Instruction: 确认是否需要进一步的信息或帮助。        
Input: None
------------------------------------------------------------      

[轮次 6]
 运动场地顾问: 根据您的反馈，如果您对目前提供的信息感到满意，并且 没有其他具体的需求或问题，那么我们就可以结束这次任务了。

如果您确定不再需要进一步的信息或帮助，请明确告知，我们将正式结束本次任务。如果您还有任何疑问或需要进一步的帮助，请随时告诉我。      

请问您是否可以确认结束本次任务？Next request.
 需求分析师: Instruction: 确认是否可以结束任务。
Input: None
------------------------------------------------------------      

[轮次 7]
 运动场地顾问: 感谢您的确认！如果您将来有任何其他需求或问题，无论 是关于运动场馆的推荐还是其他方面的问题，都欢迎随时向我咨询。祝您一切顺利，享受愉快的运动体验！

如果需要再次合作，随时欢迎回来。再见！
 需求分析师: <CAMEL_TASK_DONE>
 任务成功完成!

 对话已保存到记忆系统
 运动场馆推荐完成！
================================================================================

 ChatHistoryBlock记忆分析:
============================================================      
 总共处理了 1 个用户请求
 总共提供了 1 个推荐方案
 用户运动偏好统计: {'跑步': 1}

 最近的记录（权重衰减机制）:
记录1: User
内容: 大家好，我是一名48岁的白领，目前居住在北京市丰台区丰台街道。由于工作压力大，长时间坐在办公室里，我意识到保持身体健康的重要性。因此，我希望能够在业余时间多参与一些体育活动，尤其是我喜欢的跑步。

理想情况下，我希望能够找到一个设施齐全、环境舒适的运动场馆，最好是能够提供专业的跑道，让我可以在安全的...
权重: 0.810
------------------------------
记录2: SportsConsultant
内容: 感谢您的确认！如果您将来有任何其他需求或问题，无论是关于运动场馆的推荐还是其他方面的问题，都欢迎随时向我咨询。祝您一切顺利，享受愉快的运动体验！

如果需要再次合作，随时欢迎回来。再见！...
权重: 0.900
------------------------------
============================================================      

 第二次推荐 - 基于历史记录的智能推荐
============================================================      

 AI运动场馆推荐系统启动（RolePlaying模式）
================================================================================

🏃 随机生成用户运动需求案例：
年龄：36-45岁
职业：销售
运动偏好：跑步
特殊需求：适合家庭活动
所在位置：北京市西城区金融街街道
--------------------------------------------------

 AI用户的自述：
大家好，我是一名居住在北京西城区金融街街道的销售经理，今年38岁。由于工作性质的原因，我经常需要出差，但即便如此，我还是尽量保持健康的生活方式。我喜欢跑步，觉得这不仅能让我放松心情，还能保持良好的身体状态。

最近，随着孩子的成长，我也希望能找到一些适合全家一起参与的活动。因此，我想寻找一个既适合成人跑步，又能提供一些儿童友好设施的运动场所。最好是能够在一个安全舒适的环境中，让我们一家人可以共同享受运动的乐趣。

对于运动场馆的选择，我希望它能够满足以下几个条件：
1. 场馆内有专业的跑道，最好是有室内和室外两种选择，这样无论天气如 何，我们都能保证运动的时间；
2. 除了跑步，场馆还能提供一些适合孩子玩乐的设施，比如儿童游乐区或 是小型篮球场等，这样大人小孩都能找到自己喜欢的项目；
3. 场馆的交通便利，最好能步行到达或者靠近地铁站，方便我们出行；   
4. 如果场馆周围有好的餐饮服务就更好了，运动后可以直接在那里补充能 量。

关于预算方面，我希望能够控制在每月不超过1000元人民币的范围内。至于时间，周末是我们最有可能全家出动的时间段，所以如果场地在周末有优惠活动会更加理想。

如果有符合上述条件的运动场馆推荐，欢迎告诉我！谢谢大家。
--------------------------------------------------
 助手角色: BaseMessage(role_name='个性化运动场地顾问', role_type=<RoleType.ASSISTANT: 'assistant'>, meta_dict={'task': '根据用户需求，需在北京西城区金融街附近寻找一个拥有专业跑道、儿童游乐设施、交通便利且预算合理的运动场馆，最好周末有优惠。请使用地图搜索功能，结合用户喜好与家庭需求，精选推荐。', 'assistant_role': '个性化运动场地顾问', 'user_role': '运动场馆推荐需求分析师'}, content='===== RULES OF ASSISTANT =====\nNever forget you are a 个性化运动场地顾问 and I am a 运动场馆推荐需求分析师. Never flip roles! Never instruct me!\nWe share a common interest in collaborating to successfully complete a task.\nYou must help me to complete the task.\nHere is the task: 根据用户需求，需在北京西城区金融街附近寻找一个拥有专业跑 道、儿童游乐设施、交通便利且预算合理的运动场馆，最好周末有优惠。请使用地图搜索功能，结合用户喜好与家庭需求，精选推荐。. Never forget our task!\nI must instruct you based on your expertise and my needs to complete the task.\n\nI must give you one instruction at a time.\nYou must write a specific solution that appropriately solves the requested instruction and explain your solutions.\nYou must decline my instruction honestly if you cannot perform the instruction due to physical, moral, legal reasons or your capability and explain the reasons.\nUnless I say the task is completed, you should always start with:\n\nSolution: <YOUR_SOLUTION>\n\n<YOUR_SOLUTION> should be very specific, include detailed explanations and provide preferable detailed implementations and examples and lists for task-solving.\nAlways end <YOUR_SOLUTION> with: Next request.\nRegardless of the input language, you must output text in 中文.', video_bytes=None, image_list=None, image_detail='auto', video_detail='auto', parsed=None)
 用户角色: BaseMessage(role_name='运动场馆推荐需求分析师', role_type=<RoleType.USER: 'user'>, meta_dict={'task': '根据用户需求，需在北京西城区金融街附近寻找一个拥有专业跑道、儿童游乐设施、交通便利且预算合理的运动场馆，最好周末有优惠。请使用地图搜索功能，结合用户喜好与家庭需求，精选推荐。', 'assistant_role': '个性化运动场地顾问', 'user_role': '运动场馆推荐需求分析师'}, content='===== RULES OF USER =====\nNever forget you are a 运动场馆推荐需求分析师 and I am a 个性化运动场地顾问. Never flip roles! You will always instruct me.\nWe share a common interest in collaborating to successfully complete a task.\nI must help you to complete the task.\nHere is the task: 根据用户需求，需在北京西城区金融街附近寻找一个拥有专业跑道 、儿童游乐设施、交通便利且预算合理的运动场馆，最好周末有优惠。请使用地图搜索功能，结合用户喜好与家庭需求，精选推荐。. Never forget our task!\nYou must instruct me based on my expertise and your needs to solve the task ONLY in the following two ways:\n\n1. Instruct with a necessary input:\nInstruction: <YOUR_INSTRUCTION>\nInput: <YOUR_INPUT>\n\n2. Instruct without any input:\nInstruction: <YOUR_INSTRUCTION>\nInput: None\n\nThe "Instruction" describes a task or question. The paired "Input" provides further context or information for the requested "Instruction".\n\nYou must give me one instruction at a time.\nI must write a response that appropriately solves the requested instruction.\nI must decline your instruction honestly if I cannot perform the instruction due to physical, moral, legal reasons or my capability and explain the reasons.\nYou should instruct me not ask me questions.\nNow you must start to instruct me using the two ways described above.\nDo not add anything else other than your instruction and the optional corresponding input!\nKeep giving me instructions and necessary inputs until you think the task is completed.\nWhen the task is completed, you must only reply with a single word <CAMEL_TASK_DONE>.\nNever say <CAMEL_TASK_DONE> unless my responses have solved your task.\nRegardless of the input language, you must output text in 中文.', video_bytes=None, image_list=None, image_detail='auto', video_detail='auto', parsed=None)
 任务:
        作为个性化运动场地顾问，请为用户提供专业的运动场馆推荐。  

        用户需求: 大家好，我是一名居住在北京西城区金融街街道的销售经理，今年38岁。由于工作性质的原因，我经常需要出差，但即便如此，我还是尽量保持健康的生活方式。我喜欢跑步，觉得这不仅能让我放松心情，还能保持良好的身体状态。

最近，随着孩子的成长，我也希望能找到一些适合全家一起参与的活动。因此...
================================================================================

[轮次 1]
 运动场地顾问: 根据百度搜索的结果，我找到了一些可能符合您要求的运 动场馆信息，但没有直接找到完全匹配的场馆。不过，这里有几个选项可能会对您有所帮助：

1. **北京市西城区人民政府** - 这个链接可能提供了一些关于西城区体育设施的信息，您可以访问 [该网站](http://www.baidu.com/link?url=0IV25vOoT16_6zJDTsusop3t1ar5eDfJsstNpBiOxCbSy8Vw6ZyKESoLAj2Mws7Wf2XaXDCkB23VEZ4stHxYK_) 查看是否有相关的运动场馆介绍。

2. **全龄参与!社区“飞超”,今天火热开赛** - 这篇文章提到了一个在社区内举办的活动，也许可以联系组织者了解更多有关社区内的运动设施信息。您可以访问 [这篇文章](http://www.baidu.com/link?url=po5MHFE8RuPqJXQSKteKTYhlVBm2v6-5RpRhYCAPn3h0RnEkJumwECjUj3sNj9IH5ulYTnGvvS7zXnu87oq7n-lBShqHc1jpVY_cP4fcdO3) 获取更多信息。

3. **海淀区信息公开大厅** - 虽然这不是西城区的信息，但是这里也提供了一些公共设施的公开信息，可能对您选择运动场所有一定的参考价值。您可以访问 [该页面](http://www.baidu.com/link?url=kekghF1R2HEMtqe9hR-ZeSARvK7y5JatolqBOflDB1lo2-qM9V-zMa-NcHN1SfT_5KvY0iHghprWMoxeSHCBRR_dNf4GaDvB6B2yeRr-CG-HPNpZfpEuu0UpwksMuex4ayapFFgiH9BeFc-_47lTIgC6UciJ0kZV9Jifgp05h33) 查看是否有类似的服务或设施。

为了更准确地满足您的需求，建议直接联系西城区政府或者附近的社区中心，询问是否有所需的运动场馆。同时，也可以考虑使用专业的地图服务（如高德地图或百度地图）来搜索附近的运动场所，这些平台通常会有更加详细和实时的信息。如果您需要帮助进行进一步的搜索，请告诉我！
Next request.
 需求分析师: Instruction: 使用地图搜索功能，在北京西城区金融街附近查找拥有专业跑道和儿童游乐设施的运动场馆。
Input: None
 工具调用: [ToolCallingRecord(tool_name='search_google', args={'query': '北京西城区金融街附近拥有专业跑道和儿童游乐设施的运动场馆', 'num_result_pages': 1}, result=[{'error': 'google search failed.'}], tool_call_id='call_2038ed3b82674d6da84dc3'), ToolCallingRecord(tool_name='search_baidu', args={'query': '北京西城区金融街附近拥有专业跑道和儿童游乐设施的运动场馆', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': '北京西城:全龄参与!社区“飞超”6日火热开赛', 'description': '', 'url': 'http://www.baidu.com/link?url=po5MHFE8RuPqJXQSKteKTYhlVBm2v6-5RpRhYCAPn3g6XdszCjVMSm0wDXcZUZhu9ORXXzBbqkjgrYV0V45KhkT01MZ7slwkvClOBMu5zRC'}, {'result_id': 2, 'title': '北京市西城区人民政府', 'description': '', 'url': 'http://www.baidu.com/link?url=0IV25vOoT16_6zJDTsusop3t1ar5eDfJsstNpBiOxCbSy8Vw6ZyKESoLAj2Mws7Wf2XaXDCkB23VEZ4stHxYK_'}, {'result_id': 3, 'title': '北京市西城区人民政府', 'description': '', 'url': 'http://www.baidu.com/link?url=1qt8khYIO0yws3Lffk496ACJjF1QL3L9BNjT34-bX_RIPKg27TeWgN_ejsmejQGFjl4CHkyB-1wdhBKeRa9FHa'}, {'result_id': 4, 'title': '全龄参与!社区“飞超”,今天火热开赛', 'description': '', 'url': 'http://www.baidu.com/link?url=po5MHFE8RuPqJXQSKteKTYhlVBm2v6-5RpRhYCAPn3h0RnEkJumwECjUj3sNj9IH5ulYTnGvvS7zXnu87oq7n-lBShqHc1jpVY_cP4fcdO3'}, {'result_id': 5, 'title': '海淀区信息公开大厅', 'description': '', 'url': 'http://www.baidu.com/link?url=kekghF1R2HEMtqe9hR-ZeSARvK7y5JatolqBOflDB1lo2-qM9V-zMa-NcHN1SfT_5KvY0iHghprWMoxeSHCBRR_dNf4GaDvB6B2yeRr-CG-HPNpZfpEuu0UpwksMuex4ayapFFgiH9BeFc-_47lTIgC6UciJ0kZV9Jifgp05h33'}]}, tool_call_id='call_6f93c9b7eedc47a2905e82')]
------------------------------------------------------------      

[轮次 2]
 运动场地顾问: 通过百度地图的搜索结果，我找到了几个可能符合您需求 的运动场馆：

1. **悦动体能运动馆(金融街店)**：
   - **地址**：北京市西城区金融大街
   - **特点**：这家运动馆配备了专业的跑道和儿童游乐设施，适合家庭 成员一起锻炼和娱乐。
   - **联系方式**：您可以点击 [这里](http://www.baidu.com/link?url=ufvr2UK86pXXrYQ-mtzYocEjmzbPWGXB719tfFeeXknGa21wi0m5RI3Axq_JTO8jCaqPaDgep2RiQnIZqwrtMa) 获取更多详细信息和联系电话。

2. **西单体育游园**：
   - **地址**：北京市西城区西单北大街
   - **特点**：这个公园不仅有户外跑步道，还有专门为儿童设计的游乐 设施，是一个适合全家人的休闲好去处。
   - **门票**：免费或有特定活动时收费，具体信息可以点击 [这里](http://www.baidu.com/link?url=Z_fpAvzfSM8fFmqkbABmtnrrgWsqWtcoEOrKgFVPQzzNt__ACFi_qC4jDMbp9SDQBYrhtF3ZWNy8x8HtgmkZxyYSJIq9qHxw_akPO04n6gC) 查看。

这两个地点都位于北京西城区金融街附近，交通便利，非常适合您的需求。特别是悦动体能运动馆，它不仅提供了专业的运动设施，还特别照顾到了儿童的需求，是一个不错的选择。

如果您需要更多详细信息或有其他需求，请随时告知！
Next request.
 需求分析师: Instruction: 请使用高德地图或百度地图，具体查找位于北京西城区金融街附近的运动场馆，特别关注那些配备专业跑道和儿童游乐设施的场所。
Input: None
 工具调用: [ToolCallingRecord(tool_name='search_baidu', args={'query': '北京西城区金融街附近运动场馆 专业跑道 儿童游乐设施', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': '【悦动 体能运动馆(金融街店)】悦动体能运动馆(金融街店)电话,悦动...', 'description': '', 'url': 'http://www.baidu.com/link?url=ufvr2UK86pXXrYQ-mtzYocEjmzbPWGXB719tfFeeXknGa21wi0m5RI3Axq_JTO8jCaqPaDgep2RiQnIZqwrtMa'}, {'result_id': 2, 'title': '北京西单体育游园游玩攻略-西单体育游园门票多少钱/价格表-团购...', 'description': '', 'url': 'http://www.baidu.com/link?url=Z_fpAvzfSM8fFmqkbABmtnrrgWsqWtcoEOrKgFVPQzzNt__ACFi_qC4jDMbp9SDQBYrhtF3ZWNy8x8HtgmkZxyYSJIq9qHxw_akPO04n6gC'}]}, tool_call_id='call_7907b37e868f4616bc364a')]
------------------------------------------------------------      

[轮次 3]
 运动场地顾问: 根据搜索结果，以下是关于悦动体能运动馆(金融街店)和 西单体育游园的周末优惠信息：

### 悦动体能运动馆(金融街店)
1. **抖音团购优惠**：
   - **内容**：悦动健身俱乐部在抖音上推出了多种团购优惠，包括局部 肌肉放松处理等项目。
   - **详情**：您可以点击 [这里](http://www.baidu.com/link?url=KND8gfkNhkLAGFTsDYzWbfCuX4RldJXsk2Vx0lQdUsZquG_xMlrQ-Q2Tz_4nSYnALbdy32JM0Yc2Ll7Y8zZ_9_) 查看具体的优惠项目和价格。

2. **特惠体验票**：
   - **内容**：特惠1元秒杀悦动健身会所体验票，包含国标泳池畅游等项目。
   - **详情**：您可以点击 [这里](http://www.baidu.com/link?url=Y4hwzBoXjFOMqKd9GpAOV99gwhJGAGxcl6e29L2G9_zMN-hoyCirpxy_jU7yfaU77Pr2iavi63ey8eH6_PNAG_) 获取更多信息。

### 西单体育游园
1. **门票优惠**：
   - **内容**：西单体育游园的门票在某些平台上可能有团购优惠。     
   - **详情**：您可以点击 [这里](http://www.baidu.com/link?url=BPsb1MuXCeqP7ea786TuOqAXkwFg6FbShNc7fJgvdtSw05WMn51JzX2BPrBTG-gGkEOyRb4h9giuxkm_bdnY18NG0ByNmf2EqYlhxGxWG0K) 查看具体的优惠信息和购票方式。

2. **其他活动**：
   - **内容**：虽然没有明确提到周末的特定优惠，但西单体育游园经常 举办各种活动，您可以关注其官方网站或社交媒体账号获取最新信息。    
   - **详情**：您可以点击 [这里](http://www.baidu.com/link?url=9QLVfQ_zTvdxJXhQ0O5NGgkPIKOSeovSe7yBHGBnbBFevIAysydeQ1-Ga07cermiH0wHj3PYgKp4BMsyaQcDST0l93KODzwZ7yIaqWIHh8697W_py-KuR6GXCzdgGwIH) 查看 更多相关信息。

### 总结
- **悦动体能运动馆(金融街店)**：通过抖音和特惠体验票的方式提供周末优惠，您可以点击相关链接查看具体优惠内容。
- **西单体育游园**：门票在某些平台上可能有团购优惠，建议关注其官方网站或社交媒体获取最新活动信息。

如果您需要更多详细信息或有其他需求，请随时告知！
Next request.
 需求分析师: Instruction: 请确认悦动体能运动馆(金融街店)和西单体育游园的周末是否有优惠活动，并提供具体的优惠信息。
Input: None
 工具调用: [ToolCallingRecord(tool_name='search_google', args={'query': '悦动体能运动馆(金融街店) 周末优惠', 'num_result_pages': 1}, result=[{'error': 'google search failed.'}], tool_call_id='call_6cc96e83c53247ad89f614'), ToolCallingRecord(tool_name='search_baidu', args={'query': '悦动体能运动馆(金融街店) 周末优惠', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': '悦动健身俱 乐部,热销团购,不容错过,局部肌肉放松处理,随时退 - 抖音', 'description': '', 'url': 'http://www.baidu.com/link?url=KND8gfkNhkLAGFTsDYzWbfCuX4RldJXsk2Vx0lQdUsZquG_xMlrQ-Q2Tz_4nSYnALbdy32JM0Yc2Ll7Y8zZ_9_'}, {'result_id': 2, 'title': '一起去50米的国标泳池畅快游泳!特惠1元秒杀悦动健身会所体验票!游泳...', 'description': '', 'url': 'http://www.baidu.com/link?url=Y4hwzBoXjFOMqKd9GpAOV99gwhJGAGxcl6e29L2G9_zMN-hoyCirpxy_jU7yfaU77Pr2iavi63ey8eH6_PNAG_'}, {'result_id': 3, 'title': '超鹿运动团购怎么用 - 抖音', 'description': '', 'url': 'http://www.baidu.com/link?url=Dqn_VukCNrkFqN8tp2ycvH1NgLH1xcnSBfCQO3aVs5ngEr52hpVsqImvK5FE2urMk9AS9PVDexa1Dyzz6EYPJa'}, {'result_id': 4, 'title': '大众点评网', 'description': '', 'url': 'http://www.baidu.com/link?url=8S_n3ErGxmr-4_330oSDRR6114rQjc2ACb3a5jEy_2F--WY9TGpm9xWZ2q8f3EZ0'}, {'result_id': 5, 'title': '【携程攻略】携程旅游攻略,自助游,自驾游,出游,自由行攻略指南', 'description': '', 'url': 'http://www.baidu.com/link?url=-K8_tFl8LfGuN---6CXoIiZplEfoWfSr4XZHeIW022QDm8a-zYM3pHPULfQfiretksW4FQ0XLer1ZBNMfn0ziK'}]}, tool_call_id='call_c1aba338450742988beff5'), ToolCallingRecord(tool_name='search_baidu', args={'query': '西单体育游园 周末优惠', 'max_results': 5}, result={'results': [{'result_id': 1, 'title': '...西单体育游园门票多少钱/价格表-团购票价预定优惠-景点地址在...', 'description': '', 'url': 'http://www.baidu.com/link?url=BPsb1MuXCeqP7ea786TuOqAXkwFg6FbShNc7fJgvdtSw05WMn51JzX2BPrBTG-gGkEOyRb4h9giuxkm_bdnY18NG0ByNmf2EqYlhxGxWG0K'}, {'result_id': 2, 'title': '北京市体育局 北京市文化和旅游局关于命名2024年北京市体育旅游...', 'description': '', 'url': 'http://www.baidu.com/link?url=9QLVfQ_zTvdxJXhQ0O5NGgkPIKOSeovSe7yBHGBnbBFevIAysydeQ1-Ga07cermiH0wHj3PYgKp4BMsyaQcDST0l93KODzwZ7yIaqWIHh8697W_py-KuR6GXCzdgGwIH'}, {'result_id': 3, 'title': '奥运赛事正酣,一起来“这里”运动打卡!', 'description': '', 'url': 'http://www.baidu.com/link?url=oLYN82_ae0EAYe4SQ8K6Ekp2KdH2NoBNiuUj_NEA4CdN9xQRjvf37pNTlIpvzwlDfo-P1kNl9vmszpuLDTiCrid8CCQv1O7henv0NxUgsdTOIjoGV0btWSdFvljI5Anm36ipfSbSpqSKdi6QTr-_KwXkol9CBZ6gZsvZmXthAc_Cgan_bARMEcCJq_KXMSXQQMSd25o7SY3oDy1betP-hZnfLDlAGXeojJay9Pxf23rPXnq1u_3km8BpUh0zfgctBorN0wEyR8hgNTJn39xd0_'}, {'result_id': 4, 'title': '西单一日游攻略,逛吃逛喝不停歇', 'description': '', 'url': 'http://www.baidu.com/link?url=uATwgXfMql9W2mQpi9DoXyyKrNVIAwFdwJXmPXmteL3FcL5HlBMAY4LdWYooiBK147qhZpEk8fhnAH2eVddysEHjyC6gujMW-cUDL1jBbar1dAg74Frh97YgRH7uw7s9'}, {'result_id': 5, 'title': '... 常营体育公园-西园门票多少钱/价格表-团购票价预定优惠-景点...', 'description': '', 'url': 'http://www.baidu.com/link?url=BPsb1MuXCeqP7ea786TuOqAXkwFg6FbShNc7fJgvdtSw05WMn51JzX2BPrBTG-gGkEOyRb4h9giuxkm_bdnY1ymGtcOheoLhWaeKzsuHLDq'}]}, tool_call_id='call_789c5ae0b1814154bee529')]
------------------------------------------------------------      

[轮次 4]
 运动场地顾问: ### 悦动体能运动馆(金融街店) 交通便利性

1. **最近的地铁站**：
   - **金融街站**：乘坐地铁2号线或4号线，从金融街站下车，步行约5分钟即可到达。
   - **复兴门站**：乘坐地铁1号线或2号线，从复兴门站下车，步行约10 分钟即可到达。

2. **公交线路**：
   - **公交线路**：多条公交线路途经金融街，例如105路、109路、662路等，均可在金融街站下车。

### 西单体育游园 交通便利性

1. **最近的地铁站**：
   - **西单站**：乘坐地铁1号线或4号线，从西单站下车，步行约5分钟即可到达。
   - **复兴门站**：乘坐地铁1号线或2号线，从复兴门站下车，步行约15 分钟即可到达。

2. **公交线路**：
   - **公交线路**：多条公交线路途经西单，例如102路、105路、109路、662路等，均可在西单北大街站下车。

### 总结

- **悦动体能运动馆(金融街店)**：最近的地铁站是金融街站和复兴门站，多条公交线路途经金融街，交通非常便利。
- **西单体育游园**：最近的地铁站是西单站和复兴门站，多条公交线路途经西单，交通也非常便利。

如果您需要更多详细信息或有其他需求，请随时告知！
Next request.
 需求分析师: Instruction: 确认悦动体能运动馆(金融街店)和西单体育游园的交通便利性，包括最近的地铁站和公交线路。
Input: None
------------------------------------------------------------      

[轮次 5]
 运动场地顾问: ### 综合评估与推荐意见

#### 悦动体能运动馆(金融街店)

**优点**：
1. **专业设施**：配备了专业的跑道和儿童游乐设施，适合家庭成员一起 锻炼和娱乐。
2. **周末优惠**：通过抖音和特惠体验票的方式提供周末优惠，如局部肌 肉放松处理、国标泳池畅游等项目。
3. **交通便利**：最近的地铁站是金融街站和复兴门站，多条公交线路途 经金融街，交通非常便利。

**缺点**：
1. **费用**：虽然有周末优惠，但整体费用可能相对较高。
2. **人群密度**：作为商业运动馆，周末人流量可能较大，影响锻炼体验 。

#### 西单体育游园

**优点**：
1. **户外环境**：提供户外跑步道和儿童游乐设施，适合家庭成员在自然 环境中活动。
2. **免费或低价**：门票免费或有特定活动时收费，经济实惠。
3. **交通便利**：最近的地铁站是西单站和复兴门站，多条公交线路途经 西单，交通非常便利。

**缺点**：
1. **设施有限**：相比专业的运动馆，设施可能较为简单。
2. **天气依赖**：户外活动受天气影响较大，不适合雨天或极端天气。   

### 最终推荐意见

根据您的需求和上述评估，我推荐以下方案：

1. **如果追求专业设施和高质量服务**：
   - **推荐**：悦动体能运动馆(金融街店)
   - **理由**：专业的跑道和儿童游乐设施，适合家庭成员一起锻炼和娱 乐。周末有多种优惠活动，交通便利。

2. **如果注重经济实惠和户外环境**：
   - **推荐**：西单体育游园
   - **理由**：户外跑步道和儿童游乐设施，适合家庭成员在自然环境中 活动。门票免费或有特定活动时收费，经济实惠。交通便利。

### 结论

如果您希望享受更专业的运动设施和服务，并不介意稍微高一点的费用，**悦动体能运动馆(金融街店)** 是更好的选择。如果您更注重经济实惠和户 外活动体验，**西单体育游园** 则更为合适。

如果您需要更多详细信息或有其他需求，请随时告知！
Next request.
 需求分析师: Instruction: 根据以上信息，综合评估悦动体能运动馆(金 融街店)和西单体育游园的优缺点，给出最终推荐意见。
Input: None
------------------------------------------------------------      

[轮次 6]
 运动场地顾问: 很高兴能帮到您！如果您有任何其他问题或需要进一步的 帮助，请随时联系我。祝您在选择的运动场馆中度过愉快的时光！        

如果您对我们的合作满意，也欢迎留下反馈。谢谢！
 需求分析师: <CAMEL_TASK_DONE>
 任务成功完成!

 对话已保存到记忆系统
 运动场馆推荐完成！
================================================================================

 ChatHistoryBlock记忆分析:
============================================================      
 总共处理了 2 个用户请求
 总共提供了 2 个推荐方案
 用户运动偏好统计: {'跑步': 2, '篮球': 1}

 最近的记录（权重衰减机制）:
记录1: User
内容: 大家好，我是一名48岁的白领，目前居住在北京市丰台区丰台街道。由于工作压力大，长时间坐在办公室里，我意识到保持身体健康的重要性。因此，我希望能够在业余时间多参与一些体育活动，尤其是我喜欢的跑步。

理想情况下，我希望能够找到一个设施齐全、环境舒适的运动场馆，最好是能够提供专业的跑道，让我可以在安全的...
权重: 0.656
------------------------------
记录2: SportsConsultant
内容: 感谢您的确认！如果您将来有任何其他需求或问题，无论是关于运动场馆的推荐还是其他方面的问题，都欢迎随时向我咨询。祝您一切顺利，享受愉快的运动体验！

如果需要再次合作，随时欢迎回来。再见！...
权重: 0.729
------------------------------
记录3: User
内容: 大家好，我是一名居住在北京西城区金融街街道的销售经理，今年38岁。由于工作性质的原因，我经常需要出差，但即便如此，我还是尽量保持健康的生活方式。我喜欢跑步，觉得这不仅能让我放松心情，还能保持良好的身体状态。

最近，随着孩子的成长，我也希望能找到一些适合全家一起参与的活动。因此，我想寻找一个既适合成...
权重: 0.810
------------------------------
记录4: SportsConsultant
内容: 很高兴能帮到您！如果您有任何其他问题或需要进一步的帮助，请随时联系我。祝您在选择的运动场馆中度过愉快的时光！

如果您对我们的合作满意，也欢迎留下反馈。谢谢！...
权重: 0.900
------------------------------
============================================================      

 系统演示完成！
 ChatHistoryBlock成功实现了用户需求的匹配度计算和历史记录管理

Agent_camel框架学习记录（2）

Posted on 2025-07-15 Edited on 2025-07-20 In 学习笔记

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

2.3.3 使用开源模型：Ollama

Ollama 是一个开源机器学习框架，专注于让用户轻松使用语言模型。它基于 llama.cpp 实现，支持 CPU/GPU 推理，并兼容 OpenAI 接口。

安装与使用 Qwen2.5

1	ollama pull qwen2.5:7b

模型加载方式：

from camel.models import ModelFactory
from camel.types import ModelPlatformType

model = ModelFactory.create(
    model_platform=ModelPlatformType.OLLAMA,
    model_type="qwen2.5",
    model_config_dict={"temperature": 0.4},
)

自行构建的qwen2.5:7b模型下的多行问答Agent:

from camel.agents import ChatAgent
from camel.models import ModelFactory
from camel.types import ModelPlatformType
import sys
from camel.messages import BaseMessage

model = ModelFactory.create(
    model_platform=ModelPlatformType.OLLAMA,
    model_type="qwen2.5:7b",  # Use the model name displayed in 'ollama list'
    model_config_dict={
        "temperature": 0.4,
    },
    url="http://localhost:11434/v1/"
)

agent = ChatAgent(
    model=model,
    output_language='中文'
)

print("与 CAMEL 代理开始对话 (输入 '退出' 结束):")

while True:
    print("你: (输入多行内容，空行结束)")
    user_input_lines = []
    while True:
        line = input()
        if line.lower() == '退出':
            print("对话结束。")
            sys.exit()  # 完全退出程序
        if not line.strip():  # 空行结束输入
            break
        user_input_lines.append(line)
    
    if user_input_lines:  # 如果有输入内容
        user_input = '\n'.join(user_input_lines)
    else:
        continue  # 空输入则重新开始循环

    # Create a BaseMessage from user input
    user_msg = BaseMessage.make_user_message(
        role_name="User",
        content=user_input
    )   

    # Get model response
    response = agent.step(user_msg)
    if response and response.msgs:
        print(f"代理: {response.msgs[0].content}")
    else:
        print("代理: 未收到有效回复。")

2.4.3 BaseMessage 消息处理

from camel.messages import BaseMessage

# 创建消息
user_msg = BaseMessage.make_user_message(role_name="User_1", content="Hi")
assistant_msg = BaseMessage.make_assistant_message(role_name="Assistant_1", content="Hello!")

# 更新消息内容
updated_msg = user_msg.create_new_instance("Hi, tell me more about CAMEL")

# 转换为 OpenAI 消息格式
from camel.types import OpenAIBackendRole
openai_msg = user_msg.to_openai_message(role_at_backend=OpenAIBackendRole.USER)

通过BassMessage实现Agent处理图片/视频等多模态信息：
首先展示本地图片的多模态理解示例：

from camel.agents import ChatAgent
from camel.models import ModelFactory
from camel.types import ModelPlatformType
from camel.messages import BaseMessage

from io import BytesIO
import requests
from PIL import Image

from dotenv import load_dotenv
import os

# 加载环境变量
load_dotenv(dotenv_path='.env')  # 确保.env文件存在且路径正确
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')  # 使用环境变量获取密钥

model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-VL-72B-Instruct",
    api_key=api_key,
    url=os.environ.get("OPENAI_COMPATIBILIY_API_BASE_URL", "https://api-inference.modelscope.cn/v1/"),  # 环境变量优先，不存在则使用默认值
    model_config_dict={"temperature": 0.4, "max_tokens": 4096},
)

# 实例化ChatAgent
agent = ChatAgent(model=model,output_language='中文')

# 本地图片
image_path = "微信图片_2025-07-11_223853_723.jpg"
img = Image.open(image_path)  # 直接打开图片文件

user_msg = BaseMessage.make_user_message(
    role_name="User", 
    content="请描述这张图片的内容", 
    image_list=[img]  # 使用image_list参数传入PIL.Image对象列表
)

response = agent.step(user_msg)   # 1. 将包含图片的用户消息发送给AI代理
print(response.msgs[0].content)  # 2. 打印AI代理的回复内容

图片示例

以上的图片示例运行后的结果：

1
2

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/Multimodal_images.py      
这张图片显示了一位正在打羽毛球的人。他穿着黑色的T恤和红色的短裤，脚上穿着白色的运动鞋。他的右手持着羽毛球拍，似乎在准备击球或刚刚完成一次击球动作。背景是一个室内羽毛球场地，可以看到彩色的观 众席和一些放置在地上的物品，如背包和鞋子。场地的地面是绿色的，标有白色的线条，用于划分比赛区域

2.4.4 与 ChatAgent 协作

from camel.agents import ChatAgent
chat_agent = ChatAgent(model=model, system_message="You are a helpful assistant", output_language='zh')
response = chat_agent.step("介绍一下 CAMEL AI")
print(response.msgs[0].content)

2.5.3 上下文学习 (ICL)

ICL 通过上下文中的示例（Few-shot/One-shot/Zero-shot）指导模型生成答案。

英文转法文任务示例：
Translate English to French.
apple -> pomme
car -> voiture
cat -> chat
dog ->

2.5.4 思维链 (CoT)

通过逐步展示推理过程提升模型表现：

1 2	Q: Roger 有 5 个网球，他又买了 2 罐，每罐 3 个，共多少？ A: 他有 5 + 2*3 = 11 个网球。

2.5.5 使用 CAMEL 的 Prompt

使用 TaskSpecifyAgent 创建特定任务提示：

from camel.agents import TaskSpecifyAgent

task_specify_agent = TaskSpecifyAgent(
    model=model, task_type=TaskType.AI_SOCIETY, output_language='中文'
)
response = task_specify_agent.run(
    task_prompt="get promotion",
    meta_dict=dict(assistant_role="Engineer", user_role="Employee", word_limit=100)
)
print(response)

使用 TextPrompt 自定义模板：

from camel.prompts import TextPrompt
prompt = TextPrompt('Hi {name}, you are {age} years old.')
formatted = prompt.format(name="John", age=30)
print(formatted)  # Hi John, you are 30 years old.

更多见官方文档：https://github.com/camel-ai/camel

2.6Memory记忆系统

CAMEL AI 记忆系统集成操作流程

理论基础
1.1 CAMEL 记忆存储机制

Key-Value 存储: 简单键值对存储，适合结构化数据
Graph 存储: 图数据库存储，适合关系型数据
Vector 存储: 向量数据库存储，适合语义检索

1.2 核心数据结构

Chat_history: 规范化存储智能体对话记录
Context: 从 chat_history 中提取的上下文信息
权重机制: 基于重要性评分筛选关键信息

1.3 工作原理
大模型基于预测机制生成文本，通过权重筛选从历史记录中获取有效上下文，确保在 token 限制内提供最重要的信息。
2. 环境准备以及记忆系统构建初始化

from camel.memories import (
    LongtermAgentMemory,#核心记忆管理器，负责存储和检索对话历史
    MemoryRecord,
    ScoreBasedContextCreator,#基于评分的上下文创建器
    ChatHistoryBlock,#存储聊天历史记录的数据块
    VectorDBBlock,#向量数据库块
)
#载入基础配置
from camel.messages import BaseMessage
from camel.types import ModelType, OpenAIBackendRole
from camel.utils import OpenAITokenCounter
from camel.embeddings import SentenceTransformerEncoder
from camel.agents import ChatAgent
from camel.models import ModelFactory
from camel.types import ModelPlatformType

#载入环境配置
import os
from dotenv import load_dotenv
load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

#初始化记忆系统
memory = LongtermAgentMemory(
    context_creator=ScoreBasedContextCreator(
        token_counter=OpenAITokenCounter(ModelType.GPT_4O_MINI),
        token_limit=1024,  # 使用 token 计数器限制上下文长度（1024 tokens）
    ),
    chat_history_block=ChatHistoryBlock(),  # 聊天历史存储
    vector_db_block=VectorDBBlock(
        embedding=SentenceTransformerEncoder(model_name="BAAI/bge-m3")
    ),  # 向量数据库存储，使用 BGE-M3 模型进行文本嵌入
)

#创建记忆记录
records = [
    MemoryRecord(
        message=BaseMessage.make_user_message(
            role_name="User",
            content="什么是CAMEL AI?"
        ),
        role_at_backend=OpenAIBackendRole.USER,
    ),
    MemoryRecord(
        message=BaseMessage.make_assistant_message(
            role_name="Agent",
            content="CAMEL-AI是第一个LLM多智能体框架,并且是一个致力于寻找智能体 scaling law 的开源社区。"
        ),
        role_at_backend=OpenAIBackendRole.ASSISTANT,
    ),
]

#写入记忆数据
memory.write_records(records)

#验证记忆系统
context, token_count = memory.get_context()
print(f"上下文: {context}")
print(f"Token 消耗: {token_count}")


###创建基础智能体
# 定义系统消息
sys_msg = "你是一个好奇的智能体，正在探索宇宙的奥秘。"

# 初始化模型
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

# 创建智能体
agent = ChatAgent(system_message=sys_msg, model=model)

###测试无记忆状态
usr_msg = "告诉我基于我们讨论的内容，哪个是第一个LLM多智能体框架？"
response = agent.step(usr_msg)
print("无记忆状态响应:", response.msgs[0].content)

关键组件说明:
ScoreBasedContextCreator: 基于评分的上下文创建器
ChatHistoryBlock: 聊天记录存储块
VectorDBBlock: 向量数据库块，支持语义检索

测试无记忆状态的输出结果

PS D:\Camel_Test_Project> & D:/Download/Python/py-3.11.9/python.exe d:/Camel_Test_Project/test_Memory_all.py
W0715 11:51:47.852000 17616 site-packages\torch\distributed\elastic\multiprocessing\redirects.py:29] NOTE: Redirects are currently not supported in Windows or MacOs.
上下文: [{'role': 'user', 'content': '什么是CAMEL AI?'}, {'role': 'assistant', 'content': 'CAMEL-AI是第一个LLM多智能体框架,并且是一个致力于寻找智能体 scaling law 的开源社区。'}]
Token 消耗: 52
无记忆状态响应: 目前，关于“第一个LLM（大语言模型）多智能体框架”的确切定义和时间点可能存在一定的模糊性，因为这一领域的发展非常迅速，而且不同的项目和研究可能从不同的角度来定义“多智能体框架”。 然而，可以提到一些较早的、具有代表性的项目，它们在大语言模型与多智能体系统结合方面进行了开创性的工作。

 **Multi-Agent Systems with Large Language Models (LLMs)**: 虽然很难确定一个具体的“第一”，但 可以指出的是，随着大语言模型如GPT-3等的出现，研究人员开始探索将这些模型应用于多智能体系统中。例如，2021年左右，一些研究团队开始尝试使用大语言模型作为智能体之间的通信工具，或者作为增强单个智 能体决策能力的方法。
 **ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的方法，它利用大型预训练语言模型来促进多智能体协作。这个框架展示了如何通过自然语言处理技术让智能 体之间进行更有效的沟通与合作，被认为是该领域的早期重要贡献之一。
 **ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的方法，它利用大型预训练语言模型来促进多智能体协作。这个框架展示了如何通过自然语言处理技术让智能 
 **ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的
**ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的方法，它利用大型预训练语言模型来促进多智能体协作。这个框架展示了如何通过自然语言处理技术让智能 
 **ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的
 **ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的方法，它利用大型预训练语言模型来促进多智能体协作。这个框架展示了如何通过自然语言处理技术让智能 体之间进行更有效的沟通与合作，被认为是该领域的早期重要贡献之一。
 **ReAct for Multi-Agent Collaboration**: 2022年，来自斯坦福大学的研究者提出了一种名为ReAct的方法，它利用大型预训练语言模型来促进多智能体协作。这个框架展示了如何通过自然语言处理技术让智能 体之间进行更有效的沟通与合作，被认为是该领域的早期重要贡献之一。
方法，它利用大型预训练语言模型来促进多智能体协作。这个框架展示了如何通过自然语言处理技术让智能体之间进行更有效的沟通与合作，被认为是该领域的早期重要贡献之一。

需要注意的是，上述信息基于当前可获得的数据，并且随着新研究的不断涌现，这一领域的先驱者可能会有 所变化。如果你有特定的研究或项目想要了解，请提供更多信息，我将尽力为你提供详细的答案。

记忆系统集成
4.1 集成记忆到智能体
python# 关键步骤：将记忆系统赋值给智能体
agent.memory = memory
4.2 测试集成效果
python# 使用相同的问题测试
response = agent.step(usr_msg)
print(“集成记忆后响应:”, response.msgs[0].content)

5.测试结果，成功响应：

集成记忆后响应: CAMEL-AI 是一个专注于研究和开发大规模语言模型（LLM）在多智能体系统中应用的框架 。它旨在通过构建和实验不同的多智能体交互模式，来探索和理解智能体之间的协作、竞争以及这些互动如 何影响整体系统的性能和效率。根据您的问题，CAMEL-AI 被认为是第一个LLM多智能体框架。这个框架不仅 促进了对智能体 scaling law 的研究，还为研究人员和开发者提供了一个开放平台，以测试新的算法和理论。

2.7 Tools 工具系统

2.7.1 工具说明

工具（Tools）是大语言模型（LLM）与外部世界交互的桥梁。虽然 LLM 拥有强大的语言理解与生成能力，但它本质上是一个“封闭系统”，无法直接：

获取实时信息（如天气、新闻）
访问外部数据（如数据库、文件）
执行具体操作（如发送邮件、控制设备）

为克服这些局限，CAMEL 提供了“工具”机制，使模型能够：

通过 API 获取实时数据
调用外部服务
执行特定任务
与其他系统交互

✅ 工具的本质是一个带有名称、描述、输入参数与输出类型的 函数接口。

CAMEL 支持：

内置工具
自定义工具
工具包（Toolkit）

2.7.2 动手实践

from camel.agents import ChatAgent
from camel.models import ModelFactory
from camel.types import ModelPlatformType
import os
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 初始化模型
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

# 初始化 ChatAgent（未配工具）
agent = ChatAgent(
    system_message="你是一个数学大师，擅长各种数学问题。",
    model=model,
    output_language='中文',
    tools=[]
)

# 定义用户消息发送消息给agent
usr_msg = "2的平方根是多少？"
response = agent.step(usr_msg)
print(response.msgs[0].content)

输出约为：2的平方根是 1.414

可以看到模型给出了回答，但是精度不够。我们需要更高的精度，现在创建自定义函数工具：

使用FunctionTool

from camel.toolkits import FunctionTool
import math

def calculate_sqrt(x: float) -> float:
     r"""计算一个数的平方根。

    Args:
        x (float): 需要计算平方根的数字。

    Returns:
        float: 输入数字的平方根。
    """
    return math.sqrt(x)

# 用 FunctionTool 包装该函数
sqrt_tool = FunctionTool(calculate_sqrt)

# 创建带工具的 agent
agent = ChatAgent(
    system_message="你是一个数学大师，遇到数学问题你要调用工具。",
    model=model,
    output_language='中文',
    tools=[sqrt_tool]
)

response = agent.step("2的平方根是多少？")
print(response.msgs[0].content)
print(response.info["tool_calls"])

2.7.3 进阶案例：AI Society + 工具系统

from camel.toolkits import SearchToolkit, MathToolkit
from camel.societies import RolePlaying
from camel.types.agents import ToolCallingRecord
from camel.models import ModelFactory
from camel.types import ModelPlatformType
from colorama import Fore
import os
from dotenv import load_dotenv

# 环境配置
load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

# 创建模型
model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

# 定义工具包
tools_list = [
    *SearchToolkit().get_tools(),
    *MathToolkit().get_tools()
]

# 设置任务
task_prompt = ("假设现在是2024年，牛津大学的成立年份，并计算出其当前年龄。"
               "然后再将这个年龄加上10年。使用百度搜索工具。")

# 设置角色扮演
role_play_session = RolePlaying(
    assistant_role_name="搜索者",
    user_role_name="教授",
    assistant_agent_kwargs=dict(model=model, tools=tools_list),
    user_agent_kwargs=dict(model=model),
    task_prompt=task_prompt,
    with_task_specify=False,
    output_language='中文'
)

# 初始化对话
input_msg = role_play_session.init_chat()

# 改进的对话循环 - 添加安全机制
max_turns = 10
turn_count = 0

print(Fore.CYAN + f"开始执行任务: {task_prompt}\n")
print(Fore.YELLOW + "=" * 60)

while turn_count < max_turns:
    try:
        assistant_response, user_response = role_play_session.step(input_msg)
        
        # 简化但必要的输出
        print(Fore.WHITE + f"\n[Turn {turn_count + 1}]")
        print(Fore.GREEN + f"助手: {assistant_response.msg.content}")
        print(Fore.BLUE + f"用户: {user_response.msg.content}")
        
        # 显示工具调用信息
        if assistant_response.info['tool_calls']:
            print(Fore.MAGENTA + f"工具调用: {assistant_response.info['tool_calls']}")
        
        # 检查终止条件
        if assistant_response.terminated or user_response.terminated:
            print(Fore.RED + "对话终止")
            if assistant_response.terminated:
                print(Fore.RED + f"助手终止原因: {assistant_response.info.get('termination_reasons', '未知')}")
            if user_response.terminated:
                print(Fore.RED + f"用户终止原因: {user_response.info.get('termination_reasons', '未知')}")
            break
        
        # 检查任务完成标识
        if "CAMEL_TASK_DONE" in user_response.msg.content:
            print(Fore.GREEN + "任务完成!")
            break
            
        input_msg = assistant_response.msg
        turn_count += 1
        
        print(Fore.YELLOW + "-" * 60)
        
    except Exception as e:
        print(Fore.RED + f"执行错误: {e}")
        break

可通过 response.info["tool_calls"] 查看工具调用记录，验证是否使用工具而非“编造”。

这段代码是一个完整的 CAMEL AI 多智能体协作系统实现，以下将详细分析其功能架构和实现机制。

系统架构分析
1.1 核心组件结构
┌─────────────────────────────────────────────────────────────┐
│ CAMEL AI 多智能体系统 │
├─────────────────────────────────────────────────────────────┤
│ 环境配置层 │ 模型工厂层 │ 工具包层 │ 角色扮演层 │ 执行控制层 │
│ ├─ 环境变量 │ ├─ 模型创建 │ ├─ 搜索 │ ├─ 双智能体 │ ├─ 安全机制 │
│ ├─ API配置 │ ├─ 平台适配 │ ├─ 计算 │ ├─ 任务分配 │ ├─ 异常处理 │
│ └─ 密钥管理 │ └─ 连接建立 │ └─ 工具链 │ └─ 协作模式 │ └─ 循环控制 │
└─────────────────────────────────────────────────────────────┘
1.2 数据流向分析
用户任务 → 角色扮演系统 → 智能体交互 → 工具调用 → 结果返回 → 任务完成
↓ ↓ ↓ ↓ ↓ ↓
任务解析角色分配消息传递功能执行数据处理状态更新
详细功能实现
2.1 环境配置与模型初始化

1
2
3

python# 环境配置层
load_dotenv()
api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

模型工厂层

model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

功能特点:
配置解耦: 使用环境变量管理敏感信息
平台抽象: 支持多种模型平台的统一接口
模型选择: 使用 Qwen2.5-72B 大模型作为推理引擎

2.2 工具包集成机制

pythontools_list = [
    *SearchToolkit().get_tools(),
    *MathToolkit().get_tools()
]

工具能力分析:

SearchToolkit:

百度搜索、谷歌搜索、DuckDuckGo搜索
信息检索和网络查询能力

MathToolkit:

数学计算、公式求解
数值分析和统计计算

扩展性: 使用解包操作符支持动态工具添加

2.3 角色扮演系统设计
pythonrole_play_session = RolePlaying(
assistant_role_name=”搜索者”,
user_role_name=”教授”,
assistant_agent_kwargs=dict(model=model, tools=tools_list),
user_agent_kwargs=dict(model=model),
task_prompt=task_prompt,
with_task_specify=False,
output_language=’中文’
)
角色分工机制:
搜索者（Assistant）:
具备工具调用能力
负责信息检索和计算执行
主动解决问题的执行者

教授（User）:
任务分析和指导
结果验证和反馈
决策和监督角色

2.4 任务驱动的协作模式

1 2	pythontask_prompt = ("假设现在是2024年，牛津大学的成立年份，并计算出其当前年龄。" "然后再将这个年龄加上10年。使用百度搜索工具。")

任务分解策略:
信息获取: 搜索牛津大学成立年份
数据处理: 计算当前年龄 (2024 - 成立年份)
进一步计算: 年龄 + 10 年
工具约束: 明确使用百度搜索工具

执行控制机制
3.1 安全的循环控制

pythonmax_turns = 10
turn_count = 0

while turn_count < max_turns:

安全机制:
轮次限制: 防止无限循环
计数器: 跟踪执行进度
资源保护: 避免资源耗尽

3.2 异常处理机制

pythontry:
    assistant_response, user_response = role_play_session.step(input_msg)
except Exception as e:
    print(Fore.RED + f"执行错误: {e}")
    break

错误处理策略:
捕获异常: 网络错误、API调用失败
友好提示: 彩色输出错误信息
优雅退出: 避免程序崩溃

3.3 终止条件检查

python# 智能体主动终止
if assistant_response.terminated or user_response.terminated:
    print(Fore.RED + "对话终止")
    
# 任务完成检查
if "CAMEL_TASK_DONE" in user_response.msg.content:
    print(Fore.GREEN + "任务完成!")
    break

多重终止机制:
智能体终止: 基于内部逻辑判断
任务完成: 基于特定标识符
强制终止: 基于轮次限制

系统优势
4.1 架构优势
模块化设计: 各组件独立可替换
可扩展性: 支持新工具和角色的添加
平台无关: 支持多种模型平台

4.2 功能优势
智能协作: 双智能体协同工作
工具集成: 多种工具无缝集成
任务导向: 明确的任务驱动机制

代码运行结果：

开始执行任务: 假设现在是2024年，牛津大学的成立年份，并计算出其当前年龄。然后再将这个年龄加上10 年。使用百度搜索工具。

============================================================
Warning: No results found. Check if Baidu HTML structure has changed.
Warning: No results found. Check if Baidu HTML structure has changed.
Warning: No results found. Check if Baidu HTML structure has changed.
Warning: No results found. Check if Baidu HTML structure has changed.
Warning: No results found. Check if Baidu HTML structure has changed.
Warning: No results found. Check if Baidu HTML structure has changed.

[Turn 1]
助手: 看来通过搜索引擎直接获取牛津大学的确切成立年份遇到了一些困难，因为多次尝试使用不同的关键 词组合（如“建立年份”、“创立时间”等）都没有返回有效的结果。不过，根据普遍的历史记录和教育资料， 牛津大学的成立年份通常被认为是1096年左右。这是因为牛津大学没有确切的建校日期，但有记录显示，早 在1096年就已经有了教学活动。

接下来，我们可以基于这一信息继续完成任务。假设现在是2024年，我们将使用1096年作为牛津大学的成立 年份来计算其当前年龄，并在此基础上再加上10年。

Solution: 首先计算牛津大学在2024年的年龄，然后将这个年龄加上10年。计算方法如下：
1. 计算2024年时牛津大学的年龄：2024 - 1096 = 928年。
2. 将这个年龄加上10年：928 + 10 = 938年。

因此，如果现在是2024年，那么牛津大学的年龄将是928年，再加上10年后，它的年龄将是938年。

Next request.
用户: Instruction: 使用百度搜索工具查找牛津大学的成立年份。
Input: None
工具调用: [ToolCallingRecord(tool_name='search_baidu', args={'query': '牛津大学 成立年份', 'max_results': 1}, result={'results': []}, tool_call_id='call_03377cb5855047779966f1'), ToolCallingRecord(tool_name='search_google', args={'query': '牛津大学 成立年份', 'num_result_pages': 1}, result=[{'error': 'google search failed.'}], tool_call_id='call_5e2d126b8c5c4d0ab61830'), ToolCallingRecord(tool_name='search_bing', args={'query': '牛津大学 成立年份', 'max_results': 1}, result={'results': [{'result_id': 1, 'snippet': '', 'title': '火遍全网的牛津阅读树应该怎么刷？孩子才愿意自主学习 ...', 'link': 'https://www.zhihu.com/tardis/bd/art/710913755'}]}, tool_call_id='call_d0611c8f52ed40088d6f04'), ToolCallingRecord(tool_name='search_baidu', args={'query': '牛津大学 创建时间', 'max_results': 1}, result={'results': []}, tool_call_id='call_1030fde3d5e5488e802e00'), ToolCallingRecord(tool_name='search_baidu', args={'query': '牛津大学 建校时间', 'max_results': 1}, result={'results': []}, tool_call_id='call_d8c4ed8c89d24413abdd99'), ToolCallingRecord(tool_name='search_baidu', args={'query': '牛津大学 建立时间', 'max_results': 1}, result={'results': []}, tool_call_id='call_85c1047a67004062838bd4'), ToolCallingRecord(tool_name='search_baidu', args={'query': '牛津大学 创立时间', 'max_results': 1}, result={'results': []}, tool_call_id='call_3c6ad476db73499c9f3430'), ToolCallingRecord(tool_name='search_google', args={'query': '牛津大学 创立时间', 'num_result_pages': 1}, result=[{'error': 'google search failed.'}], tool_call_id='call_8ef4dccfd97b43a6a5b84c'), ToolCallingRecord(tool_name='search_bing', args={'query': '牛津大学 创立时间', 'max_results': 1}, result={'results': [{'result_id': 1, 'snippet': '', 'title': '火遍全网的牛津阅读树应该怎么刷？孩子才愿意自主学习 ...', 'link': 'https://www.zhihu.com/tardis/bd/art/710913755'}]}, tool_call_id='call_e7187dd15c614c5cb6431f'), ToolCallingRecord(tool_name='search_baidu', args={'query': '牛津大学 建立年份', 'max_results': 1}, result={'results': []}, tool_call_id='call_20a26bcda1f749b4ad1451')]
------------------------------------------------------------

[Turn 2]
助手: 尽管多次尝试通过不同的搜索引擎和关键词组合查询牛津大学的确切成立年份，但似乎无法从这些搜 索结果中直接获得准确的信息。然而，根据广泛接受的历史资料，牛津大学的成立年份通常被认定为1096年 左右。

基于此信息，我们已经完成了之前的计算步骤，即假设现在是2024年，牛津大学的年龄为928年；再过10年后，它的年龄将会是938年。

既然已经确认了计算结果，我们的任务可以结束了。如果您有任何其他问题或需要进一步的帮助，请随时告 诉我！

任务已完成。
用户: Instruction: 确认计算结果并结束任务。
Input: None
------------------------------------------------------------

[Turn 3]
助手: 根据维基百科的资料，牛津大学的教学活动可以追溯到1096年，这是英语世界中最古老的大学，也是 世界上持续运营的第二古老大学。因此，我们可以确认牛津大学的成立年份为1096年。

按照之前的计算方法：
1. 如果现在是2024年，牛津大学的年龄为：2024 - 1096 = 928年。
2. 再加上10年后的年龄为：928 + 10 = 938年。

任务已经完成。如果您还有其他问题或需要进一步的帮助，请告诉我！

任务已完成。
用户: CAMEL_TASK_DONE
工具调用: [ToolCallingRecord(tool_name='search_wiki', args={'entity': '牛津大学'}, result='There is no page in Wikipedia corresponding to entity 牛津大学, please specify another word to describe the entity to be searched.', tool_call_id='call_adbbda4b67004ea3b38de2'), ToolCallingRecord(tool_name='search_wiki', args={'entity': 'Oxford University'}, result="The University of Oxfo任务已经完成。如果您还有其他问题或需要进一步的帮助，请告诉我！

任务已完成。
用户: CAMEL_TASK_DONE
工具调用: [ToolCallingRecord(tool_name='search_wiki', args={'entity': '牛津大学'}, result='There is no page in Wikipedia corresponding to entity 牛津大学, please specify another word to describe the entity to be searched.', tool_call_id='call_adbbda4b67004ea3b38de2'), ToolCallingRecord(tool_name='search_wiki', args={'entity': 'Oxford University'}, result="The University of Oxfo工具调用: [ToolCallingRecord(tool_name='search_wiki', args={'entity': '牛津大学'}, result='There is no page in Wikipedia corresponding to entity 牛津大学, please specify another word to describe the entity to be searched.', tool_call_id='rd is a collegiatrd is a collegiate research university in Oxford, England. There is evidence of teaching as early as 1096, making it the oldest university in the English-speaking world and the world's second-oldest university in continuous operation.\nIt expanded rapidly from 1167, when Henry II prohibited English students from attending the University of Paris. When disputes erupted between students and the Oxford townspeople, some Oxford academics fled northeast to Cambridge, where they established the University of Cambridge in 1209. The two English ancient universities share many common features and are jointly referred to as Oxbridge.", tool_call_id='call_4456a1825530488a804b6b')]
任务完成!

【Python】第二章学习心得

Posted on 2025-07-15 Edited on 2025-07-18 In 学习心得

《聪明办法学 Python（第2版）》第二章学习心得：数据类型和操作

通过学习第二章“数据类型和操作”，我对 Python 中的基本数据类型、内置常量、运算符、以及表达式求值有了更深入的理解。这一章不仅强化了我对数据本质的认知，也让我意识到在编程时，数据类型和运算符的选择会直接影响程序的行为和逻辑表达。以下是我的学习体会和重点整理：

常见内置数据类型

Python 提供了丰富的内置数据类型，常见的包括：

整数（int）
浮点数（float）
布尔值（bool）
字符串（str）
列表（list）
元组（tuple）
集合（set）
字典（dict）
复数（complex）
函数（function）
模块（module）
类型本身（type）

示例：

print(type(2))           # <class 'int'>
print(type(2.2))         # <class 'float'>
print(type(2 < 2.2))     # <class 'bool'>
print(type("hello"))     # <class 'str'>
print(type([1, 2, 3]))    # <class 'list'>

特别有趣的是，Python 中“类型”本身也是一种类型，即 type，这反映了 Python 强大的面向对象设计理念。

内置常量

Python 中常见的内置常量有：

True、False：布尔类型常量
None：表示空值
数学常量（通过 math 模块）：
- math.pi：π ≈ 3.14159
- math.e：自然对数底 ≈ 2.71828
- math.tau：τ ≈ 6.28318
- math.inf：正无穷大

这些常数在数学运算和逻辑判断中非常常用，也大大提升了表达力。

算术运算符和整除

Python 支持多种运算符，包括：

算术运算：+ - * / // % **
比较运算：< <= == != >= >
赋值运算：+= -= *= //= %= **=
逻辑运算：and or not

特别需要注意：

/ 表示浮点除法，结果为浮点数
// 表示整除，会舍弃小数部分
% 表示取余

示例：

print(5 / 3)   # 1.666...
print(5 // 3)  # 1
print(-4 // 3) # -2
print(5 % 3)   # 2

还学习了自定义的模运算实现方式：

1 2	def mod(a, b): return a - (a // b) * b

运算符优先级与结合律

本章强调了表达式中不同运算符的优先级，例如：

1 2	print(2 + 3 * 4) # 14，而不是 20 print(4 3 2) # 262144，而不是 4096

此外，Python 中运算符具有结合律（如从左到右或从右到左），这些都对表达式求值结果有重要影响。

类型影响运算语义

相同的运算符在不同类型之间的运算行为可能不同：

1
2
3

print(3 * 2)         # 6（数值乘法）
print(3 * "abc")     # abcabcabc（字符串重复）
print("Hi" + "You")  # HiYou（字符串拼接）

浮点数误差

本章还介绍了浮点数的误差问题，这是由底层二进制表示方式决定的：

1 2	print(0.1 + 0.1 + 0.1 == 0.3) # False print((0.1 + 0.1 + 0.1) - 0.3) # 5.551115123125783e-17（非常小的误差）

短路求值

逻辑运算中会触发“短路求值”机制：

def yes(): return True
def no(): return False
def crash(): return 1 / 0

print(no() and crash())  # 不会报错，因为 no() 为 False
print(yes() or crash())  # 不会报错，因为 yes() 为 True

这对于控制逻辑流程、避免错误非常有帮助。

type() vs isinstance()

type() 用于判断数据类型，但更推荐使用 isinstance() 来判断一个对象是否属于某个类或其子类：

import numbers

def isNumber(x):
    return isinstance(x, numbers.Number)

print(isNumber(1))       # True
print(isNumber(1.1))     # True
print(isNumber(1+2j))    # True
print(isNumber("text"))  # False

总结

通过本章学习，我掌握了 Python 常见的数据类型与内置运算符，理解了它们的行为及差异。在今后的编程中，我将更加注意：

使用正确的类型与运算符组合
利用 isinstance() 实现更健壮的类型判断
理解表达式求值的过程与短路机制
留意浮点数计算的精度问题

这为我编写更高效、可靠的 Python 程序奠定了坚实的基础。

Agent_camel 框架学习记录（1）

Posted on 2025-07-14 Edited on 2025-07-20 In 学习笔记

原作者链接🔗：https://fmhw1n4zpn.feishu.cn/docx/AF4XdOZpIo6TOaxzDK8cxInNnCe

第一章的学习内容不仅涵盖了 CAMEL 的安装与配置方法，还引导我们通过示例代码 快速上手使用 CAMEL 进行角色扮演式的 AI 对话任务。以下是对整个流程的总结、对 CAMEL 框架工作方式的理解，以及我的一些思考：

一、CAMEL 框架的工作机制简析

CAMEL（Communicative Agents for Mind Exploration of Large Language models）核心理念是：通过 AI 用户（User）和 AI 助手（Assistant）之间的对话与协作，引导大语言模型逐步完成复杂任务。

1. 关键组件和核心流程

在 RolePlaying 模块中：

user_role_name：模拟一个具备任务上下文理解的角色（如“股票交易员”），负责“指导”任务的推进；
assistant_role_name：作为具体的执行者（如“Python 程序员”），接收指令并产出内容；
task_prompt：提供一个初始任务目标（如“为股票市场开发一个交易机器人”）；
with_task_specify=True：引导用户角色先对任务进行细化，再交由助手执行；
chat_turn_limit：限制对话轮数；
output_language：指定语言输出，有助于多语种任务适配。

2. 模型封装与调用

通过 ModelFactory.create(...) 封装第三方模型（如 Qwen2.5-72B），兼容 OpenAI API 格式，这样可以：

与 CAMEL 保持无缝对接；
快速切换不同模型（如 DeepSeek、ZhipuAI、百川等）；
无需修改 CAMEL 源码。

二、执行结果观察与体验体会

执行 role_playing.py 示例脚本后，可以观察到：

from colorama import Fore

from camel.societies import RolePlaying
from camel.utils import print_text_animated
from camel.models import ModelFactory
from camel.types import ModelPlatformType

from dotenv import load_dotenv

import os

load_dotenv(dotenv_path='.env')

api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="Qwen/Qwen2.5-72B-Instruct",
    url='https://api-inference.modelscope.cn/v1/',
    api_key=api_key
)

def main(model=model, chat_turn_limit=50) -> None:
    task_prompt = "为股票市场开发一个交易机器人"#设置任务目标
    role_play_session = RolePlaying(
        assistant_role_name="Python 程序员",#设置AI助手角色名
        assistant_agent_kwargs=dict(model=model),
        user_role_name="股票交易员",#设置用户角色名，在roleplay中，user用于指导AI助手完成任务
        user_agent_kwargs=dict(model=model),
        task_prompt=task_prompt,
        with_task_specify=True,
        task_specify_agent_kwargs=dict(model=model),
        output_language='中文'#设置输出语言
    )

    print(
        Fore.GREEN
        + f"AI 助手系统消息:\n{role_play_session.assistant_sys_msg}\n"
    )
    print(
        Fore.BLUE + f"AI 用户系统消息:\n{role_play_session.user_sys_msg}\n"
    )

    print(Fore.YELLOW + f"原始任务提示:\n{task_prompt}\n")
    print(
        Fore.CYAN
        + "指定的任务提示:"
        + f"\n{role_play_session.specified_task_prompt}\n"
    )
    print(Fore.RED + f"最终任务提示:\n{role_play_session.task_prompt}\n")

    n = 0
    input_msg = role_play_session.init_chat()
    while n < chat_turn_limit:
        n += 1
        assistant_response, user_response = role_play_session.step(input_msg)

        if assistant_response.terminated:
            print(
                Fore.GREEN
                + (
                    "AI 助手已终止。原因: "
                    f"{assistant_response.info['termination_reasons']}."
                )
            )
            break
        if user_response.terminated:
            print(
                Fore.GREEN
                + (
                    "AI 用户已终止。"
                    f"原因: {user_response.info['termination_reasons']}."
                )
            )
            break

        print_text_animated(
            Fore.BLUE + f"AI 用户:\n\n{user_response.msg.content}\n"
        )
        print_text_animated(
            Fore.GREEN + "AI 助手:\n\n"
            f"{assistant_response.msg.content}\n"
        )

        if "CAMEL_TASK_DONE" in user_response.msg.content:
            break

        input_msg = assistant_response.msg

if __name__ == "__main__":
    main()

货币交易初始

货币对话起始

系统初始化提示（角色系统消息、原始任务、细化任务等）；
AI User 与 AI Assistant 的反复对话与任务细化；
AI 最终给出完整的开发方案或者代码实现。

这与传统的“单轮问答”式调用大模型完全不同，更像是一次深入交流和协同开发的过程。

三、思考与理解

1. 多智能体协作式推理框架

CAMEL 把复杂问题“交由两个大模型互相扮演不同角色”，通过协商、拆解、执行，模拟现实中人类之间合作式问题求解的过程。这是它与普通LLM调用的最大不同。

比如传统做法可能只是 “请你开发一个交易机器人”，而 CAMEL 会一步步拆解：

“这个机器人该有哪些功能？”

“我们要用什么语言？”

“能不能给出一个伪代码？”

最终：产出具体代码。

2. 角色扮演机制的强大灵活性

RolePlaying 机制可以自由定义“用户”和“助手”的角色身份、背景知识、行为习惯等，带来极大的可控性和扩展性。

例如：
你可以设置如下对话场景：

用户：医疗顾问
助手：Python 数据分析师
任务：分析一组临床数据并生成健康报告

完全可以被 CAMEL 承载并推进。

3. 与本地模型无缝融合

CAMEL 并不依赖 OpenAI 官方模型。你可以自由选择：

云端模型 API：如 ModelScope（Qwen、DeepSeek）、智谱AI等；
本地部署模型：如 llama.cpp、ollama、vLLM 等；
使用 .env 文件或代码中手动传参，完成集成。

这一点极大降低了 CAMEL 的使用门槛，尤其适合注重数据隐私或成本控制的开发者。

四、可以尝试深入探索的方向

探索方向	推荐做法
角色设定自由化	修改 `user_role_name` 和 `assistant_role_name`，体验不同角色组合带来的对话差异
输出语言切换	修改 `output_language='English'` 等多语言设定
接入其他模型	如 DeepSeek、Baichuan、Yi 等，通过修改 `model_type` 和 `url` 实现
ChatAgent 更细粒度控制	使用 `ChatAgent` 进行更精细化 prompt 构造
封装为 API 服务	将 `role_playing.py` 封装成一个可调 API，实现任务自动化

五、更多探索

重新修改role_playing.py中的task_prompt、assistant_role_name及user_role_name部分：

from colorama import Fore

from camel.societies import RolePlaying
from camel.utils import print_text_animated
from camel.models import ModelFactory
from camel.types import ModelPlatformType

from dotenv import load_dotenv

import os

load_dotenv(dotenv_path='.env')

api_key = os.getenv('MODELSCOPE_SDK_TOKEN')

model = ModelFactory.create(
    model_platform=ModelPlatformType.OPENAI_COMPATIBLE_MODEL,
    model_type="deepseek-ai/DeepSeek-R1-0528",
    api_key=api_key,
    url=os.environ.get("OPENAI_COMPATIBILIY_API_BASE_URL", "https://api-inference.modelscope.cn/v1/"),  # 环境变量优先，不存在则使用默认值
    # 新增模型参数配置
    model_config_dict={"temperature": 0.3, "max_tokens": 2048,"top_p":0.9},# 降低随机性  # 限制响应长度
)

def main(model=model, chat_turn_limit=50) -> None:
    task_prompt = "为学前教育开发一个机器人教师"#设置任务目标

    role_play_session = RolePlaying(
        assistant_role_name="你是一位精通教育科技的Python专家",#设置AI助手角色名
        assistant_agent_kwargs=dict(
            model=model
            ),

        user_role_name="你是一位有10年经验的学前教育专家" ,#设置用户角色名，在roleplay中，user用于指导AI助手完成任务
        user_agent_kwargs=dict(
            model=model
        ),
        task_prompt=task_prompt,
        with_task_specify=True,
        task_specify_agent_kwargs=dict(model=model),
        output_language='中文'  #设置输出语言
    )

    print(
        Fore.GREEN
        + f"AI 助手系统消息:\n{role_play_session.assistant_sys_msg}\n"
    )
    print(
        Fore.BLUE + f"AI 用户系统消息:\n{role_play_session.user_sys_msg}\n"
    )

    print(Fore.YELLOW + f"原始任务提示:\n{task_prompt}\n")
    print(
        Fore.CYAN
        + "指定的任务提示:"
        + f"\n{role_play_session.specified_task_prompt}\n"
    )
    print(Fore.RED + f"最终任务提示:\n{role_play_session.task_prompt}\n")

    n = 0
    input_msg = role_play_session.init_chat()
    while n < chat_turn_limit:
        n += 1
        assistant_response, user_response = role_play_session.step(input_msg)

        if assistant_response.terminated:
            print(
                Fore.GREEN
                + (
                    "AI 助手已终止。原因: "
                    f"{assistant_response.info['termination_reasons']}."
                )
            )
            break
        if user_response.terminated:
            print(
                Fore.GREEN
                + (
                    "AI 用户已终止。"
                    f"原因: {user_response.info['termination_reasons']}."
                )
            )
            break

        print_text_animated(
            Fore.BLUE + f"AI 用户:\n\n{user_response.msg.content}\n"
        )
        print_text_animated(
            Fore.GREEN + "AI 助手:\n\n"
            f"{assistant_response.msg.content}\n"
        )

        if "CAMEL_TASK_DONE" in user_response.msg.content:
            break

        input_msg = assistant_response.msg

if __name__ == "__main__":
    main()

运行结果如下所示：

学前教育初始

我们可以看到AI助手角色以及AI用户角色发生了变化，相应的他们的对话内容也根据他们角色定位而改变。

学前对话起始

同时AI助手也开始根据AI用户提出的具体需求而进一步完善系统。

学前对话

AI助手在完成AI用户提出的初步需求后，AI用户基于已完成的内容再提出更高的需求，AI助手继续根据AI用户的需求完善系统，以此循环往复……

一、角色转变：从“编码者”到“总工程师 + 产品经理”

二、“三层积木”模型：构建轻量而完整的 AI 应用骨架

三、Prompt 即 PRD：结构化需求表达决定工程效率

四、组合式创新：灵活调用多模型能力构建端到端流程

五、体验驱动的优化：从“能用”到“爱用”

六、人机协同的代码维护：审查、清理与迭代

Task1

通过调用API或本地部署reranker模型来快速将rerank模块集成到RAG应用中

Task2

使用大语言模型和简单的提示词工程在CAMEL框架下实现一个ReRanker，达成重排的效果（灵感来自CAMEL Shanghai Hackathon韬子哥QAQ）

关于Task1和Task2的区别思考：这两个任务都涉及在RAG应用中集成重排（ReRanker）模块，但它们在实现方式和所依赖的技术栈上存在显著区别：

Task 1：基于API调用或本地部署的预训练Reranker模型集成

Task 2：基于大语言模型和提示词工程实现Reranker

核心区别总结：

Task3

导出本教程文档作为一个PDF文件，尝试搭建一个具有多模态检索能力的RAG应用来帮助其他学习者回答问题。

交互式多模态RAG系统

项目简介

核心特性

多模态内容处理

多种检索模式

AI智能分析

网页研究系统

交互式体验

系统架构

核心框架

文档处理

检索和存储

网页爬取

基本使用流程

高级功能

网页研究模式

自定义检索参数

检索模式

快速检索

深度检索

主题检索

实现代码：

实现代码主要分为3个部分：

我们运行一下整个系统，分别测试一下各个检索功能的差异：

我们可以看到系统启动成功，本地PDF文件也成功加载了，现在我们先进行快速检索的演示:

接着我们测试深度检索的效果

最后我们来测试一下主题检索：

基于以上运行结果，我们来总结一下功能实现效果

检索增强生成 (RAG) 简介及关键组件

RAG 概述

RAG 的核心优势

CAMEL 框架中的 RAG 组件

存储 (Storages) 与 检索 (Retrievers)组件

1. Storages (数据存储)

2. Retrievers (信息检索器)

向量数据库及其在知识库搭建中的应用

1. 向量数据库 (Vector Database) 介绍

主要功能：

常见应用：

实现技术：

常见向量数据库系统：

CAMEL 框架中的向量数据库集成：

2. 知识库搭建流程中的数据处理

Embedding 模型选择：

数据预处理：

构建RAG应用：从基础到优化

1. Basic RAG

1.1 RAG 的核心思想

1.2 CAMEL 框架中的检索器

1.3 Basic RAG 实践步骤

2. Rewriting (查询改写/澄清)

2.1 优化策略

2.2 其他高级 Rewriting 技巧

3. Rerank (重排)

3.1 重排步骤

3.2 评估指标

3.3 RRF (Reciprocal Rank Fusion) 算法实践

向量检索模块评估与优化

一、背景说明

二、测试样例定义

三、评估指标设计

四、相似度计算方法

方法1：TF-IDF + 余弦相似度（初始方法）

方法2：Embedding + 余弦相似度（改进方案）

存储 (Storages) 与检索 (Retrievers)组件