跳到主要内容

🪄 Agents

📄️ 🟡 API-Bank & AgentBench

模型评估是Agent学习过程中至关重要的一环。通过分析数据来评估Agent的能力,可以客观地衡量它在特定任务或领域中的表现。数据评估是不断迭代和改进的基础。通过反复评估和分析数据,Agent可以逐步改进自身,并不断优化其能力。数据评估还可以将Agent与其他Agent或标准进行比较,从而了解其在同一任务或领域中的相对能力。这有助于Agent了解自身在整个生态系统中的定位和竞争态势,明确进一步提升自身能力的目标。

📄️ 🟢 思考 Agent

OpenAI 发布了 ChatGPT 这个具有划时代意义的产品,有人说它堪比 “iphone” ,但OpenAI并不满足于此。他们希望成为 AI 时代的苹果公司。之前的 ChatGPT 插件引起了广泛关注,被称为ChatGPT的App Store时刻。然而,插件的影响力相对有限,无法与ChatGPT相提并论。相比之下,Agent 能带来更大的影响力,真正重塑现有的应用场景。它集成了LLM(大型语言模型)、记忆、规划技能和工具使用,展现了更广阔丰富的想象空间。OpenAI 现在将重点放在Agent上也就不难理解了。