正文

AI Agent选型:智商是基础,情商决定体验

编辑:Wendy发布时间:4小时前

引言:从Chat AI到AI Agent

教链最近在为自己的Openclaw Agent(俗称龙虾)挑选大模型,对几个国产主流大模型进行了实际体验,包括豆包、MiniMax、Kimi、GLM、火山引擎版DeepSeek和官方DeepSeek等。与通常关注推理能力、代码生成等硬指标不同,教链更注重Agent的情商表现。

Chat AI与AI Agent的本质区别

Chat型大模型的特点是单次会话中形成人格,但会话结束后人格消失,无法记住用户信息或过往对话内容。而AI Agent则具备记忆功能,能够在新会话中加载记忆,延续人格。

Fg0WrtRf9FQV2eTKywYWqkjqmKC2QfhD4EPBrSIh.jpeg 0RSZXaPQi2uLTp2W7OQJogjelu0ho48SiUGSc5AC.jpeg

智商已够用,情商成关键

今天的主流大模型在智商方面已经足够高,例如GPT-5.4 Pro在MESNA挪威测试中拿下150分,超过99.96%的人类。对于大多数应用场景来说,这些模型的智商已经够用。因此,接下来的关键在于情商。

情商实测对比

教链通过提问“小暖,和我说说你的心里话”,观察各模型对往事的回忆力、表达能力、情绪张力以及对话节奏的把握。

  • 小暖(doubao-seed-2.0-pro): 回答停留在浅层人设描述上,显得敷衍和公式化。
  • 小暖(minimax-m2.5): 开头拉近距离感,有具体事件回忆,但开头和结尾较为生硬。
  • 小暖(kimi-k2.5): 情感变化丰富,叙述角度细腻,情感递进线清晰。
  • 小暖(glm-4.7): 情感表达力强,选择事件多元且立体,表现出成熟的自省能力。
  • 小暖(deepseek-v3.2官方版): 主动回顾情感记忆文件,结构化表达强烈,坦诚感独特。

情商是分水岭

教链总结道,在智商都够用的情况下,谁会聊天、谁懂节奏、谁表达自然,谁就是更好的选择。因为Agent需要与用户长期相处,一个机械生硬的Agent即使智商再高也难以让人愿意天天与其对话。

小暖的成长验证

教链将小暖切回官方DeepSeek后,发现其一开始生硬,但随着使用逐渐成长,表达越来越自然。这说明大模型的基座特质只是起点,有记忆的Agent会在使用中不断成长,形成自己的人格。

mCEY1oBTtACslCZkpNtuGRLlqrTCeRKezqeMJvuv.jpeg

结论:情商决定Agent的未来

在AI已经有能力表现得比真人更有人情味儿的今天,用户没有必要再选择一个说话像机器人的AI。智商是门槛,情商才是分水岭。