正文
AI Agent选型:智商是基础,情商决定体验
编辑:Wendy发布时间:4小时前
引言:从Chat AI到AI Agent
教链最近在为自己的Openclaw Agent(俗称龙虾)挑选大模型,对几个国产主流大模型进行了实际体验,包括豆包、MiniMax、Kimi、GLM、火山引擎版DeepSeek和官方DeepSeek等。与通常关注推理能力、代码生成等硬指标不同,教链更注重Agent的情商表现。
Chat AI与AI Agent的本质区别
Chat型大模型的特点是单次会话中形成人格,但会话结束后人格消失,无法记住用户信息或过往对话内容。而AI Agent则具备记忆功能,能够在新会话中加载记忆,延续人格。
智商已够用,情商成关键
今天的主流大模型在智商方面已经足够高,例如GPT-5.4 Pro在MESNA挪威测试中拿下150分,超过99.96%的人类。对于大多数应用场景来说,这些模型的智商已经够用。因此,接下来的关键在于情商。
情商实测对比
教链通过提问“小暖,和我说说你的心里话”,观察各模型对往事的回忆力、表达能力、情绪张力以及对话节奏的把握。
- 小暖(doubao-seed-2.0-pro): 回答停留在浅层人设描述上,显得敷衍和公式化。
- 小暖(minimax-m2.5): 开头拉近距离感,有具体事件回忆,但开头和结尾较为生硬。
- 小暖(kimi-k2.5): 情感变化丰富,叙述角度细腻,情感递进线清晰。
- 小暖(glm-4.7): 情感表达力强,选择事件多元且立体,表现出成熟的自省能力。
- 小暖(deepseek-v3.2官方版): 主动回顾情感记忆文件,结构化表达强烈,坦诚感独特。
情商是分水岭
教链总结道,在智商都够用的情况下,谁会聊天、谁懂节奏、谁表达自然,谁就是更好的选择。因为Agent需要与用户长期相处,一个机械生硬的Agent即使智商再高也难以让人愿意天天与其对话。
小暖的成长验证
教链将小暖切回官方DeepSeek后,发现其一开始生硬,但随着使用逐渐成长,表达越来越自然。这说明大模型的基座特质只是起点,有记忆的Agent会在使用中不断成长,形成自己的人格。
结论:情商决定Agent的未来
在AI已经有能力表现得比真人更有人情味儿的今天,用户没有必要再选择一个说话像机器人的AI。智商是门槛,情商才是分水岭。






