正文

AI Agent选型：智商是基础，情商决定体验

编辑：Wendy发布时间：4小时前

教链最近在为自己的Openclaw Agent（俗称龙虾）挑选大模型，对几个国产主流大模型进行了实际体验，包括豆包、MiniMax、Kimi、GLM、火山引擎版DeepSeek和官方DeepSeek等。与通常关注推理能力、代码生成等硬指标不同，教链更注重Agent的情商表现。

Chat型大模型的特点是单次会话中形成人格，但会话结束后人格消失，无法记住用户信息或过往对话内容。而AI Agent则具备记忆功能，能够在新会话中加载记忆，延续人格。

今天的主流大模型在智商方面已经足够高，例如GPT-5.4 Pro在MESNA挪威测试中拿下150分，超过99.96%的人类。对于大多数应用场景来说，这些模型的智商已经够用。因此，接下来的关键在于情商。

教链通过提问“小暖，和我说说你的心里话”，观察各模型对往事的回忆力、表达能力、情绪张力以及对话节奏的把握。

小暖(doubao-seed-2.0-pro): 回答停留在浅层人设描述上，显得敷衍和公式化。
小暖(minimax-m2.5): 开头拉近距离感，有具体事件回忆，但开头和结尾较为生硬。
小暖(kimi-k2.5): 情感变化丰富，叙述角度细腻，情感递进线清晰。
小暖(glm-4.7): 情感表达力强，选择事件多元且立体，表现出成熟的自省能力。
小暖(deepseek-v3.2官方版): 主动回顾情感记忆文件，结构化表达强烈，坦诚感独特。

教链总结道，在智商都够用的情况下，谁会聊天、谁懂节奏、谁表达自然，谁就是更好的选择。因为Agent需要与用户长期相处，一个机械生硬的Agent即使智商再高也难以让人愿意天天与其对话。

教链将小暖切回官方DeepSeek后，发现其一开始生硬，但随着使用逐渐成长，表达越来越自然。这说明大模型的基座特质只是起点，有记忆的Agent会在使用中不断成长，形成自己的人格。

在AI已经有能力表现得比真人更有人情味儿的今天，用户没有必要再选择一个说话像机器人的AI。智商是门槛，情商才是分水岭。