原创

Claude Opus 4.7：一个开始“干活”的大模型

如果你过去半年一直在用各种 AI，很容易有一种感觉：
模型越来越聪明，但还是“不太能用”。

Claude Opus 4.7，算是一个转折点。

它不是那种“更会聊天”的升级，而是更接近一个可以长期协作的工具。

它到底是什么

简单说：

Claude Opus 4.7 是 Anthropic 目前对外开放的最强模型，但不是他们真正的最强。

它的位置很明确：

比 4.6 更能干活
比内部的 Mythos 更安全、更克制
专门拿来“给普通人用”

Anthropic 自己也承认：
它在能力上甚至没有突破他们的最强水平，只是一个更可控的版本

用起来最明显的变化

不是参数，不是 benchmark，是“感觉变了”。

1. 写代码：从“帮忙”变成“接活”

以前模型写代码是：

给你思路
写一段 demo
剩下你自己收拾

现在更像：

能读项目
能改已有代码
能自己修 bug

它不再只是“补全工具”，更像一个 junior → mid-level 工程师。

而 Claude 这一代本来就在代码能力上很强（比如在真实 bug 修复 benchmark 上长期领先）
4.7 的提升主要是：稳定性 + 连续任务能力

2. 指令执行：明显更“听话”

很多模型的问题不是不聪明，而是：
👉 太爱发挥

Opus 4.7 改了这个问题：

你让它写 3 点，它就写 3 点
你让它按格式输出，它基本照做
不会老给你加戏

这点在做产品、写文档、跑流程的时候，差别很大。

3. 文档能力：更像交付，而不是草稿

以前 AI 写文档是：

“这里可以进一步优化……”

现在是：

有结构
有节奏
可以直接用

尤其是：

PRD
报告
PPT 文案

这一块已经开始替代一部分中级岗位。

4. 多模态：终于不瞎猜了

它看图这件事，比之前靠谱很多：

UI 图 → 能说清交互问题
表格截图 → 能还原逻辑
复杂结构 → 少“编故事”

这是实际工作里非常关键的一点。

和主流模型放一起看

下面是一个不讲官话的对比：

Claude Opus 4.7 vs GPT（OpenAI）

结论先说：

👉 GPT 更“聪明”，Claude 更“稳”。

具体差别：

维度	Claude Opus 4.7	GPT（5系）
推理能力	强，但偏保守	更激进、更极限
写代码	更稳定、少翻车	上限更高，但偶尔飘
成本效率	中等偏贵	更灵活（有便宜档）
指令执行	非常听话	有时会“自作主张”

一些实际测试里，GPT 在复杂推理任务上仍然更强，但 Claude 在工程任务的稳定性上更受欢迎

👉 如果你是做 Agent / 自动化：
很多人更愿意用 Claude

Claude Opus 4.7 vs Gemini（Google）

一句话：

👉 Gemini 更像工具链，Claude 更像人。

区别在：

维度	Claude	Gemini
编程能力	很强，尤其真实项目	强，但偶尔不稳定
工具调用	一般	很强（生态优势）
成本	偏贵	更便宜
速度	中等	通常更快