AI 把程序员面试搞崩了:Anthropic 自己也得重写题库

CNN 说软件工程师的面试已经坏了——禁 AI 规则和岗位上离不开 AI 自相矛盾,连 Anthropic 都承认得重写自家技术题。

AI 把程序员面试搞崩了:Anthropic 自己也得重写题库

CNN 5 月 28 日那篇讲软件工程师面试现状的报道里,最诚实的一句话被埋在中段:Anthropic——这家产品就是「会写代码的 AI」的公司——不得不重写自家的技术面试题,因为应聘者拿 Claude 把题都做完了。卖作弊工具的,被自家工具反过来作弊了一遍。

这一条信息基本就是整个故事。

问题的形状

传统软件工程师面试就三关:电话筛选、Take-home 题、现场白板。三关都按「从空编辑器写代码」那个时代的假设搭出来的。但 2026 年的实际工作大半是「编辑 AI 写出来的代码」——把它接到大系统里、判断它哪里有 bug、决定下一步该让模型干什么。面试考的能力,跟岗位需要的能力,已经脱钩。

CNN 报道里的现状是:

  • 大多数公司还在跑传统流程——反转二叉树、最长子串、2014 年那一套算法题。
  • 越来越多公司直接禁用 AI。有些现在要求候选人在编程环节全程共享桌面,证明你没在第二台机器上跑 Cluely 这类协同作弊工具
  • 少数公司反向操作,明确允许用 AI——「让我们看你怎么用」,理由是:候选人怎么 prompt 和怎么修 AI 输出,才是这岗位真正要的本事。

这三种做法互相矛盾。一个候选人 2026 年面五家公司,相当于要切换五种不同的面试仪式,而且事前不知道这家是哪一种。

作弊数据

Fabric 调研了超过 5 万名候选人,发现现场面试用 AI 工具的比例半年翻了一倍多:2025 年 6 月 15%,到 12 月已经 35%。2026 年这条线必然继续往上走——今天的面试作弊工具,18 个月前都还不存在。Cluely 是最响的名字,背后还有一打类似产品。

Anthropic 静悄悄承认「得重写题库」是个最干净的信号:现有题已经过不了筛。Anthropic 的招聘团队对 Claude 能力的判断大概是地球上最准的,但 Claude 把他们自己的面试题做掉了。他们的题既然失效,别人的题也都失效。

「禁 AI」走不通

纯禁用方案——共享桌面、没有副驾、从零写——失败原因有两个。

第一,抓不到认真的作弊者HackerEarth 那份在线测评作弊向量调研把现代套路讲得很清楚:两台设备,一台跑共享桌面和考试,另一台笔记本或手机摄像头外跑 AI,候选人眼睛读答案、手敲进去。摄像头追踪、锁定浏览器、键盘生物特征,每一项部署上线几周后都有对应的破解。

第二,更要命的是,禁令本身和岗位需求自相矛盾。Salesforce 今年早些时候宣布 FY2026 完全不招新工程师,Benioff 的理由是 AI 编程工具已经让额外工程师变得多余——然后一个月后又宣布招 1,000 名应届「AI-native」新人进 Builder 项目,潜台词是「招你们是因为你们会用 AI」。Cloudflare 5 月 7 日宣布裁员 1,100的同一份内部备忘录里,公开了内部 AI 使用量三个月暴涨 600% 的数据。面试时禁 AI,入职第一天又要求用 AI,那面试考的能力候选人这辈子都用不上了。

有意思的解法

CNN 报道里和周边讨论中正在抬头的改革,是**「审计型」面试**:给候选人一段能跑但有缺陷的、AI 生成的代码,让 ta 找 bug、加固边界、对接一个临时 API、为自己的决策辩护。这考的恰好是 2026 年的真本事——对 AI 输出的推理能力——而且现场作弊很难,因为这一题的 bug 是当场生成的,网上查不到标准答案。

更激进的变种是对话式 AI 面试官:候选人和一个 AI agent 边说边推理,agent 实时追问,最后产出的是对话记录而不是代码。这种格式的作弊门槛很高——candidate 的副驾要在结构化追问下伪造端到端的推理过程,目前的工具做不到。

这两种思路目前都还不是主流。但 12 个月内会是,因为现行流程已经停止运转了。

这件事怎么撞进失业叙事

CNN 把这篇定位成招聘流程报道。劳动力市场后果是埋在底下的另一层。

2026 年 YTD 科技业裁员约 14.4832 万人、349 起公开事件,软件工程师是受冲击最严重的角色类别。入门级工程师岗位自 2023 年初下跌约 35%。还能挤进面试漏斗的候选人里,三分之一以上在用 AI 作弊,被抓的进招聘黑名单一辈子不录。

这不是「请大家学着用最新工具」的小摩擦。这是一个过去二十年主流白领职业的甄选基础设施停止工作的劳动力市场。剩下还能找工作的,被劈成两群:用 AI 通过测试的(可能被永久封)和没用 AI 的(可能因为上手不会用 AI 而无法被录用)。

面试是瓶颈。谁先把面试重写得好——Anthropic 这种被自家工具打脸到不得不公开认账的,至少在认真重写——谁就握住接下来十年工程师招聘的方向盘。

几个观察点

  • Anthropic 的新题库。等它泄露出来(一定会的),它就成了 2026 年的标准题集,就像谷歌当年那道「井盖为什么是圆的」成了 2000 年代的标准。
  • Cluely 的企业端转向。Cluely 和它的同类目前卖给候选人。有意思的拐点是:哪一家率先翻盘卖反作弊服务给那些被它工具攻破面试的公司。
  • 「允许用 AI」格式能不能跑通。诚实版本的现代工程师面试就是「让我们看你怎么和模型配合」。如果有三四家头部公司公开承诺这种格式,禁 AI 路线就输掉了这场辩论。

CNN 的标题是温和的:面试流程跟不上。但报道实际描述的状况要具体得多。面试坏了,候选人知道,公司知道,最有资格修它的那家公司已经先把自己那套修了。