AI 把工程師面試搞壞了:Anthropic 自己也得重寫題庫

CNN 說軟體工程師的面試已經壞了——禁 AI 規則和職位上離不開 AI 自相矛盾,連 Anthropic 都承認得重寫自家技術題。

AI 把工程師面試搞壞了:Anthropic 自己也得重寫題庫

CNN 5 月 28 日那篇講軟體工程師面試現況的報導裡,最誠實的一句話被埋在中段:Anthropic——這家產品就是「會寫程式的 AI」的公司——不得不重寫自家的技術面試題,因為應試者拿 Claude 把題目都做完了。賣作弊工具的,被自家工具反過來作弊了一輪。

這一條訊息,基本上就是整個故事。

問題的形狀

傳統軟體工程師面試就三關:電話篩選、Take-home 題、現場白板。三關都按「從空白編輯器寫程式」那個時代的假設搭出來的。但 2026 年的實際工作大半是「編輯 AI 寫出來的程式」——把它接到大系統裡、判斷它哪裡有 bug、決定下一步該讓模型做什麼。面試考的能力,跟職位需要的能力,已經脫鉤。

CNN 報導裡的現況是:

  • 多數公司還在跑傳統流程——反轉二元樹、最長子字串、2014 年那一套演算法題。
  • 越來越多公司直接禁用 AI。有些現在要求應試者在程式環節全程分享桌面,證明你沒在第二台機器上跑 Cluely 這類協同作弊工具
  • 少數公司反向操作,明確允許用 AI——「讓我們看你怎麼用」,理由是:應試者怎麼 prompt、怎麼修 AI 輸出,才是這職位真正要的本事。

這三種做法互相矛盾。一個應試者 2026 年面五家公司,等於要切換五種不同的面試儀式,而且事前根本不知道這一家是哪一種。

作弊數據

Fabric 調研了超過 5 萬名應試者,發現現場面試用 AI 工具的比例半年翻了一倍多:2025 年 6 月 15%,到 12 月已經 35%。2026 年這條線必然繼續往上走——今天的面試作弊工具,18 個月前還都不存在。Cluely 是最響的名字,後面還有一打類似產品。

Anthropic 靜悄悄承認「得重寫題庫」,是個最乾淨的訊號:現有題已經過不了篩。Anthropic 的招募團隊對 Claude 能力的判斷大概是地球上最準的,但 Claude 把他們自家的面試題做掉了。他們的題目既然失效,別人的題目也都失效。

「禁 AI」走不通

純禁用方案——分享桌面、不准副駕、從零寫——失敗原因有兩個。

第一,抓不到認真的作弊者HackerEarth 那份線上測評作弊向量調查把現代套路講得很清楚:兩台裝置,一台跑分享桌面跟考試,另一台筆電或手機在鏡頭外跑 AI,應試者眼睛讀答案、手敲進去。攝影機追蹤、鎖定瀏覽器、鍵盤生物特徵,每一項部署上線幾週後都有對應的破解。

第二,更要命的是,禁令本身和職位需求自相矛盾。Salesforce 今年初宣布 FY2026 完全不招新工程師,Benioff 的理由是 AI 編程工具已經讓額外工程師變得多餘——然後一個月後又宣布招 1,000 名應屆「AI-native」新人進 Builder 計畫,潛台詞是「招你們是因為你們會用 AI」。Cloudflare 5 月 7 日宣布裁員 1,100的同一份內部備忘錄裡,公開了內部 AI 使用量三個月暴漲 600% 的數據。面試時禁 AI、報到第一天又要求用 AI,那面試考的能力應試者這輩子都用不上了。

有意思的解法

CNN 報導和周邊討論裡正在抬頭的改革,是**「稽核型」面試**:給應試者一段能跑但有缺陷的、AI 生成的程式,讓他/她找 bug、加固邊界、對接一個臨時 API、為自己的決策辯護。這考的剛好是 2026 年的真本事——對 AI 輸出的推理能力——而且現場作弊很難,因為這一題的 bug 是當場生成的,網路上查不到標準答案。

更激進的變種是對話式 AI 面試官:應試者跟一個 AI agent 邊講邊推理,agent 即時追問,最後產出的是對話紀錄而不是程式。這種格式的作弊門檻很高——應試者的副駕要在結構化追問下偽造端到端的推理,目前的工具做不到。

這兩種路線目前都還不是主流。但 12 個月內會是,因為現行流程已經停止運轉了。

這件事怎麼撞進失業敘事

CNN 把這篇定位成招募流程報導。勞動力市場後果是埋在底下的另一層。

2026 年 YTD 科技業裁員約 14.4832 萬人、349 起公開事件,軟體工程師是受衝擊最嚴重的職位類別。入門級工程師職缺自 2023 年初下跌約 35%。還能擠進面試漏斗的應試者裡,三分之一以上在用 AI 作弊,被抓的進招募黑名單一輩子不錄。

這不是「請大家學著用最新工具」的小摩擦。這是一個過去二十年主流白領職業的甄選基礎設施停止運作的勞動力市場。剩下還能找工作的,被劈成兩群:用 AI 通過測試的(可能被永久封)和沒用 AI 的(可能因為實務上不會用 AI 而無法被錄用)。

面試是瓶頸。誰先把面試重寫得好——Anthropic 這種被自家工具打臉到不得不公開認帳的,至少在認真重寫——誰就握住接下來十年工程師招募的方向盤。

幾個觀察點

  • Anthropic 的新題庫。等它流出來(一定會的),它就成了 2026 年的標準題集,就像 Google 當年那題「人孔蓋為什麼是圓的」成了 2000 年代的標準。
  • Cluely 的企業端轉向。Cluely 和它的同類目前賣給應試者。有趣的拐點是:哪一家率先翻盤賣反作弊服務給那些被它工具攻破面試的公司。
  • 「允許用 AI」格式能不能跑通。誠實版本的現代工程師面試就是「讓我們看你怎麼跟模型配合」。如果有三、四家頭部公司公開承諾這種格式,禁 AI 路線就輸掉了這場辯論。

CNN 的標題很溫和:面試流程跟不上。但報導實際描述的狀況要具體得多。面試壞了,應試者知道,公司知道,最有資格修它的那家公司已經先把自己那套修了。