Figure 03 對戰實習生Aime,5月17日:人類以12,924比12,732贏下10小時分揀賽——勝負差就是192個包裹、平均每箱2.79秒對2.83秒——加州勞動法強制的用餐與休息時間是全部差距——Aime左前臂「基本上廢了」,機器人編隊已連續運行116小時,Adcock:「這是人類最後一次贏」

Figure AI讓一名實習生跟一隊Figure 03對幹10小時。人類贏了192個包裹。機器人沒有休息、沒有起水泡的手指,到第116個小時還在幹。

Figure 03 對戰實習生Aime,5月17日:人類以12,924比12,732贏下10小時分揀賽——勝負差就是192個包裹、平均每箱2.79秒對2.83秒——加州勞動法強制的用餐與休息時間是全部差距——Aime左前臂「基本上廢了」,機器人編隊已連續運行116小時,Adcock:「這是人類最後一次贏」

5月17日星期日,Figure AI執行長Brett Adcock辦了一場10小時的包裹分揀對戰——一邊是名字叫Aime的實習生,另一邊是自5月13日就在不間斷運行的Figure 03機器人編隊。同一條輸送帶,同樣的任務——讀條碼、抓起箱子、面朝下放到輸送帶上。帳面上同樣的班次時長。

人類贏了。差距是10個小時裡多分揀了192個包裹。這個人類的手指起了水泡,左前臂被他自己形容為「基本上廢了」。Adcock在X上貼出最終比分的那條貼文用了一句標題黨都在等的話:「這是人類最後一次贏。」

這句話用在Figure的投資人簡報裡很合適。但它也遮住了這場測試到底證明了什麼。

數字

指標Aime(人類)Figure 03編隊差值
10小時累計包裹數12,92412,732人類+192
每個包裹平均秒數2.792.83人類快0.04秒
加州法定用餐時間30分鐘0
加州法定休息時間2 × 10分鐘0
機械/身體故障1(左前臂)0
截至目前的連續運行時長10小時116小時49分鐘
直播以來累計輸出145,320個包裹

頭條數字是「人類12,924對12,732獲勝」。結構性的數字是「10小時差192個包裹、每箱差0.04秒」。真正的套利是人類必須按加州法律拿走的50分鐘法定用餐與休息時間——而機器人不用。把休息時間剔掉之後,每分鐘有效工作的吞吐量已經倒在機器人那一邊。把休息時間留著,人類贏的幅度不到1%。

Helix-02為了縮進0.04秒做了什麼

Figure 03編隊跑的是Helix-02——Figure的端到端視覺-語言-動作模型,輸入是原始相機像素、輸出是馬達指令,沒有任何中間的腳本化抓取與放置邏輯。讓整個分揀單元看起來像一個永不間斷的工人,靠的是電池熱插拔輪換協定:Bob的電量掉到20%時,Frank直接補位,輸送帶的節拍不間斷。所謂「編隊」是個用工抽象,而不是硬體抽象——背後是五台實體機(Bob、Frank、Gary、Rose、Jim)在一個工位前輪班,正好是這一隊公司希望未來倉庫經理理解「人形勞動力數」的方式。

結果裡有兩件事值得標出來。

第一件是峰值與累計曲線的形狀。Aime的前三小時明顯比2.79秒快——Adcock以前展示過人類在前九十分鐘能跑到大約2.4秒。把整輪算下來的2.79秒,反映的是人類標準的疲勞曲線:到第七、八、九小時被拖下來,再在收尾的一小時小幅回彈。Figure 03的節拍在十小時裡是平的。機器人優化的不是峰值速度,是一致性。

第二件是失效模式。Aime左前臂「基本上廢了」,按勞災補償的口徑,通常屬於慢性損傷索賠而不是急性傷害。這場比賽把倉庫地板上幾週的累積暴露壓縮進了一個班次。同一窗口裡、以及直播至今已經累積的116小時連續運行裡,Figure 03編隊沒有任何機械故障。在人類把自己前臂幹廢的臨界點上,機器人運行得像還沒開始上班。

勞動法漏洞,換個說法再說一次

這場測試裡最容易被這一隊公司悄悄吸收的事實,是哪一方需要法律保護。

Aime拿到30分鐘用餐和兩個10分鐘的休息,因為加州勞動法說他必須拿。Figure 03拿到0次休息,因為人形機器人的休息權法律框架還不存在。192個包裹的差距,從經營口徑看就是「法律保護溢價」——一個人類工人因為有身體、受工資工時法管轄,被允許保留的吞吐量。

這個結果不可推廣的部分就在這裡。換到休息規則更寬鬆的州——德州、佛州、大多數非工會部署——同樣的對抗、同樣的人類、同樣的身體狀況,能打成平手都算樂觀,第二天班次上Aime的前臂恢復不過來時機器人就贏了。「這是人類最後一次贏」這句話其實跟下一次10小時測試沒多大關係。它真正問的是:Figure 03下一次落地的工位,到底在不在一個還保護工人休息權的轄區。

這場測試沒有證明的事

這是一場透明度滿滿的行銷動作——Adcock自己說了「我們閒得無聊」——在這個口徑上是成立的。機器人編隊在跟人類可比的全程審視下沒有出過故障、跑的是相同的工作流、並且是在現場觀眾面前完成的。

但有三件事這場測試刻意沒有測,而它們恰好是倉庫經理真正在買的東西。

第一是任務切換。兩邊在整整10小時裡跑的是同一個、預載入好的、單一技能的工作流。這一隊公司在真實部署裡反覆被卡住的環節,恰恰是改任務的成本——從「抓包裹平放輸送帶」切換到「從大箱裡挑零件裝套件」,要嘛需要一個新的Helix-02提示和驗證循環、要嘛需要人類介入。Aime被重新指派到一個新任務大概只要30秒。Figure 03做不到。

第二是錯誤模式。Helix-02已經展示過在分揀單一場景下的24/7全自主運行。這10小時裡沒記錄的,是邊緣案例的失敗率——包裝破損、條碼貼錯、密度不均的混裝箱要重新規劃抓取方案——這部分倉庫現在仍嚴格依賴Aime,也是下一個Helix迭代要解決的部分。

第三是經濟帳。Adcock會用機器人即服務(RaaS)的口徑,把一台工業人形機器人的時薪報到接近低端倉庫工人的工資水準。這次測試沒有把真實的成本架構攤出來——資本支出、充電基礎設施、Helix迭代的工程師工時、監督機器人的人類——這些東西買方必須吸收。BMW Spartanburg那個開了11個月、生產了30,000輛X3的試點才更接近真實世界的這筆帳。10小時分揀賽是為轉發優化過的版本。

把這件事放回整條隊列裡

我們追蹤的AI裁員週期的「物理證據」層現在自己也在出節奏——Figure的直播、Schaeffler跟Humanoid公司簽下的數千台部署單豐田加拿大的七台Digit、現代汽車宣稱2028年在喬治亞州年產30,000台Atlas——模式都很一致。頭條是一場透明度極高的展示,展示真正在賣的,是消除掉法律保護溢價、休息時間、輪班加給、勞災索賠以及招募漏斗。

Aime週日以12,924對12,732贏下了對決。這場測試展示的事情是:在灣區一家受加州勞動法約束的設施裡、在「單一任務執行」這個口徑上,一個健康實習生跟當前一代人形機器人之間的差距,是每個包裹0.04秒、加上一條前臂。這不是大多數倉庫營運商正在算的那個差距。

接下來盯什麼

  • **Figure 03的第二班。**截至本文撰寫時,機器人編隊已連續運行116小時。200小時——五個連續40小時工作週——是其他人沒展示過的節點,也是Adcock那句話從行銷口徑變成經營事實的拐點。
  • **第一場加州之外的複賽。**如果Figure在德州、佛州或田納西州找一個沒有強制用餐與休息保護的工人重打一場,下一個新聞稿基本是寫好的。
  • **第一場多技能對決。**10小時分兩段——5小時分揀、5小時拆裝、中間不允許Helix-02重新訓練——是Adcock到現在還沒辦的測試。哪一天他辦了、並且機器人通過了,倉庫經理那筆帳就會朝著「每秒多少箱」永遠換算不回來的方向變動。
  • **Aime的下一份工作。**Figure有充分的公關理由展示這位實習生在班次結束後去哪裡了。這一隊公司面對的2026屆畢業生問題,答案目前並不明顯。

機器人週日沒贏。機器人也不需要贏。機器人只需要讓法律保護溢價被定價高於每個包裹0.04秒——而截至5月17日,正是這樣定價的。

資料來源