DeepL CEO Jarek Kutylowski 5月7日(周四)在领英上发文,宣布这家总部在科隆的 AI 翻译公司将裁员约250人——占1,000多人总员工数的25%——并重组成一家「AI 原生」公司。他形容这是「职业生涯里最艰难的决定」。原话给出的理由是:「来自人工智能的巨大结构性转变」。
这句话值得读两遍。一家 AI 翻译公司的 CEO,正在以「来自 AI 的巨大结构性转变」为理由,裁掉四分之一的员工。他卖的那个东西,刚刚把他自己挤出了赛道。
整个故事其实就是这一句话。但值得拆开看,因为接下来18个月里,会有一长串「单一用途的 AI 专家公司」走上同一条路。
DeepL 当年的护城河,到底是什么
DeepL 2017年带着一套神经机器翻译(NMT)系统上线,在欧洲语种对的人工评测里,翻译质量明显好过谷歌翻译。这个位置守了差不多七年,是真的有壁垒——翻译质量很难造假;训练语料也是真的资产(欧盟机构的双语对照、专业翻译记忆库、Linguee 的 Web 索引);加上欧洲数据中心、德国工程、GDPR 友好的合规故事,在欧洲企业市场切出了一块漂亮的根据地,订阅业务做得也很扎实。
护城河可以总结成两条:在窄任务上质量更好,加上一个干净的企业合规故事。这个护城河一直挺到2023年。
2024年开始漏水,现在已经干了。
护城河为什么破了
前沿通用大模型——GPT-4 这一代、Claude 这一代、Gemini 这一代——翻译只是它们「语言能力很强」的副产品。它们没有专门为翻译训练,但在大多数语种对、大多数应用场景里,BLEU 和 COMET 跟 DeepL 的差距小到四舍五入可以忽略——尤其是付费客户实际在做的那些活:公司邮件、合同、产品文案、知识库翻译。而且通用大模型灵活得多,翻译完顺手帮你重写、缩写、调语气、换语域、解释俚语,一次调用都能做。
Kutylowski 这两年在公开场合一直绕着不说的硬道理是:BLEU 优势就是护城河,BLEU 优势没了,剩下的商业楔子只有「我们是欧洲数据中心、GDPR 友好的翻译 API」。这个楔子是真的存在。但它撑不起一家1,000人的公司。
翻译,是第一个被通用大模型彻底吃掉的「AI 专才」品类。它不会是最后一个。图像生成专才公司是下一个;转录已经被 Whisper 加 GPT 后处理吃了一半;专业代码补全去年就被吃了。每一家「我们就把一件 AI 事情做到极致」的公司,现在都在和它们自己根本推不动的前沿模型升级跑步赛跑。
Kutylowski 在卖的转型故事:语音
伴随裁员一起公布的,有两件事:在旧金山新开办公室,以及收购 Mixhalo 团队——一家专做低延迟音频流的公司,创始人是 Incubus 乐队的 Mike Einziger。卖点是:DeepL 下一个守得住的产品是实时语音对语音翻译。Mixhalo 团队带来音频管线的基因;DeepL 自己有语言模型;两边合到一起,做出一个「延迟、音质、翻译准确度都对得上」、能在真实对话中能用的东西。
抽象地看,这个赌注是合理的。语音翻译里有一堆小工程问题——丢包、回声消除、说话人分离、延迟压在200毫秒以内——通用大模型不会自动给你解决,而 Mixhalo 这种音频专才团队是真的有优势。
但时机问题挺要命。OpenAI 的 GPT-4o realtime voice 和谷歌 Gemini Live,在它们自己的消费 App 里已经在做实时语音翻译了。比赛已经开始了。DeepL 大概有12到18个月的窗口期,把一个守得住的产品交付出来,赶在通用模型把语音翻译也吃掉之前。要么 Mixhalo + DeepL Voice 在延迟和音质上真的更好、楔子立得住;要么立不住,2027年我们大概会再聊一次「DeepL 这次又怎么了」。
重组话术,逐字翻译
Kutylowski 的原话值得照抄一遍:「更少的层级、更快的决策、把大团队浪费在反复沟通上的时间砍下去。」这套话术现在已经是「后 AI 时代」标配的重组黑话。过去六周里,完全一样的句子从 PayPal(4,760人)、Coinbase(约700人)、Freshworks(500人)、埃森哲(8.65亿美元重组、85,000人「转型或出局」)的发言稿里都说过一次。「AI 原生」这四个字现在是 CEO 词汇表里干活最多的一个,大致意思是:少一些中层、更多一线工作通过 AI 工具直接完成、用更小的团队产出同样或更高的活儿。
诚实版本是这样的:「前沿大模型存在这件事,让我们意识到自己之前其实超配了人手,毛利再被侵蚀之前必须把人头数砍下去。」这句话是真的。这个决定大概也是对的。只是它没有「更少的层级、更快的决策」体面,所以没人这么说。
底下还有一道欧洲 AI 的题
DeepL 是除了 Mistral 之外,欧洲最大的 AI 招牌。叙事原本是:欧洲可以靠欧洲数据、欧洲合规姿态、欧洲工程严谨,做出品类领先的 AI 公司。5月7日这250人的裁员,不算对这个叙事的彻底反驳,但是第一个高质量的反例数据点。让 DeepL 当年成为招牌的,是它 NMT 的质量优势;而把这个优势拿走的,是用了远超 DeepL 这辈子能融资到的算力训练出来的、来自美国的通用模型。
这给一批欧洲 AI 专才公司——TTS、图像、代码、文档理解、搜索——出了个题:在前沿模型一路碾过来的过程里,你们的护城河靠什么活下来。有些会撑住。但大多数撑不住。
接下来要看的几件事
- Mixhalo 整合的时间线。 旧金山办公室加音频团队收购,都是慢输入。如果到年底 DeepL Voice 在延迟和音质上没有明显优于 GPT-4o realtime,这次转型就有麻烦了。
- 企业订阅的留存率。 DeepL 的收入主要来自中型企业的翻译合同。「结构性转变」式的裁员往往伴随着客户在 AI 工具开支上做合并,把订单转向通用模型供应商。要看的数,是企业版的净留存率(NRR)。
- 语种覆盖。 DeepL 历来在非欧语种(中、日、韩、阿)上偏弱。如果裁员后的路线图是「欧洲语种再加码,其他让给 OpenAI」,那它在向你提前剧透自己2028年长什么样。
- 下一家做同样宣布的「AI 单一专才」公司。 套路已经定型——原本的护城河(专才质量)没了(被前沿模型抹平),应对动作是裁员加上一个「守得住的细分」转型。下一批要看转录、图像增强、AI 搜索。
一点干涩的尾声
5月7日那条领英帖最锋利的地方,是它没说的部分。Kutylowski 写了「AI 原生组织」、「结构性转变」、「更少的层级」。他没写那句最显然的话:「我们卖的 AI,已经不比别人手里的 AI 更好了,所以我们必须做一家更小的、做着不同事情的公司」。这句话其实就藏在帖子里,你读字里行间就读得出来。它必须在那里——不然数字根本算不平。
收购 Mixhalo 是真正有意思的那一手。裁250人是可以预料到的那一手。两手合起来,是一个 AI 专才被通用化抹平后的标准教科书打法——把人头数砍到匹配新的毛利率,买一支有不同护城河的团队,把剩下的工程师全部对准一个新的、守得住的产品,然后赶在前沿模型追上来之前把它做出来。
12到18个月。然后就知道答案了。