260310-AI 真的在搶你的工作嗎?Anthropic 用真實數據給出了一個令人意外的答案

Maxim Massenkoff 和 Peter McCrory 花了很長時間盯著一張圖看。

那張圖上有兩塊面積:一塊藍色,代表AI「理論上」可以完成的工作任務;一塊紅色,代表 AI 「實際上」正在被使用的範圍。

兩塊之間,有一個巨大的空白。

這個落差,不是統計誤差。它是一個問題的起點:在所有人都在談論 AI 要讓白領工人集體失業的當下,真正發生的事情,究竟是什麼?

2026 年 3 月,Anthropic 發布了一篇研究報告,試圖回答這個問題。


目錄


一個反覆出現的恐懼

每隔幾個月,就會有一篇文章告訴你 AI 要搶走你的工作。

Anthropic 執行長 Dario Amodei 說,AI 可能衝擊一半的入門級白領工作。微軟 AI 負責人 Mustafa Suleyman 預測,多數專業工作將在一到十八個月內被取代。這些說法從 2022 年 ChatGPT 問世後一波接著一波,每一次新的模型發布,就伴隨著新一輪對就業市場的末日預言。

但有一個問題從來沒有人認真回答過:這些事情,現在真的在發生嗎?

Anthropic 的兩位研究員決定用數據找答案,而不是靠推論和直覺。他們的報告《AI 對勞動市場的影響:一種新的衡量方式與早期證據》(Labor market impacts of AI: A new measure and early evidence)在 2026 年 3 月 5 日發布,是迄今為止最認真嘗試把 AI 勞動市場衝擊數量化的學術研究之一。

回到目錄


過去的預測為什麼一直出錯

在開始講他們找到什麼之前,研究員先做了一件值得讚揚的事:他們先承認了過去那些類似研究有多不可靠。

報告開頭直接點出:一個著名的早期研究曾經判斷美國約四分之一的工作容易被外包取代,但十年後,那些工作大多維持了健康的就業成長。政府的職業成長預測雖然方向大致正確,但所提供的預測價值幾乎等同於直接延伸過去的趨勢線。

就算是事後諸葛,重大經濟衝擊對勞動市場的影響也常常令人困惑不清。工業機器人對就業的影響,學術研究至今仍得出相反的結論。中國製造業崛起所造成的工作流失規模,時至今日仍然爭論不休。

這段開場白不是謙遜的客套話, 它是一個宣告:預測很難,所以我們需要更好的工具。

回到目錄


「觀察到的暴露度」:一把新的量尺

過去衡量 AI 對工作威脅程度的主要方法,是問一個問題:「這個任務,AI 理論上能做嗎?」

Eloundou 等人在 2023 年建立的常用指標 β,把任務分成三種:語言模型獨立就能讓速度加倍(β=1)、加上額外工具後能加倍(β=0.5)、以及無法達到兩倍速(β=0)。這個方法的問題在於,它衡量的是可能性,而不是現實。

Massenkoff 和 McCrory 提出了一個新的指標,他們稱之為「觀察到的暴露度」(observed exposure)。這個指標的邏輯是:不管 AI 理論上能不能做某件事,重要的是它現在實際上有沒有在做。

他們的方法結合了三個資料來源:美國勞工部的 O*NET 職業任務資料庫(涵蓋約 800 種職業的具體工作任務)、Anthropic 自己的 Claude 實際使用數據(來自 Anthropic 經濟指數)、以及前述的理論能力評估。一個職業的「觀察到的暴露度」越高,代表它的核心任務不只是 AI 理論上能做的,而是真實使用者已經在拿 AI 來做的——特別是以全自動化、職業相關的方式在使用。

為方便理解,以下將「高暴露」簡化為「AI 涉入程度高」,「低暴露」簡化為「AI 涉入程度低」

理論與現實之間的鴻溝

這個指標揭示的最重要發現,就是那張圖上的巨大空白。

研究員把每個職業類別的「理論能力」和「實際使用」並排放在一起,得出了一個清晰的結論:

AI 距離達到它的理論上限還非常遙遠。

電腦與數學類工作,理論值 94%,實際只有 33%;辦公室行政類,理論值 90%,實際使用同樣只是其中一小部分。

為什麼會有這個落差?研究員提出了幾個原因:部分任務雖然理論可行,但受到法律限制、需要特定軟體、需要人工核查,或是存在其他現實障礙而難以採用。他們舉了一個具體例子:醫生授權藥局補充處方的任務,理論上 AI 完全能做,但他們在 Claude 的使用數據裡根本沒有看到這件事發生過。

回到目錄


誰是最高風險的職業?

根據「觀察到的暴露度」這個新指標,AI 涉入程度最高的十大職業分別是:程式設計師位居榜首,任務覆蓋率達 75%;客服代表1緊隨其後,他們的核心任務越來越常見於企業的一線 API 應用中;接著是資料輸入員,其主要任務——讀取來源文件並輸入資料——已有相當大比例被自動化。

後面幾名包括財務分析師、法律助理、會計人員等知識工作者

這些職業有幾個共同特徵,在統計上相當顯著。根據 2022 年底的勞動力調查數據,AI 涉入程度最高的那四分之一工作族群,比起毫無 AI 暴露的那 30%,有幾個特點:

女性比例高、白人比例高、亞裔比例極高、教育程度高

女性比例高出 16 個百分點;白人比例高出 11 個百分點;亞裔比例將近兩倍;平均薪資高出 47%;教育程度明顯較高——擁有研究所學歷的比例是低暴露族群的將近四倍,從 4.5% 躍升至 17.4%。

換句話說

AI 最大的威脅,指向的是受教育程度最高、薪資最高的那群人。

這與許多人「AI 只會取代低技能工作」的直覺,完全相反。

成長最慢的工作

AI 涉入程度高的職業,未來成長也較緩慢。研究員把新的暴露度指標與美國勞工統計局 2025 年發布、預測 2024 到 2034 年各職業就業變化的數據對照,發現暴露度每增加 10 個百分點,就業成長預測就下滑約 0.6 個百分點。

這個關係雖然微弱,但方向清晰,而且更值得注意的是:用舊的理論指標 β 來做同樣的分析,卻找不到這樣的相關性。也就是說,「實際使用」這個維度,比「理論上能做」更能預測未來的就業走向。

回到目錄


但失業率沒有動

在 Anthropic 的報告發布前幾週,一篇在科技圈廣泛流傳的文章(部落格有其譯文)這樣開頭:

「我在工作中實際的技術工作上已不再被需要了。我用普通英文描述我想要建構的東西,它就……出現了。不是我需要修改的草稿,而是完成品。」

該文作者Matt Shumer 是一個在 AI 新創公司工作了六年的業內人士。他用 2020 年 2 月那個沒有人意識到新冠病毒已經在門外的時刻,來比喻我們現在的處境。他說,科技工作者正在經歷的,就是其他所有人即將要經歷的。法律、金融、醫學、會計——不是十年後,是一到五年。

這種第一視角的衝擊感,是數字沒辦法給的。你感覺到大地在震動。

然後 Anthropic 的兩位研究員說:

「我們去量了,地沒在動。」

至少,目前看起來是這樣的。

研究員把暴露度指標與美國現行人口調查(Current Population Survey)的失業率數據對接,追蹤自 2022 年底 ChatGPT 發布以來的變化趨勢。

結果:在AI 涉入程度最高的那四分之一工作族群中,沒有找到失業率系統性上升的證據。

把AI 涉入程度最高的族群和AI 完全沒有涉入的族群的失業率放在一起看,兩條線自 2022 年底以來幾乎平行移動,差距沒有擴大。統計上,任何微小的失業率增加都在誤差範圍之內,無法與零效果區分開來。

這個結論無論用什麼方式延伸測試,都不動搖。把判定「高暴露」的百分位門檻從中位數一路拉高到第 95 百分位,結果都是失業率持平或略降。使用勞工部失業救濟金申請人數而非調查數據,結論相同。無論怎麼切,都看不到 AI 在暴露度最高的職業群體中留下清晰的失業足跡。

回到目錄


年輕人:唯一有訊號的族群

但研究員沒有就此收手。他們注意到另一項研究(Brynjolfsson 等人,2025 年)指出,在 22 到 25 歲的年輕工作者中,AI 暴露高的職業出現了 6 到 16% 的就業下滑。這個數字太顯眼,不能忽略。

問題是,對年輕的勞動市場新鮮人來說,「失業率」這個指標可能本身就有盲點——很多沒有找到第一份工作的年輕人,根本不會出現在失業統計裡,因為他們從來就沒有進入勞動市場,所以不被計算為「失業者」。

研究員因此改用另一個指標:就業媒合率,也就是追蹤年輕人每個月有多少比例成功進入一份新工作,並且區分他們進入的是高AI 涉入程度還是低AI 涉入程度的職業。

這裡終於出現了一個訊號。

紅線為22至25歲,在AI 涉入程度高的職業的「就業媒合率」,藍線則是不受AI影響的職業的媒合率。

從視覺上看,AI 涉入程度高與低的兩條曲線在 2024 年開始分叉。進入低涉入程度職業的就業媒合率維持穩定,大約每個月 2%;進入高AI 涉入程度職業的比率則下滑了約半個百分點,換算下來,在 ChatGPT 發布後的時期,暴露職業的就業媒合率比 2022 年基準低了約 14%

這個效果統計上剛好跨越顯著門檻,「剛好(barely)」這個詞本身就代表它應該被謹慎解讀。而且這個效果只在 25 歲以下的工作者身上出現,25 歲以上完全沒有類似趨勢。

研究員給了幾個可能的替代解釋:沒有被AI涉入程度高的職業錄取的年輕人,可能是留在原本的工作崗位、轉去其他職業,或者重回校園繼續讀書。它可能是 AI 開始影響入門級職缺的早期訊號,也可能只是市場噪音。

回到目錄


白領大蕭條:還沒發生,但不代表不會來

研究員在報告裡提出了一個思想實驗,讓人難以忽視。

2007 到 2009 年的金融海嘯期間,美國整體失業率從 5% 翻倍到 10%。如果 AI 對白領工作造成了類似規模的衝擊,在暴露度最高的四分之一職業群體中,失業率應該會從目前的 3% 上升到 6%。

這個幅度,在他們的分析框架裡應該是可以被偵測到的。

它沒有發生。

但研究員沒有說「所以不用擔心」。他們說的是:這個框架的價值,正在於它能在破壞變得清晰之前就提前識別出最脆弱的環節。COVID 那樣的衝擊不需要精細的統計工具,因為它太劇烈了,任何人都看得見。但如果 AI 帶來的衝擊更像是貿易衝擊或網路革命——緩慢滲透、與景氣循環混在一起——那麼沒有一個好的測量框架,等你能確定地說「是 AI 造成的」時,傷害可能早就造成了。

回到目錄


AI 的真實狀態:潛力巨大,採用遲緩

這份報告間接揭示了另一件事:

我們可能嚴重高估了 AI 目前的實際普及程度。

Anthropic 的經濟指數建立在對約一百萬次真實 Claude 對話的匿名分析之上,追蹤這些使用行為如何對應到美國勞工部 O*NET 資料庫的兩萬多個具體工作任務。這是迄今規模最大的「AI 實際使用行為」數據集,而它描繪出的圖景,比大多數人想像的要保守得多。

電腦與數學類任務佔了 Claude 查詢量的 37.2%,主要是軟體修改、程式除錯、網路問題排查。藝術與媒體類排第二,佔 10.3%,主要反映寫作和編輯工作。相較之下,農業、漁業、林業相關查詢只佔 0.1%。

而在所有的使用行為中,「輔助型使用」(AI 協助人類完成任務)仍然多於「自動化使用」(AI 獨立完成任務)。截至 2025 年 11 月,輔助型使用佔 52%,自動化佔 45%。

這個比例本身是一個重要的訊息:在絕大多數情境中,AI 還是一個工具,而不是一個替代者。

回到目錄


這份報告也許想說

這篇論文想解答的,不只是「AI 有沒有在搶工作」,更是「我們要怎麼問這個問題」。

研究員承認,他們的框架有侷限。O*NET 的任務描述反映的是 2023 年前的語言模型能力,現在的模型早已不同。使用 Claude 的行為只是整個 AI 使用生態的一個切面,可能高估了軟體工程任務的比重,因為 Claude 本來就以程式設計能力著稱。部分顯示為「自動化」的對話,使用者實際上可能只是拿 AI 的產出當草稿再加以修改,功能上更接近輔助,卻被計入自動化。

但這份報告真正的貢獻,不是最終答案,而是一套方法論。

在任何可見的衝擊出現之前,就把測量工具架好。在大家還在用「理論上 AI 能不能做」來推斷威脅的時候,改問「AI 現在實際上在做什麼」。在末日論和過度樂觀之間,找一個能被數據更新的立場。

這個立場是:目前還沒有系統性的衝擊訊號,但有一個早期、微弱、針對年輕新鮮人的警示。那塊理論能力與實際使用之間的巨大空白,正在等待被填補。當它被填補的速度加快時,這個框架也許能破壞來臨前就先偵測到它。

Massenkoff 和 McCrory 說,答案是:會的,但我們現在還不知道它長什麼樣子。


另一個聲音:數據和親歷者,誰說的算?

Shumer 的文章和 Anthropic 的報告,讀起來像是在描述兩個不同的世界。

一個說:我已經不被需要了,這正在蔓延到所有人。另一個說:我們量了失業率,什麼都沒動。

這個矛盾不是假的,但它也不是真正的衝突。兩件事可以同時為真:AI 的能力正在以某些人感受強烈的速度提升,同時在總體就業數字上還沒有留下可量測的痕跡。就像 2020 年 1 月,病毒已經在傳播,但醫院還沒有被塞爆。

Shumer 說:

「未來已經在這裡了,它只是還沒敲你的門。」

Anthropic 回應:

「我們的框架最有用的時刻,正是衝擊還不明顯的時候。」

兩個說法之間的空隙,是現在所有人都站著的地方。

#anthropic #AI

回到目錄


本文根據 Anthropic 於 2026 年 3 月 5 日發布的研究報告《Labor market impacts of AI: A new measure and early evidence》整理撰寫,作者為 Maxim Massenkoff 與 Peter McCrory。原始報告可於 anthropic.com/research/labor-market-impacts 查閱。另參考 Matt Shumer 於 2026 年 2 月 9 日發表的文章,繁體中文翻譯版可於 infosec.press/richbluebird/somethingbigishappening 查閱。

¹ 註:客服人員被AI取代?奧美集團副主席應該很不認同

回到頁首


signature head 關於這裡 台灣人。台派。喜歡把事情搞清楚。

凡是能解釋「為什麼」的事,我都著迷。科學、創新、哲學、投資,本質上是同一件事:找出規律,然後解開。

讀到真正新奇的東西,會興奮到發抖。

不在書桌前的時候,就在山上、水裡、或某個還沒搭營地的空地。

contact via teamtaiwan.trophy127@passmail.net
本站僅提供參考,不是人生建議,不是醫療建議,不是投資建議。