2026年6月1日

AI 時代的韌性

AI、通用目的技術以及為何韌性是我們這一代的使命。

作者：Wojciech Zaremba

OpenAI Foundation 的使命是確保通用人工智能惠及全人類。

我們一直不懈努力，務求跟上 AI 本身的飛速發展。四月，OpenAI Foundation 宣布推出⁠首輪 1 億美元的「生命科學與疾病治療」(Life Sciences and Curing Diseases) 資助計劃，目標是透過運用先進 AI，協助預防及治療阿茲海默症等疾病。上週，我們宣布推出⁠「就業與經濟未來」(Jobs and Economic Futures) 計劃，期望了解並塑造工作與經濟繁榮對未來世代的意義。

今天，我們正拓展下一項重大計劃的願景：確保隨著 AI 能力的提升，社會運用它的能力也能同步增長。我們稱這項工作為 AI 韌性：這是一種減輕 AI 風險所需的生態系統方法，能夠讓社會最大化其效益。

我們的工作已經開始。在展開工作後的短短幾個月內，OpenAI Foundation 正努力透過我們的 AI 韌性計劃，敲定超過 1.3 億美元的資助給各組織，相關資訊很快就會公開分享，後續亦會有更多計劃推出。^1⁠

變革性技術的模式

透過那些深刻塑造人類歷史的過往技術，最能體會 AI 韌性的重要性。

每隔一段時間，就會有一種技術出現，從根本上重塑社會。經濟學家稱之為「通用目的技術」。火。印刷機。電力。互聯網。每一種技術都遵循相似的發展軌跡：快速創新、真實風險浮現、相關機構急起直追。但每個例子亦顯示，要令一項強大的技術變得安全，需要付出巨大的努力。

火使人類文明成為可能。它讓我們保暖、煮熟食物，並保護我們免受食肉動物侵害。它也會把我們的城市燒成廢墟。隨著時間推移，社會逐步建立抗火韌性：耐火材料、消防栓網絡、專業消防部門，以及建築規範。一個生態系統，層層構建。

電力亦沿着相同的路徑。1882 年，愛迪生的珍珠街發電站照亮曼哈頓之後，電力亦帶來火災、觸電身亡事故和公眾恐慌。在沒有絕緣電線、斷路器和電力規範等防護措施的情況下，全國各城市都有工人和旁觀者觸電身亡。多個城市討論應否徹底放棄這項實驗。相反，隨着技術進步，我們設立了像保險商實驗室這樣的獨立測試機構，制定了像《國家電氣規範》這樣的業界標準，並進行公共投資，將電力帶到那些市場未能覆蓋的社區。每一層都令電力變得更安全、更易使用；時至今日，電力已非常安全，小朋友只要按一下開關，燈就會亮起。

這就是韌性發揮得宜的樣子。

AI 需要韌性生態系統

AI 正沿著與過往技術相同的軌跡發展，但速度前所未有。

我們仍處於其發展初期，但其益處已清晰可見：AI 正在降低創業門檻、擴大教育資源的可及性、加速科學發現，並革新醫療領域。

與此同時，風險也同樣快速浮現，而且與 AI 的益處呈現鮮明對比。催生新產業的同一股增長力量，亦可能顛覆現有產業，衝擊就業市場。能協助年輕人學習與創造的系統，亦可能引發不良行為。加速生物學研究的工具，亦可能降低製造有害病原體的門檻。而 AI 寫程式碼的能力，一旦落入不當人士手中，可能會威脅關鍵基礎設施。

OpenAI 早期團隊認為，要確保 AI 惠及社會，關鍵在於解決技術對齊問題。這一點仍然至關重要，並且是我們工作的核心，但我們現在相信，這只是整個拼圖中的一塊。隨着 AI 滲透至不同的行業領域和國家，社會亦需要獨立研究、公共基礎設施、業界協調，以及全新的專業領域。簡而言之，這一切都需要AI 韌性。

我們選擇將初期工作聚焦於四大領域[fn:2]，這些領域均處於重大近期風險與即時影響的交匯點：

生物韌性，協助防範未來人為製造的大流行病；
網絡韌性，致力確保全球關鍵系統的安全；
AI 模型安全，鞏固人類對我們所創造模型的掌控；以及
AI 對年輕人的影響，以使技術成為造福未來世代的正面力量。

我們的工作才剛剛開始。我們計劃分享更多有關各個領域的策略和首批資助項目的資訊，並逐步擴展至其他領域。

生物韌性

AI 將使生物學研究以前所未有的速度推進，協助開發新療法和推動公共健康方面的改善，從而讓我們所有人都能活得更健康、更長壽。然而，同樣的能力亦可能被惡意行為者濫用，降低設計有害病原體的門檻。

AI 時代需要重新重視生物安全。由於先進 AI 系統可能會被惡意行為者濫用，以協助製造各種生物威脅，我們將優先關注不針對特定病原體的生物安全解決方案。這將需要在預防、偵測及防禦各方面投放資源。我們需要令惡意行為者更難取得用於製造生物威脅的專業知識、設備和材料；提升我們及早識別和追蹤新發疫情的能力；並加強迅速而有效應對所需的技術，例如防護裝備、室內空氣淨化系統和醫療應對措施。

網絡韌性

AI 已開始迅速重塑網絡安全格局。以往需要專業團隊處理的工作，現在可以由功能強大的模型協助或自動化。同時，迅速提升的 AI 能力亦可用於提升網絡防禦者的效率，包括識別並修補漏洞，以及加快應變速度。

不少大型企業和私人行為者可以在網絡安全方面投入大量資源，以保障自身系統的安全，包括利用 AI 的新進展。我們預期會投入大量資源，專注於保護其他重要的社會行為者，這些行為者資源較少，在以所需速度部署已為 AI 作好準備的網絡防禦措施方面，將面對更大困難。與此同時，我們亦專注於為通用人工智能最終會帶來的全新安全挑戰做好準備。

AI 模型安全性

AI 模型安全着重於系統本身的行為，即它們是否真實、可靠，並與人類意圖一致。在一個這種情況出現偏差的世界中，模型可能會擺脫控制，並以不可預測的方式行事，欺騙我們，或追求超出其設計範圍的目標。隨着 AI 系統變得越來越自主，並接近、甚至最終超越人類水平的智能，妥善處理這一點變得越來越重要。

AI 公司正投入大量資源於模型安全。然而，這項挑戰的重要性需要一個更廣泛、更穩健的生態系統：由獨立機構評估模型安全性、由公共基礎設施驗證模型在實踐中的安全部署，以及持續推進對齊科學，從而廣泛推動整個領域的發展。

AI 對年輕人的影響

年輕人往往是最早採用新技術的人，他們運用這些技術進行學習、創作、溝通和探索世界。AI 亦不例外。但隨著這些工具愈來愈融入年輕人的日常生活，我們必須建立更堅實的證據基礎，以了解它們帶來的影響。

家庭、學校、政策制定者和社區組織都在努力探討年輕人如何以及何時接觸 AI 的問題，包括 AI 對人際關係、學習和發展的影響。我們的初期工作重點將是推動獨立研究，以協助引導這些決策，藉此更深入了解 AI 可以在哪些領域支援發展、可能帶來哪些風險，以及影響其成效的各種情境。

這些洞見應推動制定全面的安全標準與設計原則，以指引任何 AI 產品的開發方式、學校如何選擇部署這些產品，以及家庭是否以及如何決定將這些技術融入日常生活。

接下來的工作

AI 與以往的技術有一個關鍵差異：速度。

抗火韌性歷經數千年才形成。電力韌性花了數十年才建立。而 AI 韌性則在短短數年間不斷演進。確保 AI 安全、可靠且能惠及大眾的系統，必須與其同步建立。

如果我們處理得當，AI 可能成為現代生活的根基性基礎架構之一，不斷拓展獲取知識的途徑、加速發現，並在全球範圍內改善人們的生活。

但這種結果並不保證會出現。從來沒有任何通用目的技術能自行確保自身安全。

韌性是一項長遠持續的專項工作，需要各界人士與機構共同建設、投入資源並協作。這便是擺在我們面前的工作，亦是我們這個時代的一項關鍵挑戰。誠邀您加入我們。

註腳

1
OpenAI Foundation 預計在未來一年於多個項目投資超過 10 億美元，並在未來數年於 AI 韌性及生命科學與疾病治療方面投資 250 億美元⁠。 ⁠
2
AI 的經濟影響是更廣泛的 AI 韌性議程的一部分。鑑於經濟轉型的規模，OpenAI Foundation 正將這項工作發展為獨立計劃。詳情請見此處⁠。 ⁠

Acknowledgements: Jeff Arnold, Naomi Bashkansky, Sean Coey, Rebecca Distler, Adrien Ecoffet, Tarun Gogineni, Mike Heimowitz, Alice Lee, Leyan Lo, Rodney Manabat, Mike McCormick, Cody Nguyen, Yonadav Shavit, Kendal Simon, Divya Siddarth, Jacob Trefethen.

感謝 Zach Sims 協助完成本文。