Atsparumas DI amžiuje

DI, bendrosios paskirties technologijos ir kodėl atsparumas – mūsų kartos užduotis.

Autorius: Wojciech Zaremba

„OpenAI Foundation“ siekia užtikrinti, kad bendrasis dirbtinis intelektas teiktų naudą visai žmonijai.

Nenuilstamai dirbame, kad neatsiliktume nuo sparčios paties DI pažangos. Balandį fondas paskelbė apie pirmąsias 100 mln. JAV dolerių dotacijas gyvybės mokslų ir ligų gydymo srityse, siekdamas pasitelkti pažangųjį DI ir taip padėti išvengti tokių ligų kaip Alzheimerio liga bei jas gydyti. Praėjusią savaitę pristatėme programą „Darbas ir ekonomikos ateitis“, tikėdamiesi geriau suprasti ir formuoti tai, ką darbas bei ekonominė gerovė reikš ateities kartoms.

Šiandien plačiau pristatome kitos didelės programos viziją – siekiame užtikrinti, kad, augant DI pajėgumams, visuomenės gebėjimas jį pasitelkti augtų taip pat sparčiai. Šį darbą vadiname DI atsparumu: tai ekosisteminis požiūris, būtinas norint sumažinti DI riziką, kad visuomenė gautų kuo didesnę naudą.

Mūsų darbas jau prasidėjo. Vos per kelis mėnesius nuo veiklos pradžios fondas baigia derinti daugiau nei 130 mln. JAV dolerių vertės dotacijas organizacijoms pagal DI atsparumo programą. Apie jas, kaip ir apie kitus planus, netrukus paskelbsime viešai.1

Transformuojančių technologijų dėsningumai

DI atsparumo svarbą geriausia suprasti žvelgiant į praeities technologijas, reikšmingai pakeitusias žmonijos istoriją.

Kartkartėmis atsiranda technologija, iš esmės pakeičianti visuomenę. Ekonomistai jas vadina „bendrosios paskirties technologijomis“. Ugnis. Spausdinimo presas. Elektra. Internetas. Visų jų raidos kreivė buvo panaši: sparčios inovacijos, reali rizika ir prisitaikyti skubančios institucijos. Tačiau kiekvienas pavyzdys taip pat parodo, ko reikia, kad galinga technologija taptų saugi.

Ugnis leido sukurti žmonijos civilizaciją. Ji mus šildė, leido gaminti maistą ir saugojo nuo plėšrūnų. Tačiau ji taip pat sudegindavo miestus iki pamatų. Ilgainiui visuomenė įgijo atsparumą: atsirado ugniai atsparios medžiagos, hidrantų tinklai, profesionalios ugniagesių tarnybos ir statybos techniniai reglamentai. Taip sluoksnis po sluoksnio susiformavo ekosistema.

Elektros raidos kelias buvo toks pat. Kai 1882 m. Edisono „Pearl Street“ elektrinė apšvietė Manhataną, elektra sukėlė gaisrų, elektros smūgių ir visuomenės paniką. Kol nebuvo tokių apsaugos priemonių kaip izoliuoti laidai, išjungikliai ir saugos taisyklės, visos šalies miestuose nuo elektros smūgio žūdavo darbuotojai ir praeiviai. Miestų valdžia svarstė, ar nereikėtų šio eksperimento visiškai atsisakyti. Užuot tai padarę, technologijai tobulėjant, įsteigėme nepriklausomas testavimo įstaigas, pavyzdžiui, „Underwriters Laboratories“, patvirtinome pramonės standartus, tokius kaip Nacionalinis elektros kodeksas, ir pritraukėme valstybės investicijų, užtikrinusių elektros tiekimą bendruomenėms, kurių nepasiekė rinka. Kiekvienas naujas sluoksnis darė elektrą saugesnę ir lengviau prieinamą; šiandien ji tokia saugi, kad net vaikas gali paspausti jungiklį ir uždegti šviesą.

Būtent taip atrodo tinkamai sukurtas atsparumas.

DI reikalinga atsparumo ekosistema

DI vystosi tokia pačia trajektorija kaip ir ankstesnės technologijos, tačiau neregėtu greičiu.

Nors tai dar tik pati pradžia, nauda jau akivaizdi: DI mažina kliūtis kurti verslą, didina švietimo prieinamumą, spartina mokslinius atradimus ir keičia mediciną.

Kartu lygiai taip pat greitai išryškėja ir rizika – tarsi veidrodinis DI naudos atspindys. Tas pats augimas, kuris kuria naujas pramonės šakas, gali sužlugdyti esamas ir sutrikdyti žmonių karjerą. Tos pačios sistemos, padedančios jaunimui mokytis ir kurti, gali paskatinti ir neigiamą elgesį. Priemonės, spartinančios biologinius tyrimus, gali palengvinti žalingų patogenų kūrimą. O DI gebėjimas rašyti kodą netinkamose rankose gali kelti grėsmę ypatingos svarbos infrastruktūrai.

Ankstyvoji „OpenAI“ komanda manė, kad, norint užtikrinti DI naudą visuomenei, pirmiausia reikia išspręsti techninio suderinimo problemą. Tai tebėra be galo svarbu ir užima pagrindinę vietą mūsų veikloje, tačiau dabar manome, kad tai – tik viena dėlionės dalis. DI plintant įvairiuose sektoriuose ir valstybėse, visuomenei taip pat reikės nepriklausomų tyrimų, viešosios infrastruktūros, pramonės veiksmų koordinavimo ir visiškai naujų kompetencijos sričių. Trumpai tariant, prireiks DI atsparumo.

Nusprendėme pradžioje susitelkti į keturias sritis2, esančias didelės artimiausio laikotarpio rizikos ir tiesioginio poveikio sankirtoje:

  1. biologinį atsparumą, siekiant padėti išvengti dirbtinai sukeltų pandemijų ateityje;

  2. kibernetinį atsparumą, siekiant užtikrinti pasaulio ypatingos svarbos sistemų saugą;

  3. DI modelių saugą, siekiant įtvirtinti žmonijos kuriamų modelių kontrolę; ir

  4. DI poveikį jaunimui, siekiant, kad technologija taptų teigiama jėga ateities kartoms.

Mūsų darbas tik prasideda. Planuojame pasidalyti išsamesne informacija apie strategijas ir pradines dotacijas kiekvienoje srityje, o ilgainiui apimti ir kitas.

Bio-resilience

AI will enable biological research to move at unprecedented speed, helping develop new cures and public health improvements that enable us to all live healthier and longer. However, these same capabilities could also be misused by malicious actors, lowering the barrier to designing harmful pathogens.

The age of AI requires a renewed focus on biosecurity. Because advanced AI systems could be misused by bad actors to help create a wide range of biological threats, we will prioritize pathogen-agnostic biosecurity solutions. This will require investments across prevention, detection, and defense. We need to make it harder for malicious actors to access the expertise, equipment, and materials to create biological threats, improve our ability to identify and track novel outbreaks early, and strengthen the technologies—such as protective equipment, indoor air cleaning systems, and medical countermeasures—needed to respond quickly and effectively.

Cyber-resilience

AI has begun to rapidly reshape the cybersecurity landscape. The work that once required specialized teams can now be assisted or automated by capable models. At the same time, rapidly-improving AI capabilities can also be used to accelerate cyberdefenders, including by identifying and patching vulnerabilities and accelerating response.

Many large companies and private actors can spend heavily on cyber to secure their own systems, including with new advances in AI. We anticipate focusing significant resources on securing other important societal actors that are less resourced and will have a much harder time deploying AI-ready cyberdefenses as quickly as needed. In parallel, we are also focused on preparing for novel security challenges that artificial general intelligence will ultimately bring.

AI model safety

AI model safety focuses on the behavior of the systems themselves—whether they are truthful, reliable, and aligned with human intent. In a world where this goes awry, models can break out and behave in unpredictable ways, deceiving us or pursuing goals beyond their design. Getting this right becomes increasingly important as AI systems grow more autonomous and approach—and eventually surpass—human-level intelligence.

AI companies are investing substantial resources in model safety. However, the importance of this challenge calls for a broader, more robust ecosystem: independent institutions to evaluate model safety, public infrastructure to verify models’ safe deployment in practice, and continued advances in alignment science that advance the field broadly.

AI’s impact on young people

Young people are often the earliest adopters of new technologies, using them to learn, create, communicate, and explore the world. AI is no exception. But as these tools become an increasing part of young people’s daily lives, it is critical that we develop a stronger evidence base to understand its impacts.

Families, schools, policymakers, and community organizations are all grappling with questions about how and when young people engage with AI—including its impact on human connection, learning, and development. Our initial focus will be on advancing independent research to help guide those decisions—to better understand where AI can support development, the risks it may introduce, and the contexts that shape those effects.

These insights should drive broad safety standards and design principles that guide how any AI product is developed, how schools choose to deploy them, and if and how families decide to incorporate these technologies into their lives.

The work ahead

There is one critical difference between AI and the technologies that came before it: speed.

Fire resilience took millennia. Electricity resilience took decades. AI resilience is evolving in a matter of years. The systems that make it safe, reliable, and broadly beneficial must be built alongside it.

If we get it right, AI can become part of the foundational infrastructure of modern life—expanding access to knowledge, accelerating discovery, and improving lives at a global scale.

But that outcome isn’t guaranteed. No general purpose technology ever made itself safe.

Resilience is a permanent discipline that requires many people and institutions to build, invest, and collaborate. That is the work ahead, and it is one of the defining challenges of our time. We hope you’ll join us.

Pastabos

  1. 1

    Per kitus metus „OpenAI Foundation“ planuoja investuoti daugiau nei 1 mlrd. JAV dolerių į kelias programas, o ateityje – 25 mlrd. JAV dolerių į DI atsparumo, gyvybės mokslų ir ligų gydymo sritis.

  2. 2

    Ekonominis DI poveikis yra platesnės DI atsparumo darbotvarkės dalis. Atsižvelgdamas į ekonominio perėjimo mastą, fondas šią veiklą vysto kaip atskirą programą. Daugiau skaitykite čia.

  • Thank you to Zach Sims for helping develop this piece.
  • Acknowledgements: Jeff Arnold, Naomi Bashkansky, Sean Coey, Rebecca Distler, Adrien Ecoffet, Tarun Gogineni, Mike Heimowitz, Alice Lee, Leyan Lo, Rodney Manabat, Mike McCormick, Cody Nguyen, Yonadav Shavit, Kendal Simon, Divya Siddarth, Jacob Trefethen.