Otpornost u doba umjetne inteligencije

UI, tehnologije opće namjene i zašto je otpornost zadatak naše generacije.

Autor: Wojciech Zaremba

Fondacija OpenAI postoji kako bi osigurala da opća umjetna inteligencija koristi cijelom čovječanstvu.

Neumorno radimo kako bismo držali korak sa brzim napretkom same umjetne inteligencije. U aprilu je Fondacija najavila naših prvih 100.000.000 USD grantova u oblasti bioloških nauka i liječenja bolesti, s ambicijom da pomogne u prevenciji i liječenju bolesti poput Alzheimerove bolesti korištenjem napredne umjetne inteligencije. Prošle sedmice smo najavili naš program Poslovi i ekonomska budućnost, s nadom da ćemo razumjeti i oblikovati šta rad i ekonomsko blagostanje znače za buduće generacije.

Danas dodatno razrađujemo našu viziju za sljedeći veliki program — kako bismo osigurali da, kako sposobnosti vještačke inteligencije budu rasle, tako će i sposobnost društva da iskoristi njen potencijal rasti jednako brzo. Ovaj rad nazivamo otpornost na AI: ekosistemski pristup potreban za ublažavanje rizika AI, kako bi društvo moglo maksimalno iskoristiti njegove prednosti.

Naš rad je već počeo. U samo nekoliko kratkih mjeseci od početka našeg rada, fondacija radi na finalizaciji više od 130.000.000 USD bespovratnih sredstava za organizacije kroz naš program AI Resilience, što će uskoro biti javno objavljeno, uz još mnogo toga što slijedi.1

Model transformacijskih tehnologija

Važnost otpornosti vještačke inteligencije najbolje se može razumjeti kroz prizmu prošlih tehnologija koje su značajno oblikovale ljudsku historiju.

S vremena na vrijeme pojavi se tehnologija koja iz temelja preoblikuje društvo. Ekonomisti ih nazivaju „tehnologijama opće namjene“. Vatra. Štamparska presa. Električna energija. Internet. Svaki je slijedio sličan razvojni luk: brze inovacije, stvarni rizici i institucije koje žure da uhvate korak. Ali svaki primjer također pokazuje šta je potrebno da bi moćna tehnologija bila sigurna.

Vatra je omogućila nastanak ljudske civilizacije. Grijalo nas je, kuhalo nam je hranu i štitilo nas je od grabežljivaca. Također je spalilo naše gradove do temelja. S vremenom su društva izgradila otpornost: vatrootporni materijali, mreže hidranata, profesionalne vatrogasne službe i građevinski propisi. Ekosistem, sloj po sloj.

Električna energija je pratila isti put. Nakon što je Edisonova stanica Pearl Street osvijetlila Manhattan 1882. godine, struja je donijela požare, smrtne slučajeve od strujnog udara i javnu paniku. Bez zaštitnih mjera poput izoliranih žica, automatskih osigurača i propisa, radnici i prolaznici stradavali su od strujnog udara u gradovima širom zemlje. Gradovi su raspravljali o tome treba li eksperiment u potpunosti napustiti. Umjesto toga, kako je tehnologija napredovala, uspostavili smo nezavisna tijela za testiranje poput Underwriters Laboratories, industrijske standarde poput Nacionalnog električnog kodeksa, te javna ulaganja koja su dovela električnu energiju u zajednice koje je tržište bilo zapostavilo. Svaki sloj učinio je električnu energiju sigurnijom i dostupnijom; danas je toliko sigurna da dijete može pritisnuti prekidač i svjetlo se upali.

Ovako izgleda otpornost kada se radi kako treba.

Vještačka inteligencija zahtijeva ekosistem otpornosti

Vještačka inteligencija slijedi istu putanju kao i prethodne tehnologije, ali se razvija dosad nezabilježenom brzinom.

Još uvijek smo na samom početku, ali koristi su već jasne: umjetna inteligencija smanjuje prepreke za pokretanje poslovanja, proširuje pristup obrazovanju, ubrzava naučna otkrića i transformira medicinu.

Istovremeno, rizici se pojavljuju jednako brzo — i to kao slika u ogledalu prednosti UI-ja. Isti rast koji stvara nove industrije može uzdrmati postojeće i poremetiti karijere. Isti sistemi koji mladima mogu pomoći da uče i stvaraju mogli bi također dovesti do nepoželjnog ponašanja. Alati koji ubrzavaju biološka istraživanja mogli bi sniziti prag za stvaranje štetnih patogena. A sposobnost vještačke inteligencije da piše kod, u pogrešnim rukama, mogla bi ugroziti kritičnu infrastrukturu.

Prvobitni tim OpenAI smatrao je da osiguravanje da umjetna inteligencija koristi društvu prvenstveno zavisi od rješavanja tehničkog problema usklađivanja. To ostaje ključno — i u središtu našeg rada — ali sada vjerujemo da je to samo jedan dio slagalice. Kako se umjetna inteligencija širi kroz sektore i države, društvu će također biti potrebna nezavisna istraživanja, javna infrastruktura, koordinacija industrije i potpuno nova područja stručnosti. Ukratko, to će zahtijevati otpornost AI-ja.

Odlučili smo da svoj početni rad usmjerimo na četiri područja2 koja se nalaze na presjeku velikih, kratkoročnih rizika i neposrednog utjecaja:

  1. Biootpornost kao pomoć u sprječavanju budućih projektovanih pandemija;

  2. Kibernetička otpornost za rad na osiguravanju sigurnosti kritičnih sistema našeg svijeta;

  3. Sigurnost AI modela za učvršćivanje kontrole čovječanstva nad modelima koje stvaramo; i

  4. Utjecaj vještačke inteligencije na mlade kako bi tehnologija postala pozitivna snaga za buduće generacije.

Naš rad tek počinje. Planiramo podijeliti više informacija o našim strategijama i početnim grantovima u svakoj oblasti, te se s vremenom proširiti na druge oblasti.

Bio-resilience

AI will enable biological research to move at unprecedented speed, helping develop new cures and public health improvements that enable us to all live healthier and longer. However, these same capabilities could also be misused by malicious actors, lowering the barrier to designing harmful pathogens.

The age of AI requires a renewed focus on biosecurity. Because advanced AI systems could be misused by bad actors to help create a wide range of biological threats, we will prioritize pathogen-agnostic biosecurity solutions. This will require investments across prevention, detection, and defense. We need to make it harder for malicious actors to access the expertise, equipment, and materials to create biological threats, improve our ability to identify and track novel outbreaks early, and strengthen the technologies—such as protective equipment, indoor air cleaning systems, and medical countermeasures—needed to respond quickly and effectively.

Cyber-resilience

AI has begun to rapidly reshape the cybersecurity landscape. The work that once required specialized teams can now be assisted or automated by capable models. At the same time, rapidly-improving AI capabilities can also be used to accelerate cyberdefenders, including by identifying and patching vulnerabilities and accelerating response.

Many large companies and private actors can spend heavily on cyber to secure their own systems, including with new advances in AI. We anticipate focusing significant resources on securing other important societal actors that are less resourced and will have a much harder time deploying AI-ready cyberdefenses as quickly as needed. In parallel, we are also focused on preparing for novel security challenges that artificial general intelligence will ultimately bring.

AI model safety

AI model safety focuses on the behavior of the systems themselves—whether they are truthful, reliable, and aligned with human intent. In a world where this goes awry, models can break out and behave in unpredictable ways, deceiving us or pursuing goals beyond their design. Getting this right becomes increasingly important as AI systems grow more autonomous and approach—and eventually surpass—human-level intelligence.

AI companies are investing substantial resources in model safety. However, the importance of this challenge calls for a broader, more robust ecosystem: independent institutions to evaluate model safety, public infrastructure to verify models’ safe deployment in practice, and continued advances in alignment science that advance the field broadly.

AI’s impact on young people

Young people are often the earliest adopters of new technologies, using them to learn, create, communicate, and explore the world. AI is no exception. But as these tools become an increasing part of young people’s daily lives, it is critical that we develop a stronger evidence base to understand its impacts.

Families, schools, policymakers, and community organizations are all grappling with questions about how and when young people engage with AI—including its impact on human connection, learning, and development. Our initial focus will be on advancing independent research to help guide those decisions—to better understand where AI can support development, the risks it may introduce, and the contexts that shape those effects.

These insights should drive broad safety standards and design principles that guide how any AI product is developed, how schools choose to deploy them, and if and how families decide to incorporate these technologies into their lives.

The work ahead

There is one critical difference between AI and the technologies that came before it: speed.

Fire resilience took millennia. Electricity resilience took decades. AI resilience is evolving in a matter of years. The systems that make it safe, reliable, and broadly beneficial must be built alongside it.

If we get it right, AI can become part of the foundational infrastructure of modern life—expanding access to knowledge, accelerating discovery, and improving lives at a global scale.

But that outcome isn’t guaranteed. No general purpose technology ever made itself safe.

Resilience is a permanent discipline that requires many people and institutions to build, invest, and collaborate. That is the work ahead, and it is one of the defining challenges of our time. We hope you’ll join us.

Footnotes

  1. 1

    The OpenAI Foundation expects to invest more than $1 billion across several programs over the next year, and $25 billion in AI Resilience and Life Sciences & Curing Disease in the years ahead.

  2. 2

    The economic impacts of AI are part of the broader AI resilience agenda. Given the scale of the economic transition, the Foundation is developing this work as a separate program. Read more here.

  • Thank you to Zach Sims for helping develop this piece.
  • Acknowledgements: Jeff Arnold, Naomi Bashkansky, Sean Coey, Rebecca Distler, Adrien Ecoffet, Tarun Gogineni, Mike Heimowitz, Alice Lee, Leyan Lo, Rodney Manabat, Mike McCormick, Cody Nguyen, Yonadav Shavit, Kendal Simon, Divya Siddarth, Jacob Trefethen.