Seigla á tímum gervigreindar

Gervigreind, tækni til almennra nota og hvers vegna seigla er verkefni okkar kynslóðar.

Eftir Wojciech Zaremba

OpenAI Foundation vinnur að því að tryggja að almenn gervigreind gagnist öllu mannkyninu.

Við höfum unnið sleitulaust að því að halda í við örar framfarir á sviði gervigreindarinnar sjálfrar. Í apríl tilkynnti Foundation fyrstu styrkina okkar að upphæð 100.000.000 USD á sviði lífvísinda og lækninga sjúkdóma, með það að markmiði að hjálpa til við að koma í veg fyrir og meðhöndla sjúkdóma á borð við Alzheimerssjúkdóm með því að nýta háþróaða gervigreind. Í síðustu viku kynntum við verkefnið okkar Jobs and Economic Futures, með von um að skilja og móta hvað vinna og efnahagsleg velmegun þýða fyrir komandi kynslóðir.

Í dag útfærum við nánar sýn okkar á næsta stóra verkefni – að tryggja að eftir því sem geta gervigreindar eykst, aukist geta samfélagsins til að nýta hana jafnhratt. Við köllum þessa vinnu seiglu gervigreindar: vistkerfisnálgunina sem þarf til að draga úr áhættu gervigreindar, svo samfélagið geti hámarkað ávinning hennar.

Vinna okkar er þegar hafin. Á þeim fáu stuttu mánuðum sem liðnir eru frá því að við hófum starf okkar vinnur Foundation að því að ganga frá styrkjum upp á meira en 130 USD milljónir til samtaka sem hluta af áætlun okkar um seiglu gervigreindar okkar, nánari upplýsingar verða birtar opinberlega fljótlega og fleira er í vændum.1

Mynstur umbreytingartækni

Mikilvægi seiglu gervigreindar verður best skilið í ljósi fyrri tækni sem hefur mótað mannkynssöguna með afgerandi hætti.

Öðru hverju kemur fram tækni sem umbreytir samfélaginu frá grunni. Hagfræðingar kalla þetta „almennar tæknilausnir“. Eldur. Prentvélin. Rafmagnið. Internetið. Hvert þeirra fylgdi svipuðu ferli: ör nýsköpun, raunveruleg áhætta og stofnanir sem kepptust við að halda í við þróunina. En hvert dæmi sýnir líka hvað þarf til að gera öfluga tækni örugga.

Eldurinn gerði siðmenningu mannkyns mögulega. Hann hélt hita á okkur, eldaði matinn okkar og varði okkur gegn rándýrum. Hann brenndi líka borgirnar okkar til grunna. Með tímanum byggðu samfélög upp seiglu: eldþolin efni, brunahólf, atvinnuslökkvilið og byggingarreglugerðir. Vistkerfi, lag fyrir lag.

Rafmagnið fylgdi sömu leið. Eftir að Pearl Street-stöð Edisons lýsti upp Manhattan árið 1882 leiddi rafmagnið til eldsvoða, dauðsfalla af völdum raflosts og almennrar skelfingar. Án öryggisráðstafana á borð við einangraða víra, aflrofa og reglugerða fengu starfsmenn og vegfarendur raflost í borgum víðs vegar um landið. Borgaryfirvöld ræddu hvort ætti að hætta alfarið við tilraunina. Þess í stað, eftir því sem tækninni fleygði fram, komum við á fót óháðum prófunarstofnunum á borð við Underwriters Laboratories, iðnaðarstöðlum á borð við National Electrical Code og opinberri fjárfestingu sem færði rafmagn til samfélaga sem markaðurinn hafði látið sitja eftir. Hvert lag gerði rafmagn öruggara og aðgengilegra; í dag er það svo öruggt að barn getur ýtt á rofa og ljós kviknar.

Svona lítur seigla út þegar vel er að henni staðið.

Gervigreind krefst seiglu vistkerfis

Gervigreind fylgir sömu þróunarbraut og fyrri tækni, en þróast á áður óþekktum hraða.

Gervigreind er enn á frumstigi, en ávinningurinn er þegar augljós: hún dregur úr hindrunum við að stofna fyrirtæki, eykur aðgengi að menntun, hraðar vísindalegum uppgötvunum og umbreytir læknisfræði.

Á sama tíma eru áhætturnar að koma fram jafn hratt og spegilmynd af ávinningi gervigreindar. Sá sami vöxtur sem skapar nýjar atvinnugreinar getur kollvarpað þeim sem fyrir eru og haft áhrif á starfsferla. Sömu kerfi og geta hjálpað ungu fólki að læra og skapa gætu einnig stuðlað að skaðlegri hegðun. Verkfærin sem flýta fyrir líffræðilegum rannsóknum gætu auðveldað sköpun skaðlegra sýkla. Geta gervigreindar til að skrifa kóða gæti, í röngum höndum, ógnað mikilvægum innviðum.

Upphaflega taldi teymið hjá OpenAI að tryggja að gervigreind gagnist samfélaginu byggðist fyrst og fremst á því að leysa tæknilega samræmingarvandamálið. Þetta er áfram afar mikilvægt—og kjarninn í starfi okkar—en við teljum nú að það sé aðeins einn hluti af heildarmyndinni. Eftir því sem gervigreind breiðist út um atvinnugreinar og lönd mun samfélagið einnig þurfa á að halda óháðum rannsóknum, opinberum innviðum, samhæfingu atvinnulífsins og alveg nýjum sérfræðisviðum. Í stuttu máli mun það krefjast seiglu gervigreindar.

Við höfum valið að einbeita okkur í upphafi að fjórum sviðum2 sem liggja á mótum umfangsmikillar áhættu til skamms tíma og tafarlausra áhrifa:

  1. Líffræðileg seigla til að hjálpa til við að koma í veg fyrir sérhannaða heimsfaraldra framtíðarinnar;

  2. Netöryggisseigla til að vinna að því að tryggja öryggi mikilvægra kerfa heimsins;

  3. Öryggi gervigreindarlíkana til að treysta stjórn mannkyns á líkönunum sem við búum til; og

  4. Áhrif gervigreindar á ungt fólk til að stuðla að því að tækni verði jákvætt afl fyrir komandi kynslóðir.

Vinna okkar er rétt að hefjast. Við áformum að deila frekari upplýsingum um áætlanir okkar og fyrstu styrki á hverju sviði og að stækka starfsemina á fleiri sviðum með tímanum.

Bio-resilience

AI will enable biological research to move at unprecedented speed, helping develop new cures and public health improvements that enable us to all live healthier and longer. However, these same capabilities could also be misused by malicious actors, lowering the barrier to designing harmful pathogens.

The age of AI requires a renewed focus on biosecurity. Because advanced AI systems could be misused by bad actors to help create a wide range of biological threats, we will prioritize pathogen-agnostic biosecurity solutions. This will require investments across prevention, detection, and defense. We need to make it harder for malicious actors to access the expertise, equipment, and materials to create biological threats, improve our ability to identify and track novel outbreaks early, and strengthen the technologies—such as protective equipment, indoor air cleaning systems, and medical countermeasures—needed to respond quickly and effectively.

Cyber-resilience

AI has begun to rapidly reshape the cybersecurity landscape. The work that once required specialized teams can now be assisted or automated by capable models. At the same time, rapidly-improving AI capabilities can also be used to accelerate cyberdefenders, including by identifying and patching vulnerabilities and accelerating response.

Many large companies and private actors can spend heavily on cyber to secure their own systems, including with new advances in AI. We anticipate focusing significant resources on securing other important societal actors that are less resourced and will have a much harder time deploying AI-ready cyberdefenses as quickly as needed. In parallel, we are also focused on preparing for novel security challenges that artificial general intelligence will ultimately bring.

AI model safety

AI model safety focuses on the behavior of the systems themselves—whether they are truthful, reliable, and aligned with human intent. In a world where this goes awry, models can break out and behave in unpredictable ways, deceiving us or pursuing goals beyond their design. Getting this right becomes increasingly important as AI systems grow more autonomous and approach—and eventually surpass—human-level intelligence.

AI companies are investing substantial resources in model safety. However, the importance of this challenge calls for a broader, more robust ecosystem: independent institutions to evaluate model safety, public infrastructure to verify models’ safe deployment in practice, and continued advances in alignment science that advance the field broadly.

AI’s impact on young people

Young people are often the earliest adopters of new technologies, using them to learn, create, communicate, and explore the world. AI is no exception. But as these tools become an increasing part of young people’s daily lives, it is critical that we develop a stronger evidence base to understand its impacts.

Families, schools, policymakers, and community organizations are all grappling with questions about how and when young people engage with AI—including its impact on human connection, learning, and development. Our initial focus will be on advancing independent research to help guide those decisions—to better understand where AI can support development, the risks it may introduce, and the contexts that shape those effects.

These insights should drive broad safety standards and design principles that guide how any AI product is developed, how schools choose to deploy them, and if and how families decide to incorporate these technologies into their lives.

The work ahead

There is one critical difference between AI and the technologies that came before it: speed.

Fire resilience took millennia. Electricity resilience took decades. AI resilience is evolving in a matter of years. The systems that make it safe, reliable, and broadly beneficial must be built alongside it.

If we get it right, AI can become part of the foundational infrastructure of modern life—expanding access to knowledge, accelerating discovery, and improving lives at a global scale.

But that outcome isn’t guaranteed. No general purpose technology ever made itself safe.

Resilience is a permanent discipline that requires many people and institutions to build, invest, and collaborate. That is the work ahead, and it is one of the defining challenges of our time. We hope you’ll join us.

Neðanmálsgreinar

  1. 1

    OpenAI Foundation áætlar að fjárfesta meira en 1 milljarði USD í nokkrum verkefnum á komandi ári og 25 milljörðum USD í seiglu gervigreindar, lífvísindum og lækningu sjúkdóma á komandi árum.

  2. 2

    Efnahagsleg áhrif gervigreindar eru hluti af víðtækari áætlun um seiglu gervigreindar. Í ljósi umfangs efnahagslegu umskiptanna er Foundation að þróa þetta starf sem sérstakt verkefni. Lestu meira hér.

  • Thank you to Zach Sims for helping develop this piece.
  • Acknowledgements: Jeff Arnold, Naomi Bashkansky, Sean Coey, Rebecca Distler, Adrien Ecoffet, Tarun Gogineni, Mike Heimowitz, Alice Lee, Leyan Lo, Rodney Manabat, Mike McCormick, Cody Nguyen, Yonadav Shavit, Kendal Simon, Divya Siddarth, Jacob Trefethen.