Vastupidavus tehisintellekti ajastul

Tehisintellekt, üldotstarbelised tehnoloogiad ja miks vastupidavus on meie põlvkonna töö.

Autor: Wojciech Zaremba

OpenAI fondi eesmärk on tagada, et tehislik üldintellekt (AGI) tooks kasu kogu inimkonnale.

Oleme teinud väsimatult tööd, et pidada sammu tehisintellekti enda kiirete edusammudega. Aprillis kuulutas fond välja esimesed 100 miljoni dollari suurused toetused eluteaduste ja haiguste ravimise valdkonnas eesmärgiga aidata vältida ja ravida selliseid haigusi nagu Alzheimeri tõbi, rakendades selleks arenenud tehisintellekti. Eelmisel nädalal kuulutasime välja oma töökohtade ja majandusliku tuleviku programmi lootusega mõista ja kujundada seda, mida tähendavad töö ja majanduslik õitseng tulevastele põlvkondadele.

Täna avame oma visiooni järgmise suurema programmi jaoks—tagamaks, et tehisintellekti võimekuste kasvades kasvaks sama kiiresti ka ühiskonna võime seda rakendada. Me nimetame seda tööd tehisintellekti vastupidavuseks: ökosüsteemi lähenemisviis, mis on vajalik tehisintellekti riskide maandamiseks, et ühiskond saaks maksimeerida selle eeliseid.

Meie töö on juba alanud. Vaid paari lühikese kuu jooksul alates oma töö alustamisest teeb fond tööd enam kui 130 miljoni dollari suuruste toetuste lõplikuks vormistamiseks organisatsioonidele meie tehisintellekti vastupidavuse programmi kaudu, mida jagatakse peagi avalikult ja mida on veel tulemas.1

Läbimurdeliste tehnoloogiate muster

Tehisintellekti vastupidavuse olulisust on kõige parem mõista läbi mineviku tehnoloogiate prisma, mis on inimkonna ajalugu märkimisväärselt kujundanud.

Aeg-ajalt ilmub tehnoloogia, mis kujundab ühiskonna algusest peale ümber. Majandusteadlased nimetavad neid „üldotstarbelisteks tehnoloogiateks“. Tuli. Trükipress. Elekter. Internet. Kõik need järgisid sarnast kaart: kiire innovatsioon, reaalsed riskid ja asutused, mis püüavad järele jõuda. Kuid iga näide näitab ka seda, mida on vaja võimsa tehnoloogia ohutuks muutmiseks.

Tuli tegi inimtsivilisatsiooni võimalikuks. See hoidis meid soojas, küpsetas meie toitu ja kaitses meid kiskjate eest. Kuid see põletas ka meie linnu maani maha. Aja jooksul ehitasid ühiskonnad üles vastupidavuse: tulekindlad materjalid, hüdrantide võrgustikud, elukutselised tuletõrjeosakonnad ja ehitusnormid. Ökosüsteem, kiht-kihilt.

Elekter järgis sama teed. Pärast seda, kui Edisoni Pearl Street Station 1882. aastal Manhattani valgustas, tõi elekter kaasa tulekahjusid, elektrilööke ja avalikku paanikat. Ilma kaitsemeetmeteta, nagu isoleeritud juhtmed, kaitselülitid ja eeskirjad, said töötajad ja kõrvalseisjad elektrilööke linnades üle kogu riigi. Linnad vaidlesid selle üle, kas eksperiment tuleks täielikult hüljata. Selle asemel, kui tehnoloogia arenes, lõime sõltumatud testimisorganisatsioonid nagu Underwriters Laboratories, valdkonnastandardid nagu National Electrical Code ja avalikud investeeringud, mis tõid elektri kogukondadesse, mille turg oli maha jätnud. Iga kiht muutis elektri ohutumaks ja kättesaadavamaks; täna on see nii ohutu, et laps saab lülitit vajutada ja valgus ilmub.

See on see, milline vastupidavus välja näeb, kui see on hästi tehtud.

Tehisintellekt vajab vastupidavuse ökosüsteemi

Tehisintellekt järgib sama trajektoori nagu varasemad tehnoloogiad, kuid liigub enneolematu kiirusega.

Oleme veel selle algusajajärgus, kuid eelised on juba selged: tehisintellekt vähendab tõkkeid ettevõtte asutamisel, laiendab juurdepääsu haridusele, kiirendab teaduslikke avastusi ja muudab meditsiini.

Samal ajal on riskid ilmnemas sama kiiresti ja tehisintellekti eeliste peegelpildina. Sama kasv, mis loob uusi tööstusharusid, võib olemasolevaid pea peale pöörata ja karjääre häirida. Sama süsteemid, mis võivad aidata noortel õppida ja luua, võivad viia ka ebasoovitava käitumiseni. Tööriistad, mis kiirendavad bioloogilist uurimistööd, võiksid vähendada tõkkeid kahjulike patogeenide loomisel. Ja tehisintellekti võime koodi kirjutada võiks valedes kätes ohustada kriitilist infrastruktuuri.

Varajane OpenAI meeskond uskus, et tehisintellekti ühiskonnale kasulikuks muutmise tagamine sõltub peamiselt tehnilise joondamisprobleemi lahendamisest. See on endiselt kriitiline—ja meie töö keskmes—kuid praegu usume, et see on vaid üks osa puslest. Kuna tehisintellekt levib üle sektorite ja riikide, vajab ühiskond ka sõltumatut uurimistööd, avalikku infrastruktuuri, tööstusharude koordineerimist ja täiesti uusi erialavaldkondi. Lühidalt, see nõuab tehisintellekti vastupidavust.

Oleme otsustanud keskenduda oma esialgsele tööle neljas valdkonnas2, mis asuvad suurte lähiaja riskide ja otsese mõju ristumiskohas:

  1. Biovastupidavus aitamaks vältida tuleviku konstrueeritud pandeemiaid;

  2. Kübervastupidavus töötamaks selle nimel, et tagada meie maailma kriitiliste süsteemide ohutus;

  3. Tehisintellekti mudelite ohutus meie loodud mudelite üle inimkonna kontrolli kindlustamiseks; ja

  4. Tehisintellekti mõju noortele, aitamaks muuta tehnoloogia tulevaste põlvkondade jaoks positiivseks jõuks.

Meie töö alles algab. Kavatseme jagada rohkem infot oma strateegiate ja esmaste toetuste kohta igas valdkonnas ning aja jooksul laieneda teistele aladele.

Bio-resilience

AI will enable biological research to move at unprecedented speed, helping develop new cures and public health improvements that enable us to all live healthier and longer. However, these same capabilities could also be misused by malicious actors, lowering the barrier to designing harmful pathogens.

The age of AI requires a renewed focus on biosecurity. Because advanced AI systems could be misused by bad actors to help create a wide range of biological threats, we will prioritize pathogen-agnostic biosecurity solutions. This will require investments across prevention, detection, and defense. We need to make it harder for malicious actors to access the expertise, equipment, and materials to create biological threats, improve our ability to identify and track novel outbreaks early, and strengthen the technologies—such as protective equipment, indoor air cleaning systems, and medical countermeasures—needed to respond quickly and effectively.

Cyber-resilience

AI has begun to rapidly reshape the cybersecurity landscape. The work that once required specialized teams can now be assisted or automated by capable models. At the same time, rapidly-improving AI capabilities can also be used to accelerate cyberdefenders, including by identifying and patching vulnerabilities and accelerating response.

Many large companies and private actors can spend heavily on cyber to secure their own systems, including with new advances in AI. We anticipate focusing significant resources on securing other important societal actors that are less resourced and will have a much harder time deploying AI-ready cyberdefenses as quickly as needed. In parallel, we are also focused on preparing for novel security challenges that artificial general intelligence will ultimately bring.

AI model safety

AI model safety focuses on the behavior of the systems themselves—whether they are truthful, reliable, and aligned with human intent. In a world where this goes awry, models can break out and behave in unpredictable ways, deceiving us or pursuing goals beyond their design. Getting this right becomes increasingly important as AI systems grow more autonomous and approach—and eventually surpass—human-level intelligence.

AI companies are investing substantial resources in model safety. However, the importance of this challenge calls for a broader, more robust ecosystem: independent institutions to evaluate model safety, public infrastructure to verify models’ safe deployment in practice, and continued advances in alignment science that advance the field broadly.

AI’s impact on young people

Young people are often the earliest adopters of new technologies, using them to learn, create, communicate, and explore the world. AI is no exception. But as these tools become an increasing part of young people’s daily lives, it is critical that we develop a stronger evidence base to understand its impacts.

Families, schools, policymakers, and community organizations are all grappling with questions about how and when young people engage with AI—including its impact on human connection, learning, and development. Our initial focus will be on advancing independent research to help guide those decisions—to better understand where AI can support development, the risks it may introduce, and the contexts that shape those effects.

These insights should drive broad safety standards and design principles that guide how any AI product is developed, how schools choose to deploy them, and if and how families decide to incorporate these technologies into their lives.

The work ahead

There is one critical difference between AI and the technologies that came before it: speed.

Fire resilience took millennia. Electricity resilience took decades. AI resilience is evolving in a matter of years. The systems that make it safe, reliable, and broadly beneficial must be built alongside it.

If we get it right, AI can become part of the foundational infrastructure of modern life—expanding access to knowledge, accelerating discovery, and improving lives at a global scale.

But that outcome isn’t guaranteed. No general purpose technology ever made itself safe.

Resilience is a permanent discipline that requires many people and institutions to build, invest, and collaborate. That is the work ahead, and it is one of the defining challenges of our time. We hope you’ll join us.

Footnotes

  1. 1

    The OpenAI Foundation expects to invest more than $1 billion across several programs over the next year, and $25 billion in AI Resilience and Life Sciences & Curing Disease in the years ahead.

  2. 2

    The economic impacts of AI are part of the broader AI resilience agenda. Given the scale of the economic transition, the Foundation is developing this work as a separate program. Read more here.

  • Thank you to Zach Sims for helping develop this piece.
  • Acknowledgements: Jeff Arnold, Naomi Bashkansky, Sean Coey, Rebecca Distler, Adrien Ecoffet, Tarun Gogineni, Mike Heimowitz, Alice Lee, Leyan Lo, Rodney Manabat, Mike McCormick, Cody Nguyen, Yonadav Shavit, Kendal Simon, Divya Siddarth, Jacob Trefethen.