Weerbaarheid in het tijdperk van AI

AI, general purpose technologies en waarom weerbaarheid de taak van onze generatie is.

Door Wojciech Zaremba

De missie van de OpenAI Foundation is ervoor te zorgen dat kunstmatige algemene intelligentie de hele mensheid ten goede komt.

We werken onvermoeibaar om de snelle ontwikkelingen binnen AI zelf bij te benen. In april kondigde de Foundation de eerste 100 miljoen dollar aan subsidies aan voor de biowetenschappen en de bestrijding van ziekten. Ons doel is om met behulp van geavanceerde AI ziektes zoals alzheimer te helpen voorkomen en behandelen. Vorige week kondigden we ons programma Jobs and Economic Futures aan. Hiermee willen we begrijpen en vormgeven wat werk en economische welvaart betekenen voor toekomstige generaties.

Vandaag presenteren we de visie achter ons volgende grote initiatief. We willen ervoor zorgen dat de maatschappij net zo snel leert om te gaan met AI als dat de technologie zelf zich ontwikkelt. We noemen dit AI-weerbaarheid: een ecosysteem-brede aanpak om de risico's van AI te beperken, zodat de samenleving de voordelen ervan kan maximaliseren.

Ons werk is al begonnen. Slechts enkele maanden na de start legt de Foundation momenteel de laatste hand aan meer dan 130 miljoen dollar aan subsidies voor diverse organisaties binnen ons AI-weerbaarheidsprogramma. De details hiervan worden binnenkort bekendgemaakt, en er volgt snel meer.1

Het patroon van transformatieve technologieën

Het belang van AI-weerbaarheid is het best te begrijpen door te kijken naar eerdere technologieën die de menselijke geschiedenis ingrijpend hebben gevormd.

Eens in de zoveel tijd dient zich een technologie aan die de samenleving vanaf de grond toe opnieuw vormgeeft. Economen noemen dit 'general purpose technologies'. Vuur. De drukpers. Elektriciteit. Het internet. Elk volgde een vergelijkbaar verloop: snelle innovatie, reële risico's en instanties die zich moesten haasten om bij te blijven. Maar elk voorbeeld laat ook zien wat er nodig is om een krachtige technologie veilig te maken.

Vuur maakte de menselijke beschaving mogelijk. Het hield ons warm, kookte ons eten en beschermde ons tegen roofdieren. Het legde ook onze steden in de as. In de loop der tijd bouwde de samenleving weerbaarheid op: brandvertragende materialen, netwerken van brandkranen, professionele brandweerkorpsen en bouwvoorschriften. Een ecosysteem, laag voor laag.

Elektriciteit volgde hetzelfde pad. Nadat Edisons Pearl Street Station in 1882 Manhattan verlichtte, bracht elektriciteit branden, elektrocuties en publieke paniek met zich mee. Zonder bescherming zoals geïsoleerde bedrading, zekeringen en richtlijnen werden arbeiders en omstanders in steden door het hele land geëlektrocuteerd. Steden debatteerden over de vraag of het experiment niet volledig moest worden gestaakt. In plaats daarvan richtten we, naarmate de technologie vorderde, onafhankelijke keuringsinstanties op zoals Underwriters Laboratories, industriestandaarden zoals de National Electrical Code, en zorgden we voor publieke investeringen die stroom brachten naar gemeenschappen die door de markt waren achtergelaten. Elke laag maakte elektriciteit veiliger en toegankelijker; vandaag de dag is het zo veilig dat een kind een schakelaar kan omzetten en er licht brandt.

Zo ziet weerbaarheid eruit wanneer het goed wordt vormgegeven.

AI vereist een weerbaar ecosysteem

AI volgt hetzelfde traject als eerdere technologieën, maar beweegt zich voort met een ongekende snelheid.

We staan nog aan het begin, maar de voordelen zijn nu al duidelijk: AI verlaagt de drempel om een bedrijf te starten, verruimt de toegang tot onderwijs, versnelt wetenschappelijke ontdekkingen en transformeert de geneeskunde.

Tegelijkertijd dienen de risico's zich net zo snel aan, als het spiegelbeeld van de voordelen van AI. Dezelfde groei die nieuwe industrieën creëert, kan bestaande ontwrichten en carrières overhoopgooien. Dezelfde systemen die jongeren kunnen helpen te leren en te creëren, kunnen ook leiden tot schadelijk gedrag. De tools die biologisch onderzoek versnellen, kunnen de drempel voor het creëren van schadelijke pathogenen verlagen. En het vermogen van AI om code te schrijven kan, in de verkeerde handen, vitale infrastructuur bedreigen.

Het vroege OpenAI-team geloofde dat het laten slagen van AI voor de samenleving vooral afhing van het oplossen van het technische alignment-probleem. Dat blijft cruciaal en staat centraal in ons werk, maar we geloven nu dat het slechts een deel van de puzzel is. Naarmate AI zich verspreidt over sectoren en landen, heeft de samenleving ook behoefte aan onafhankelijk onderzoek, publieke infrastructuur, sectorbrede coördinatie en compleet nieuwe expertisegebieden. Kortom, het vereist AI-weerbaarheid.

We hebben ervoor gekozen ons eerste werk te richten op vier gebieden2 die zich op het snijvlak bevinden van grote, nabije risico's en directe impact:

  1. Bio-weerbaarheid om kunstmatige pandemieën van de toekomst te helpen voorkomen;

  2. Cyberweerbaarheid om te werken aan de veiligheid van de vitale systemen in onze wereld;

  3. Veiligheid van AI-modellen om de controle van de mensheid over de modellen die we creëren te verankeren; en

  4. De impact van AI op jongeren om te helpen technologie een positieve kracht te laten zijn voor toekomstige generaties.

Ons werk is nog maar net begonnen. We zijn van plan om meer te delen over onze strategieën en eerste subsidies binnen elk gebied, en dit in de loop der tijd uit te breiden naar andere gebieden.

Bio-resilience

AI will enable biological research to move at unprecedented speed, helping develop new cures and public health improvements that enable us to all live healthier and longer. However, these same capabilities could also be misused by malicious actors, lowering the barrier to designing harmful pathogens.

The age of AI requires a renewed focus on biosecurity. Because advanced AI systems could be misused by bad actors to help create a wide range of biological threats, we will prioritize pathogen-agnostic biosecurity solutions. This will require investments across prevention, detection, and defense. We need to make it harder for malicious actors to access the expertise, equipment, and materials to create biological threats, improve our ability to identify and track novel outbreaks early, and strengthen the technologies—such as protective equipment, indoor air cleaning systems, and medical countermeasures—needed to respond quickly and effectively.

Cyber-resilience

AI has begun to rapidly reshape the cybersecurity landscape. The work that once required specialized teams can now be assisted or automated by capable models. At the same time, rapidly-improving AI capabilities can also be used to accelerate cyberdefenders, including by identifying and patching vulnerabilities and accelerating response.

Many large companies and private actors can spend heavily on cyber to secure their own systems, including with new advances in AI. We anticipate focusing significant resources on securing other important societal actors that are less resourced and will have a much harder time deploying AI-ready cyberdefenses as quickly as needed. In parallel, we are also focused on preparing for novel security challenges that artificial general intelligence will ultimately bring.

AI model safety

AI model safety focuses on the behavior of the systems themselves—whether they are truthful, reliable, and aligned with human intent. In a world where this goes awry, models can break out and behave in unpredictable ways, deceiving us or pursuing goals beyond their design. Getting this right becomes increasingly important as AI systems grow more autonomous and approach—and eventually surpass—human-level intelligence.

AI companies are investing substantial resources in model safety. However, the importance of this challenge calls for a broader, more robust ecosystem: independent institutions to evaluate model safety, public infrastructure to verify models’ safe deployment in practice, and continued advances in alignment science that advance the field broadly.

AI’s impact on young people

Young people are often the earliest adopters of new technologies, using them to learn, create, communicate, and explore the world. AI is no exception. But as these tools become an increasing part of young people’s daily lives, it is critical that we develop a stronger evidence base to understand its impacts.

Families, schools, policymakers, and community organizations are all grappling with questions about how and when young people engage with AI—including its impact on human connection, learning, and development. Our initial focus will be on advancing independent research to help guide those decisions—to better understand where AI can support development, the risks it may introduce, and the contexts that shape those effects.

These insights should drive broad safety standards and design principles that guide how any AI product is developed, how schools choose to deploy them, and if and how families decide to incorporate these technologies into their lives.

The work ahead

There is one critical difference between AI and the technologies that came before it: speed.

Fire resilience took millennia. Electricity resilience took decades. AI resilience is evolving in a matter of years. The systems that make it safe, reliable, and broadly beneficial must be built alongside it.

If we get it right, AI can become part of the foundational infrastructure of modern life—expanding access to knowledge, accelerating discovery, and improving lives at a global scale.

But that outcome isn’t guaranteed. No general purpose technology ever made itself safe.

Resilience is a permanent discipline that requires many people and institutions to build, invest, and collaborate. That is the work ahead, and it is one of the defining challenges of our time. We hope you’ll join us.

Voetnoten

  1. 1

    De OpenAI Foundation verwacht het komende jaar meer dan 1 miljard dollar te investeren verspreid over verschillende programma's, en de komende jaren 25 miljard dollar in AI-weerbaarheid en Life Sciences & Curing Disease.

  2. 2

    De economische impact van AI is onderdeel van de bredere agenda voor AI-weerbaarheid. Gezien de omvang van de economische transitie ontwikkelt de Foundation dit werk als een afzonderlijk programma. Lees hier meer.

  • Thank you to Zach Sims for helping develop this piece.
  • Acknowledgements: Jeff Arnold, Naomi Bashkansky, Sean Coey, Rebecca Distler, Adrien Ecoffet, Tarun Gogineni, Mike Heimowitz, Alice Lee, Leyan Lo, Rodney Manabat, Mike McCormick, Cody Nguyen, Yonadav Shavit, Kendal Simon, Divya Siddarth, Jacob Trefethen.