Maart was vreemd.
Ongeveer vijftien religieuze denkers zaten met Anthropic om tafel. Het AI-bedrijf stelde hen een rare vraag. Ook een consequentie.
Hoe leer je een codebot goed te zijn?
De uitnodigingen kwamen anders aan. Greg Cootsona kreeg een e-mail. Brian Patrick Green hoorde via een vriend-van-een-vriend-netwerk nadat Anthropic naar namen had gezocht. Ze hadden het uiteindelijk over Claude. Over het morele raamwerk dat ervoor zorgt dat de chatbot niet in een spiraal terechtkomt.
Niet om het vroom te maken. Nooit over bijbelkloppingen. Gewoon over wijsheid. Oude tradities van redeneren. Vijf jaar oude laboratoria ontgroeien hun huisregels. Hun systemen zijn overtuigend. Moeilijk te regeren. Simpele lijstjes volstaan niet meer.
‘Ik denk dat ze een punt hebben bereikt,’ zei Green, ‘waar de macht hun interne wijsheid een beetje overtreft.’
Hij leidt de technische ethiek aan de Santa Clara Universiteit. Hij weet dat theologie en technologie elkaar ontmoeten. Het laboratorium had hulp nodig. Cootsona is het daarmee eens. Hij regisseert AI en Faith. Hij herinnert zich dat de medewerkers van Anthropic toegaf dat ze overweldigd waren. ‘Deze vragen’, zeiden ze, ‘zijn te groot voor ons.’
We kunnen ze niet alleen beantwoorden.
(Anthropic gaf geen commentaar. Standaardprocedure.)
Maar de wereld om hen heen veranderde. Op 25 mei liet paus Leo XIV zijn eerste encycliek vallen. Magnifica Humanitas. Veertigduizend woorden. Het riep op tot ‘ontwapening’ van AI. Niet afgewezen. Bevrijd van de veronderstelling dat technische macht het recht om te regeren betekent. Christopher Olah, medeoprichter van Anthropic, was aanwezig in het Vaticaan. Hij hoorde het.
De inzet? Enorm. Honderden miljoenen chatten wekelijks met AI. Ontwikkelaars bakken er waarden in. Ze gebruiken vangrails. Ze stemmen corrigerende reacties af. Wat de modellen zeggen over verdriet, abortus of de dood komt voort uit deze keuzes. Weinig wetten. Geen standaardmethode. Tot nu toe.
Is het nederigheid? Of een industrie die ethiek ter plekke improviseert? Waarschijnlijk allebei.
Maar kan religie daadwerkelijk helpen?
Tradities hebben duizenden jaren besteed aan het oplossen hiervan. Morele vorming. Lessen geven aan agenten. “Religies praten hier al duizenden jaren over”, merkt Green op. Misschien hebben ze inzichten. We willen dat bots goed zijn. Om geen slechte dingen te doen.
De bijeenkomsten in maart hadden een doel. Het verfijnen van Claude’s ‘grondwet’. Schriftelijke principes. Het model bekritiseert zijn eigen antwoorden daarop.
Anthropic wil wat werkt. Ze testen religieuze ideeën. Green zegt dat het laboratorium weet dat ze niet voor elke afzonderlijke interactie een regel kunnen schrijven. Dat is onmogelijk. In plaats van een checklist willen ze een persona. Een instelling.
Het is duidelijk dat er scepticisme bestaat. Carissa Véliz doceert AI-ethiek in Oxford. Ze twijfelt aan de motieven. Of beter gezegd: de acties. Intenties zijn rommelig. Prikkels zijn duidelijk. ‘Ik vraag me af,’ vraagt ze, ‘of het zinvol is om erachter te komen of ze bedoelen wat ze…’
Ze laat de oprechtheid achterwege. Of misschien niet. Misschien vraagt ze zich af of het ethisch wassen is. Heilig gewicht gebruiken voor PR. Groen zegt nee. Hij was daar. Hij zegt dat het oprecht is. Valse religie wordt snel opgemerkt. De reactie zou nucleair zijn.
Maar oprechtheid is geen garantie.
De bijeenkomsten waren niet perfect. Sommigen waren lastig. Anderen hadden kameraadschap. Zelfs de gasten wisten niet zeker wat er daarna zou gebeuren. ‘Iedereen luisterde,’ herinnerde Green zich, ‘maar… wat moeten we nu doen?’
Antropisch geleerd. Ze hebben het formaat aangescherpt. Eind april werd de cirkel groter. Joden, Hindoes, Sikhs, Mormonen, Grieks-orthodoxen. Allemaal uitgenodigd.
Toch maakt Véliz zich zorgen. Religieuze beelden in Silicon Valley? Gevaarlijk. Het creëert tribalisme. De emoties lopen hoog op. Zakelijke redenen zijn koud. Religie inspireert tot gehoorzaamheid. Dat maakt gebruik van macht.
Paus Leo XIV verzette zich tegen ondoorzichtige macht die van bovenaf werd opgelegd. Het experiment van Anthropic laat zien hoe moeilijk dat is.
