Marzo è stato strano.
Circa quindici pensatori religiosi si sono seduti con Anthropic. La società di intelligenza artificiale ha posto loro una domanda strana. Anche uno consequenziale.
Come si insegna a un bot di codice a essere bravo?
Gli inviti sono arrivati diversamente. Greg Cootsona ha ricevuto un’e-mail. Brian Patrick Green lo ha saputo tramite una rete di amici di amici dopo che Anthropic ha cercato nomi. Finirono per parlare di Claude. Sul quadro morale che impedisce al chatbot di andare in spirale.
Non si tratta di renderlo pio. Mai di criticare la Bibbia. Quasi saggezza. Vecchie tradizioni di ragionamento. I laboratori di cinque anni stanno diventando troppo grandi per le loro regole domestiche. I loro sistemi sono persuasivi. Difficile da governare. Gli elenchi semplici non bastano più.
“Penso che abbiano raggiunto un punto”, ha detto Green, “in cui il potere sta superando la loro saggezza interna”.
Dirige l’etica tecnologica all’Università di Santa Clara. Sa che la teologia incontra la tecnologia. Il laboratorio aveva bisogno di aiuto. Cootsona è d’accordo. Dirige AI e Faith. Ricorda che il personale dell’Anthropic ha ammesso di essere sopraffatto. “Queste domande”, hanno detto, “sono troppo grandi per noi”.
Non possiamo rispondere da soli.
(Anthropic non ha commentato. Procedura standard.)
Ma il mondo intorno a loro stava cambiando. Il 25 maggio papa Leone XIV lasciò cadere la sua prima enciclica. Magnifica Humanitas. Quarantamila parole. Ha chiesto che l’intelligenza artificiale fosse “disarmata”. Non rifiutato. Liberati dal presupposto che il potere tecnologico significhi diritto a governare. Christopher Olah, cofondatore di Anthropic, era presente in Vaticano. L’ha sentito.
La posta in gioco? Enorme. Centinaia di milioni chattano settimanalmente con l’intelligenza artificiale. Gli sviluppatori inseriscono valori. Usano i guardrail. Mettono a punto le risposte correttive. Ciò che i modelli dicono riguardo al dolore, all’aborto o alla morte deriva da queste scelte. Poche leggi. Nessun metodo standard. Finora.
È umiltà? O un’industria che improvvisa l’etica al volo? Probabilmente entrambi.
Ma la religione può davvero aiutare?
Le tradizioni hanno impiegato millenni per risolvere questo problema. Formazione morale. Instillare lezioni negli agenti. “Le religioni ne parlano da migliaia di anni”, osserva Green. Potrebbero avere intuizioni. Vogliamo che i robot siano buoni. Per non fare cose cattive.
Gli incontri di marzo avevano un obiettivo. Affinare la “costituzione” di Claude. Principi scritti. Il modello critica le proprie risposte contro di loro.
Anthropic vuole ciò che funziona. Stanno testando le idee religiose. Green afferma che il laboratorio sa che non è possibile scrivere una regola per ogni singola interazione. È impossibile. Invece di una lista di controllo, vogliono un personaggio. Una disposizione.
Lo scetticismo esiste, ovviamente. Carissa Véliz insegna etica dell’intelligenza artificiale a Oxford. Mette in dubbio le motivazioni. O meglio, le azioni. Le intenzioni sono confuse. Gli incentivi sono chiari. “Mi chiedo”, chiede, “se abbia senso capire se intendono quello che…”
La sua sincerità si interrompe. O forse no. Forse si chiede se non sia un lavaggio dell’etica. Usare il peso sacro per le PR. Il verde dice di no. Lui era lì. Dice che è sincero. La religione falsa viene individuata rapidamente. La reazione sarebbe nucleare.
Ma la sincerità non è una garanzia.
Gli incontri non erano perfetti. Alcuni erano imbarazzanti. Altri avevano cameratismo. Persino gli ospiti non erano sicuri di cosa sarebbe successo dopo. “Tutti stavano ascoltando”, ha ricordato Green, “ma… cosa facciamo adesso?”
Imparato antropico. Hanno affinato il formato. A fine aprile il cerchio si è allargato. Ebrei, indù, sikh, mormoni, greco-ortodossi. Tutti invitati.
Tuttavia, Véliz è preoccupato. Immagini religiose nella Silicon Valley? Pericoloso. Crea tribalismo. Le emozioni sono forti. Le ragioni di lavoro sono fredde. La religione ispira obbedienza. Ciò fa leva sul potere.
Papa Leone XIV si oppose al potere opaco imposto dall’alto. L’esperimento di Anthropic mostra quanto sia difficile.




















