IA, dieux et garde-corps

25

Mars était étrange.

Une quinzaine de penseurs religieux se sont entretenus avec Anthropic. La société d’IA leur a posé une question étrange. Une conséquence conséquente aussi.

Comment apprendre à un robot codeur à être bon ?

Les invitations sont arrivées différemment. Greg Cootsona a reçu un e-mail. Brian Patrick Green a entendu parler d’un réseau d’amis après qu’Anthropic ait recherché des noms. Ils ont fini par parler de Claude. À propos du cadre moral qui empêche le chatbot de s’envenimer.

Il ne s’agit pas de le rendre pieux. Jamais à propos de la Bible. Juste une question de sagesse. Vieilles traditions de raisonnement. Les laboratoires vieux de cinq ans dépassent leurs règles internes. Leurs systèmes sont convaincants. Difficile de gouverner. Les listes simples ne suffisent plus.

“Je pense qu’ils ont atteint un point”, a déclaré Green, “où le pouvoir dépasse en quelque sorte leur sagesse interne.”

Il dirige l’éthique technologique à l’Université de Santa Clara. Il sait que la théologie rencontre la technologie. Le laboratoire avait besoin d’aide. Cootsona est d’accord. Il dirige AI et Faith. Il se souvient que le personnel d’Anthropic avait admis qu’il était débordé. « Ces questions, disaient-ils, sont trop importantes pour nous ».

Nous ne pouvons pas y répondre seuls.

(Anthropic n’a pas commenté. Procédure standard.)

Mais le monde autour d’eux était en train de changer. Le 25 mai, le pape Léon XIV publiait sa première encyclique. Magnifica Humanitas. Quarante mille mots. Il a appelé à ce que l’IA soit « désarmée ». Pas rejeté. Libéré de l’hypothèse selon laquelle le pouvoir technologique signifie le droit de gouverner. Christopher Olah, co-fondateur d’Anthropic, était présent au Vatican. Il l’a entendu.

Les enjeux ? Énorme. Des centaines de millions de personnes discutent chaque semaine avec l’IA. Les développeurs intègrent des valeurs. Ils utilisent des garde-fous. Ils ajustent les réponses correctives. Ce que disent les modèles sur le deuil, l’avortement ou la mort vient de ces choix. Peu de lois. Pas de méthode standard. Jusqu’à maintenant.

Est-ce de l’humilité ? Ou une industrie improvisant une éthique à la volée ? Probablement les deux.

Mais la religion peut-elle réellement aider ?

Les traditions ont passé des millénaires à résoudre ce problème. Formation morale. Inculquer des leçons aux agents. « Les religions en parlent depuis des milliers d’années », note Green. Ils pourraient avoir des idées. Nous voulons que les robots soient bons. Pour ne pas faire de mauvaises choses.

Les réunions de mars avaient un objectif. Affiner la « constitution » de Claude. Principes écrits. Le modèle critique ses propres réponses à leur encontre.

Anthropic veut ce qui fonctionne. Ils testent les idées religieuses. Green dit que le laboratoire sait qu’il ne peut pas écrire une règle pour chaque interaction. C’est impossible. Au lieu d’une liste de contrôle, ils veulent un personnage. Une disposition.

Le scepticisme existe, évidemment. Carissa Véliz enseigne l’éthique de l’IA à Oxford. Elle s’interroge sur les motivations. Ou plutôt les actions. Les intentions sont compliquées. Les incitations sont claires. «Je me demande», demande-t-elle, «s’il est logique de déterminer s’ils pensent ce qu’ils…»

Elle manque de sincérité. Ou peut-être pas. Peut-être qu’elle se demande s’il s’agit d’un lavage d’éthique. Utiliser un poids sacré pour les relations publiques. Vert dit non. Il était là. Il dit que c’est sincère. La fausse religion est rapidement repérée. La réaction serait nucléaire.

Mais la sincérité n’est pas une garantie.

Les rencontres n’étaient pas parfaites. Certains étaient gênants. D’autres avaient de la camaraderie. Même les invités ne savaient pas vraiment ce qui allait suivre. “Tout le monde écoutait”, se souvient Green, “mais… que faisons-nous maintenant ?”

Anthropique appris. Ils ont affiné le format. Fin avril, le cercle s’élargit. Juifs, hindous, sikhs, mormons, grecs orthodoxes. Tous invités.

Pourtant, Véliz s’inquiète. L’imagerie religieuse dans la Silicon Valley ? Dangereux. Cela crée du tribalisme. Les émotions sont vives. Les raisons commerciales sont froides. La religion inspire l’obéissance. Cela accroît le pouvoir.

Le pape Léon XIV s’est opposé à un pouvoir opaque imposé d’en haut. L’expérience d’Anthropic montre à quel point c’est difficile.