Март выдался странным месяцем.
Примерно пятнадцать религиозных мыслителей встретились с представителями Anthropic. Компания, занимающаяся искусственным интеллектом, задала им необычный, но крайне значимый вопрос.
Как научить бота, работающего на основе кода, поступать правильно?
Приглашения доходили до адресатов разными путями. Грег Кутсона получил письмо по электронной почте. Брайан Патрик Грин узнал о встрече через сеть знакомых после того, как Anthropic искала подходящие имена. В итоге разговоры зашли о модели Claude и о моральных принципах, которые не дают чат-боту сойти с рельсов.
Речь шла не о насаждении благочестия. И тем более не о фанатичной пропаганде Библии. Речь шла о мудрости. О древних традициях рассуждений. Лабораториям, которым всего пять лет, стало тесно в рамках своих внутренних правил. Их системы слишком убедительны и сложны в управлении. Простых списков запретов больше недостаточно.
«Думаю, они достигли точки, — сказал Грин, — когда их мощь начинает превосходить внутреннюю мудрость компании».
Он курирует вопросы этики в технологиях в Университете Санта-Клары. Он знает, как теология встречается с технологиями. Лаборатории нужна была помощь. Кутсона согласен с этой оценкой. Он возглавляет направление «ИИ и вера». Он помнит, как сотрудники Anthropic признавались, что чувствуют себя перегруженными. «Эти вопросы, — говорили они, — слишком велики для нас».
Мы не можем ответить на них в одиночку.
(Anthropic не комментировала ситуацию. Стандартная процедура.)
Но мир вокруг них менялся. 25 мая Папа Лев XIV выпустил свою первую энциклику. Magnifica Humanitas (Великое человеческое достоинство). Сорок тысяч слов. В ней призывали к «разоружению» ИИ. Не к его отвержению, а к освобождению от предположения, что технологическая сила дает право на власть. Кристофер Ола, сооснователь Anthropic, присутствовал в Ватикане. Он слышал это обращение.
Ставки высоки. Сотни миллионов людей еженедельно общаются с ИИ. Разработчики «впечатают» ценности в модели. Они используют ограничители (guardrails). Они настраивают корректирующие ответы. То, что модели говорят о горе, абортах или смерти, зависит от этих выборов. Законов мало. Единого стандарта нет. До сих пор.
Это проявление смирения? Или индустрия, импровизирующая этические нормы на ходу? Вероятно, то и другое.
Но может ли религия действительно помочь?
Традиции веками решали эту задачу. Моральное воспитание. Внедрение уроков в сознание агентов. «Религии говорят об этом тысячи лет», — отмечает Грин. У них могут быть полезные идеи. Мы хотим, чтобы боты были добрыми. Чтобы они не совершали плохих поступков.
У мартовских встреч была цель. Уточнение «конституции» Claude — записанных принципов. Модель проверяет свои ответы на соответствие этим принципам.
Anthropic хочет то, что работает. Они тестируют религиозные концепции. По словам Грина, лаборатория понимает, что не может написать правило для каждого отдельного взаимодействия. Это невозможно. Вместо чек-листа они хотят создать персону. Определенный склад характера.
Конечно, существует скептицизм. Карисса Велис преподает этику ИИ в Оксфорде. Она ставит под сомнение мотивы. Или, вернее, действия. Намерения запутаны. Интересы же очевидны. «Я задаюсь вопросом, — спрашивает она, — имеет ли смысл выяснять, означают ли они то, что…»
Она обрывается, говоря об искренности. Или, может быть, нет. Возможно, она беспокоится, что это «этический гринвошинг» (эко-отмывание, но для этики) — использование святого веса в целях пиара. Грин говорит, что нет. Он был там. Он утверждает, что намерения искренни. Фальшивая религиозность разоблачается быстро. Бэкшлот был бы ядерным.
Но искренность не гарантирует успеха.
Встречи не были идеальными. Некоторые моменты были неловкими. Другие — отмечены взаимопониманием. Даже гости не были уверены, что будет дальше. «Все слушали, — вспоминал Грин, — но… что мы делаем теперь?»
Anthropic извлекла уроки. Они отточили формат. В конце апреля круг участников расширился. Евреи, индуисты, сикхи, мормоны, греко-православные. Все были приглашены.
Велис по-прежнему беспокоится. Религиозные образы в Кремниевой долине? Опасно. Это создает племенность. Эмоции зашкаливают. Деловые причины холодны. Религия внушает послушание. Это инструмент власти.
Папа Лев XIV выступал против неоправданной власти, навязанной сверху. Эксперимент Anthropic показывает, насколько это сложно.
