AI, boskość i ograniczenia etyczne

15

Marzec był dziwnym miesiącem.

Około piętnastu myślicieli religijnych spotkało się z przedstawicielami antropii. Firma zajmująca się sztuczną inteligencją zadała im niezwykłe, ale niezwykle istotne pytanie.

Jak nauczyć bota opartego na kodzie postępować właściwie?

Zaproszenia docierały do odbiorców różnymi drogami. Greg Cutsona otrzymał e-mail. Brian Patrick Green dowiedział się o spotkaniu poprzez sieć znajomych po tym, jak Anthropic szukał odpowiednich nazwisk. W efekcie rozmowy zeszły na model Claude’a i zasady moralne, które chronią chatbota przed wypadnięciem z toru.

Nie chodziło tu o wpajanie pobożności. A zwłaszcza nie o fanatycznej propagandzie Biblii. Chodziło o mądrość. O starożytnych tradycjach rozumowania. W laboratoriach, które mają zaledwie pięć lat, zrobiło się ciasno w ramach wewnętrznych zasad. Ich systemy są zbyt przekonujące i trudne w zarządzaniu. Proste listy zakazów już nie wystarczają.

„Myślę, że osiągnęli punkt” – powiedział Greene – „w którym ich siła zaczyna przeważać nad wewnętrzną mądrością firmy”.

Nadzoruje etykę w technologii na Uniwersytecie Santa Clara. Wie, jak teologia łączy się z technologią. Laboratorium potrzebowało pomocy. Kutsona zgadza się z tą oceną. Kieruje kierunkiem AI i Wiary. Pamięta, jak pracownicy Anthropic mówili, że czuli się przytłoczeni. „Te pytania” – stwierdzili – „są dla nas za duże”.

Nie jesteśmy w stanie odpowiedzieć na nie sami.

(Anthropic nie skomentował sytuacji. Standardowa procedura.)

Ale świat wokół nich się zmieniał. 25 maja papież Leon XIV wydał swoją pierwszą encyklikę. Magnifica Humanitas (Wielka godność ludzka). Czterdzieści tysięcy słów. Wezwał do „rozbrojenia” sztucznej inteligencji. Nie do jej odrzucenia, ale do wyzwolenia się z założenia, że ​​władza technologiczna daje prawo do władzy. W Watykanie obecny był Krzysztof Ola, współzałożyciel Anthropic. Usłyszał ten apel.

Stawka jest wysoka. Co tydzień setki milionów ludzi wchodzi w interakcję ze sztuczną inteligencją. Programiści „oddrukują” wartości w modelach. Używają barierek. Ustalili reakcje korygujące. To, co modelki mówią o żałobie, aborcji czy śmierci, zależy od tych wyborów. Jest niewiele przepisów. Nie ma jednego standardu. Nadal.

Czy to oznaka pokory? A może branża improwizująca standardy etyczne na bieżąco? Prawdopodobnie oba.

Ale czy religia naprawdę może pomóc?

Tradycje rozwiązują ten problem od wieków. Edukacja moralna. Wdrażanie lekcji w umysłach agentów. „Religie mówią o tym od tysięcy lat” – zauważa Greene. Mogą mieć przydatne pomysły. Chcemy, żeby boty były życzliwe. Żeby nie robili nic złego.

Spotkania marcowe miały swój cel. Wyjaśnienie „konstytucji” Claude’a – zasady pisane. Model sprawdza swoje odpowiedzi pod kątem tych zasad.

Anthropic chce tego, co działa. Testują koncepcje religijne. Laboratorium rozumie, że nie może napisać reguły dla każdej pojedynczej interakcji, powiedział Green. To niemożliwe. Zamiast listy kontrolnej chcą stworzyć osobowość. Określony typ charakteru.

Oczywiście istnieje sceptycyzm. Carissa Velis wykłada etykę sztucznej inteligencji na Oksfordzie. Kwestionuje motywy. A raczej działania. Intencje są pomieszane. Zainteresowania są oczywiste. „Zastanawiam się” – pyta – „czy jest sens sprawdzać, czy mają na myśli to, co…”

Przerywa rozmowę o szczerości. A może nie. Być może martwi się, że jest to „etyczne greenwashing” – eko-mycie, ale w imię etyki – wykorzystywanie świętej wagi do celów PR. Zielony mówi nie. On tam był. Twierdzi, że jego intencje są szczere. Fałszywa religijność zostaje szybko zdemaskowana. Tylne gniazdo byłoby nuklearne.

Ale szczerość nie gwarantuje sukcesu.

Spotkania nie były idealne. Niektóre momenty były niezręczne. Innych cechuje wzajemne zrozumienie. Nawet goście nie byli pewni, co będzie dalej. „Wszyscy słuchali” – wspomina Greene, „ale… co teraz zrobimy?”

Anthropic wyciągnął wnioski. Dopracowali format. Pod koniec kwietnia grono uczestników powiększyło się. Żydzi, Hindusi, Sikhowie, Mormoni, Grecy Prawosławni. Wszyscy zostali zaproszeni.

Velis nadal się martwi. Obrazy religijne w Dolinie Krzemowej? Niebezpieczny. To tworzy trybalizm. Emocje sięgają zenitu. Powody biznesowe są zimne. Religia inspiruje do posłuszeństwa. To jest instrument władzy.

Papież Leon XIV wypowiadał się przeciwko nieuzasadnionej władzy narzucanej z góry. Eksperyment Anthropic pokazuje, jakie to trudne.