Sztuczna inteligencja: zabójcze roboty atakują!

  • czerwca 8, 2023
Obiecałem zabójcze roboty - i oto są.

Częścią czatu GPT jest uczenie przez wzmacnianie. Dzięki temu wygląda to inteligentnie (algorytm jest wzmacniany pozytywnie za bardziej ludzkie odpowiedzi). Najśmieszniejsze jest to, że w ten sposób szkoli się roboty, by stały się robotami-zabójcami.

Przynajmniej w ten sposób można nauczyć robota chodzić. Oto świetny przykład: Forget Boston Dynamics. This robot taught itself to walk.

W uczeniu wzmacniającym nagradzamy maszynę (nagroda to liczba lub wektor do maksymalizacji, a nie przekąska) za robienie właściwych rzeczy (jak poruszanie się po labiryncie). Ta "właściwa rzecz" nazywana jest "stanem". I może to być: stanie, chodzenie, zabijanie lub cokolwiek, co projektant chce, aby robot zrobił.

Ta seria stanów (w rzeczywistości jest to graf, ponieważ można odwiedzić każdy stan wiele razy) nazywa się Markov Decision Process (MDP). Jeśli chcesz dodać nagrody do obrazu, staje się to Markov Reward Process (MRP). Więcej o działaniu MDP i MRP przeczytasz w tym artykule: Understanding the Markov Decision Process (MDP).

Procesy wzmocnienia działają zarówno dla maszyn, jak i żywych istot (tym razem mówię o przekąskach, a nie o liczbach).

Wyobraź sobie, że stan Twojego pracownika, którego chciałbyś uniknąć to "odejście z pracy", a stan, który chciałbyś osiągnąć to "bycie biegłym w". Patrząc z tej perspektywy - procesy uczenia się (lub, mówiąc szerzej, procesy zarządzania wydajnością) to MRP. Używasz nagród, aby zmienić czyjś stan.

I właśnie nad tym pracujemy teraz w One2tribe.

W kolejnym artykule omówię połączenie psychologii z MRP i AI. Przejdziemy więc od zabójczych robotów do żywych ludzi.
PODOBNE ARTYKUŁY

Dalsze inspiracje!

Odkryj artykuły, które rozszerzają tematykę, którą właśnie czytasz. Znajdź inspiracje z pogranicza gamifikacji i sztucznej inteligencji, które można z powodzeniem wykorzystać w biznesie. Przeżyj fascynującą podróż przez powiązane tematy!

Gorący temat: ROI vs. ROE!

lipca 6, 2023
Gorący temat: ROI vs. ROE, czyli wartość biznesowa vs. wartość pracownika Powszechnie panuje błędne przekonanie, że...

AI: Od naukowych projektów do masowej uwagi

maja 31, 2023
Prace nad funkcjonalnościami napędzanymi przez sztuczną inteligencję rozpoczęliśmy w 2016 roku na potrzeby XPRIZE (IBM...

GPT z funkcją API - nowe podejście do integracji systemów

lipca 25, 2023
GPT będzie zdolny do wywoływania funkcji (API). To przełomowa funkcja, której zamierzamy używać. W naszej strategii...
Poznaj

Platforma gamifikacyjna Tribeware

Nie czekaj, przekształć swoją firmę już dziś! Odwiedź stronę One2tribe i zarezerwuj bezpłatne demo naszej innowacyjnej aplikacji. Zobacz, jak możemy zrewolucjonizować zaangażowanie Twojego zespołu!