Sztuczna inteligencja: zabójcze roboty atakują!

  • czerwca 8, 2023
Obiecałem zabójcze roboty - i oto są.

Częścią czatu GPT jest uczenie przez wzmacnianie. Dzięki temu wygląda to inteligentnie (algorytm jest wzmacniany pozytywnie za bardziej ludzkie odpowiedzi). Najśmieszniejsze jest to, że w ten sposób szkoli się roboty, by stały się robotami-zabójcami.

Przynajmniej w ten sposób można nauczyć robota chodzić. Oto świetny przykład: Forget Boston Dynamics. This robot taught itself to walk.

W uczeniu wzmacniającym nagradzamy maszynę (nagroda to liczba lub wektor do maksymalizacji, a nie przekąska) za robienie właściwych rzeczy (jak poruszanie się po labiryncie). Ta "właściwa rzecz" nazywana jest "stanem". I może to być: stanie, chodzenie, zabijanie lub cokolwiek, co projektant chce, aby robot zrobił.

Ta seria stanów (w rzeczywistości jest to graf, ponieważ można odwiedzić każdy stan wiele razy) nazywa się Markov Decision Process (MDP). Jeśli chcesz dodać nagrody do obrazu, staje się to Markov Reward Process (MRP). Więcej o działaniu MDP i MRP przeczytasz w tym artykule: Understanding the Markov Decision Process (MDP).

Procesy wzmocnienia działają zarówno dla maszyn, jak i żywych istot (tym razem mówię o przekąskach, a nie o liczbach).

Wyobraź sobie, że stan Twojego pracownika, którego chciałbyś uniknąć to "odejście z pracy", a stan, który chciałbyś osiągnąć to "bycie biegłym w". Patrząc z tej perspektywy - procesy uczenia się (lub, mówiąc szerzej, procesy zarządzania wydajnością) to MRP. Używasz nagród, aby zmienić czyjś stan.

I właśnie nad tym pracujemy teraz w One2tribe.

W kolejnym artykule omówię połączenie psychologii z MRP i AI. Przejdziemy więc od zabójczych robotów do żywych ludzi.
PODOBNE ARTYKUŁY

Dalsze inspiracje!

Odkryj artykuły, które rozszerzają tematykę, którą właśnie czytasz. Znajdź inspiracje z pogranicza gamifikacji i sztucznej inteligencji, które można z powodzeniem wykorzystać w biznesie. Przeżyj fascynującą podróż przez powiązane tematy!

Behawioryzm vs. psychologia pozytywna!

czerwca 13, 2023
Dzisiejszy artykuł jest o indywidualizmie. Behawioryzm vs. psychologia pozytywna! Zacznijmy od sporu o behawioryzm...

Od prompt programmingu do własnej rzeczywistości: Możliwości Chat GPT

maja 24, 2023
Na początku śmiałem się z prompt programmingu w Chat GPT lub wśród programistów GPTAPI, ale:

Gorący temat: ROI vs. ROE!

lipca 6, 2023
Gorący temat: ROI vs. ROE, czyli wartość biznesowa vs. wartość pracownika Powszechnie panuje błędne przekonanie, że...
Poznaj

Platforma gamifikacyjna Tribeware

Nie czekaj, przekształć swoją firmę już dziś! Odwiedź stronę One2tribe i zarezerwuj bezpłatne demo naszej innowacyjnej aplikacji. Zobacz, jak możemy zrewolucjonizować zaangażowanie Twojego zespołu!