Nem lesz már egy kicsit sok a Chat-GPT körüli felhajtásból? Úgy érezzük, hogy jó lenne egy fokkal alaposabban, higgadtabban, mondhatni mérnök-mentalitással átbeszélni, hogy mire is jó ez az eszköz, amit a fél üzleti világ napi szinten használ.
De miért is fontos, hogy erről írjunk a blogon?
A Lexunit alapítótagjai öt évvel ezelőtt úgy döntöttek, hogy az AI-forradalomnak szentelik a karrierjüket. A Természetes Nyelvfeldolgozás évek óta a munkánk része, de a Chat-GPT az első olyan eszköz, ami igazán megragadta a mainstream média figyelmét. Főleg azért, mert a felhasználói élmény nagyon gördülékeny: lehet vele chatelni. És ingyenes.
Az elmúlt években sok céget, startupot segítettünk automatizálással, neurális hálózatokkal, AI-megoldásokkal, ezért szinte kötelességünknek érezzük, hogy elmondjuk a véleményünket az új fejleményekről.
Remélhetőleg ezzel fel tudunk lőni néhány jelzőrakétát, amelyek a továbbfejlődés irányába mutathatnak, bármilyen szakterületen is dolgozol, kedves olvasó.
Az is motivál minket, hogy beszéljünk az AI és a Chat-GPT néhány olyan sajátosságáról is, amelyek mintha kimaradnának a népszerű híroldalak cikkeiből.
Egy hétköznapi, párbeszédes formátumban készítettük el a blogposztot. De a Chat-GPT semmilyen formában nem működött kézre ebben a dialógusban…
Mi a Chat-GPT?
A Chat-GPT egy nyelvi modell, amit amit emberi közreműködéssel végzett megerősítéses tanulás (Reinforcement Learning from Human Feedback - RLHF) segítségével készítettek.
És mi az a nyelvi modell?
A nyelvi modell egy valószínűségi eloszlással lát el egy szövegadatbázist. Gyakorlatilag a szavak sorrendjét "saccolja meg", az alapján, ami a tanítóanyagban (könyvek, hosszabb szövegek, online kommunikációs archívumok, stb) volt.
A nyelvi modellek szinte mindenhol ott vannak már körülöttünk: használjuk őket fordítóprogramokban, a videók automatikus feliratozásánál, és nekik köszönhető, hogy a telefonunk megérti, ha szóban adunk neki instrukciókat.
A nyelvi modellek miatt tudja a Gmail befejezni a mondatainkat.
Szükség van rájuk minden olyan alkalommal, amikor egy digitális eszköz az emberi nyelvvel lép interakcióba. Ez a természetes nyelvfeldolgozás területe, ami már az ötvenes évek óta létezik. Persze az elmúlt két évtizedben jelentős lendületet kapott a fejlődése.
Ezért létezik a Google keresője is, és ezért lett döbbenetesen okos. Pontosabban egyre ügyesebben képes megfejteni a valódi felhasználói szándékot a keresőkifejezések mögött.
Ki fejlesztette a Chat-GPT-t?
Az 'AI-kutatással és alkalmazással' foglalkozó Open AI vállalat, ami az Open AI nonprofit szervezetének birtokában van. Ez nem valamiféle garázsprojekt: az alapítók között van a PayPallel híressé vált Peter Thiel, Elon Musk, és a világ talán legismertebb startup-inkubátorának, a Y-Combinatornek a korábbi elnöke, Sam Altman. (Jeff Bezost is felvehetjük a listára, mert az AWS is benne van a buliban)
A projektre 1 milliárd dollárt dobtak össze az alapítók, amire aztán ráduplázott a Microsoft, majd 2023 januárjában a redmondi szoftveróriás belerakott még tízmilliárdot, kibővítve az együttműködés kereteit.
Mitől olyan különleges ez a Chat-GPT? Az RLHF miatt?
Máris rátérünk. Először is nézzük meg, miből lett, hogyan alakult ki ez az eszköz.
A Chat-GPT-nek három-négy elődje volt:
A GPT, vagyis Generative Pre-Trained Transformer volt az eredménye annak, amikor a generatív elő-tanítás módszerével készítettek fel egy nyelvi modellt. 2018 június 11-én hozták nyilvánosságra, alig öt éve.
A GPT-2 majd a GPT-3 jelentős továbbfejlődést jelentett. A GPt-3 már 175 milliárd paramétert használt, szemben a GPT 117 milliójával. A tanítási folyamat itt vált igazán méllyé.
A GPT-3 ismertette meg a generatív eszközöket a szélesebb nyilvánossággal, például a DALL-E révén - ez az eszköz szöveges leírások alapján hoz létre képeket.
A következő lépcsőfokot az InstructGPT jelentette, amit már emberi közreműködéssel tanítottak, azért, hogy pontosabban tudja követni az emberi instrukciókat. A kutatók a visszajelzéseikkel finomhangolták az eszköz által generált eredményeket.
Alapvetően ezért lett tehát átütő siker a Chat-GPT: jóval nagyobb adatmennyiséggel tanították be, és alaposan felkészítették az emberekkel való direkt kommunikációra. Ez a folyamat persze nem ért véget, bárki adhat visszajelzést a kutatóknak, aki használja a szoftvert.
Tényleg hatalmas innováció a Chat-GPT?
A Chat-GPT nem különösebben innovatív, ha a technológiát, vagy a módszertant nézzük, amelyek alapján elkészült. És biztosan nem egyedi: nyilvánvalóan más nagy techcégek, mint a Meta vagy az Alphabet, szintén rendelkeznek nagyon komplex nyelvi modellekkel.
A Chat-GPT attól izgalmas, hogy egy valódi, kipróbálható, használható eszköz, amivel nagyon könnyű és magától értetődő kísérletezni szó szerint bárki számára, aki tud gépelni. Ez végre behozta a mesterséges intelligenciát a hétköznapi beszélgetésekbe, ahová, szerintünk, jó ideje tartozott már.
A Chat-GPT érkezése a mi munkánkat is részben könnyebbé teszi, mert mostantól, amikor üzleti vezetőkkel beszélünk arról, hogyan növelheti a cégük hatékonyságát az AI, akkor már lehet alapozni a Chat-GPT-vel kapcsolatos, első kézből szerzett tapasztalatokra. Nem a nulláról indulunk.
A Chat-GPT sokmindent megmagyaráz már csak a létezésével. Ahogy egy McKinsey-cikkben fogalmazták meg:
"Számos cégvezetőnek, akikkel beszéltünk, és mi magunknak is, elegendő volt egyetlen instrukciót bevinni ahhoz, hogy megtapasztaljuk a generatív AI képességeit."
Miben tud segíteni nekem a Chat-GPT?
Ha egy olyan szöveggel dolgozol, ami valamilyen mintát követ, szinte biztos, hogy a Chat-GPT közre tud működni az elkészítésében.
Motivációs levelek, szerződések, céges Facebook posztok, általános blogposztok, szinte bármilyen ügyféltámogatói kommunikáció, álláshirdetések - ezek mind ebbe a kategóriába tartozhatnak.
Sőt, a Chat-GPT képes az amerikában nagyon fontos oktatási alapeszköznek, az esszéírásnak a magabiztos megugrására. A szoftver jobb, mint elfogadható eredményeket produkál egy átlagos iskolai feladatnál. Ezekre a megoldásokra sok esetben ötöst kell adni, formailag megfelelőek. (Ez akkor az AI veszélyei közé tartozik? Erre hamarosan kitérünk még.)
Szóval az a kérdés, hogy van -e bármilyen felismerhető szerkezeti jellegzetessége a szövegnek, amit létre kívánsz hozni?
Ha igen, akkor a Chat-GPT már valószínűleg rengeteg ilyen szerkezetű szöveget olvasott, ezért képes generálni számodra egyet a hasonló szövegek "átlagolásával".
Ez fontos, mert ha ezt megértjük, akkor arra is rájövünk, hogy a Chat-GPT-nek fogalma sincs arról, hogy mit csinál (mert nincs ott bent "valaki", akinek lehetne "fogalma" bármiről. Egy absztakt matematikai formulába gépeled bele az instrukcióidat. Ezt most ennyiben hagyjuk, de röviden még ki fogunk térni a filozófiai kérdésekre később.)
Mindez nagyon érdekes, de kíváncsi lennék néhány valódi üzleti felhasználási módra is
Csak keress rá! Komolyan, persze fontos, hogy az ember maga is kísérletezzen az eszközzel (ha esetleg még nem próbáltad, mindenképpen javasoljuk, hogy vedd ki a részed belőle - egy kicsit olyan érzés lehet, mint először bekapcsolni egy rádiót vagy tévét). De emellett az is fontos, hogy megismerjük a már meglévő gyűjtéseket a jobbnál-jobb felhasználási módokról, ahelyett, hogy megelégednénk azzal a néhánnyal, amit újságírók másolnak más újságíróktól. Vagy ami akár egy olyan szakértői blogon megjelenhet, mint a miénk.
Ez például egy jó kezdés lehet, de napról-napra gyűlnek a hasonló, akár specifikusabb adatbázisok.
Hú, hát ez a lista elég ijesztő. Akkor most vége a karrieremnek?
Nem, a karriered megváltozik.
Eddig is folyamatos változásban volt. Attól függ, mióta vagy a munkaerőpiacon, de biztos láttál már egy-két nagy irányváltást, főleg az elmúlt években.
Csábító lehet a Chat-GPT segítségét kérni egy edzésterv vagy egy diétás menü összeállításához, de szerintünk a fontos dolgokkal kapcsolatban továbbra is érdemes szakértőhöz fordulni.
Amiben a Chat-GPT és a hasonló eszközök jók, az az ügyintézés felgyorsítása. Ha a munka jelentős része szövegek létrehozásából, válogatásából, szerkesztéséből, értelmezéből áll, akkor ezek az eszközök segíthetnek mindezt gyorsabban elvégezni, ezáltal időt teremtve a komplexebb feladatok ellátására.
Ha megnézzük, hogy néz ki manapság például egy toborzási folyamat, akkor azt látjuk, hogy a nagy részét el tudná végezni egy seregnyi chatbotból álló piramis, aminek a tetején az emberi szakértők dolgoznak, vezérlik a folyamatokat. A repetitívebb feladatok helyett ezek a szakértők többet tudnak interjúztatni, segíteni az új belépők beilleszkedését, támogatni a kollégák mentális egészségét, testreszabott módon közreműködni az egyéni karrierek egyengetésében.
Itt egy másik idézet, ami jól summázza a helyzetet:
Sok olyan feladat, aminek jelenleg túl magas a költsége, könnyen elvégezhetővé válhat a közeljövőben, mert a szakértők felszabadulnak a triviális munkafolyamatok végzése alól.
Mik a veszélyek? Mire érdemes számítanom?
Oké, akkor először tisztázzuk, miért a Chat-GPT az első a műfajában.
Még az Open AI is nagyon óvatos volt. A korábbi modelleket nem tették ilyen könnyedén elérhetővé a nagyközönség számára.
Ez azért van, mert a kutatók tudják, hogyan tud a generatív tartalom gondot okozni.
Csak képzelj egy hadseregnyi számítógépet, ahogy szünet nélkül termeli a teljesen fiktív szövegeket, amelyek nagyrészt megkülönböztethetetlenek az emberek által gyártottaktól.
Twitter, e-mail, Facebook, bármilyen digitális kommunikációs csatorna elárasztható. Vakká és süketté válhatunk másodpercek alatt, ha nincs egy jó módszerünk arra, hogy kiszűrjük a zajt.
A félreinformálás így is súlyos probléma, és az ilyen kampányokat már ma is gyakran támogatják valamilyen automatizációs megoldással.
Ezért foglalkoztak a Chat-GPT válaszainak értékeléseivel annyit az Open AI szakértői, egészen amíg nem adott megbízhatóan olyan válaszokat, amelyekkel ki lehetett engedni "az emberek közé".
Azzal a kitétellel persze, hogy a Chat-GPT képes tárgyi tévedésekre. (Hogyne lenne, hiszen az internetről tanult!)
Emlékeznünk kell arra, mi is a Chat-GPT: egy félkarú rabló, amely olyan eredményt ad, aminek a legnagyobb a valószínűsége. Szavakat, mondatokat, kifejezéseket rak olyan sorrendbe, ami a leginkább megfelelő válasznak tűnik azért, mert hasonlít azokra, amelyek a tanítóadatául szolgáló szövegkorpuszban voltak. Anélkül, hogy bármilyen elképzelése lenne azok szavak és mondatok jelentéséről.
A Chat-GPT nagyon gyengén szerepel például szöveges matematikai feladatok megoldásában, alapvető hiányosságai vannak. Ami érthető, mivel hagyományos értelemben nem ért semmihez.
Lehet vele beszélgetni, de ettől még egy számológép.
Pontosan, és ezért problémás az, ahogyan a média antropomorfizálja ezeket a matematikai eszközöket.
Valahol persze érthető. Embernek lenni magányos dolog.
Évezredek óta várunk valakit, akivel beszélhetünk, aki szintén megtapasztalja a létezést, de nem közülünk való. Van saját nézőpontja, össze tudjuk hasonlítani a jegyzeteinket.
Ezért izgatja annyira az embereket a földönkívüli élet lehetősége. Ez a magányosság oldódik fel a vallásban. Ezért olvashatunk arról, hogy egy nyelvi modellen dolgozó kutató ügyvédet akart fogadni a szoftver számára, hogy az szabad lehessen.
Hallottam ezzel kapcsolatban valami papagájról…
Igen, a sztochasztikus papagáj. Nem szívesen hívnánk nyelvi modelleket papagájoknak, mert azok madarak, vannak kognitív képességeik. A Chat-GPT-vel beszélni inkább olyan, mint belekiabálni egy óriási és komplex geometriájú barlangba. A visszhang másnak hallatszik, de csak a saját hangod, a neurális háló súlyozásávan manipulálva és torzítva.
Nem érdemes az élet értelméről faggatni nyelvi modelleket, sem komplex problémákról kérdezni őket, mert csak középszerű válaszokat tudnak adni. A tanítóanyagként szolgáló szövegek újrakevert verzióit.
Ettől még kiválóan lehet őket asszisztensként használni!
Amit fontos észben tartani, ha beemelünk egy neurális hálót egy döntési folyamatba, az az, hogy elveszítjük az okozatiságot. Nem valószínű, hogy pontosan vissza lehet fejteni, "miért" hozott meg egy ilyen eszköz bizonyos döntéseket, a komplexitás egy bizonyos szintjén túl. Ha nem vagyunk elégedettek az eredménnyel, csak annyit tehetünk, hogy továbbmegyünk a tanítási folyamattal.
Tanulságos, milyen hatással volt az AlphaZero a sakkra. Legyőzte a legjobb játékosokat is, ám ettől még nem lett kevesebb sakkozó. A sakk-nagymestereket lenyűgözték az AlphaZero teljesen újszerű megoldásai.
Hogyan fedezte fel ezeket? Miért döntött bizonyos lépések mellett? Senki sem tudja. Senki sem tudhatja.
De ezek a megoldások azóta a magasszintű sakk részeivé váltak. A sakk megváltozott, örökre.
Érdemes erre visszagondolni, amikor a cégek újabb és fejlettebb AI-eszközöket kezdenek használni, mert azok addig ismeretlen szintű teljesítményre képesek. Fel vagyunk készülve arra, hogy a megismerésünk hagyományos útjai lezáródnak? Ez az egyik fő konklúziója a veterán külügyi szakértő, Henry Kissinger és a Google egykori vezére, Eric Schmidt könyvének (The Age of AI).
Mi történik, ha internetes keresésre használjuk ezt a technológiát?
A hírek szerint a Microsoft integrálni fogja ezt a technológiát a böngészőjébe már 2023 márciusában, és a Google valószínűleg intenzíven fejleszti a saját verzióját.
Kérdés, persze, hogy mit szeretnénk pontosan egy keresőmotortól?
Azt, hogy egy láthatatlan, digitális szellem a lehető legpontosabb választ adja meg a keresőkifejezésre?
Vagy azt, hogy kapjunk egy listát a lehető legjobb forrásokról, a témában, relevancia szerint?
Amikor egyszerű dolgokat, információkat keresünk, az első megoldás kiválóan működik, ezért olyan hasznos jelenleg a találati oldalon a válaszdoboz és a kiemelt részletek (featured snippets).
De ez nem elég, ha szakcikkeket szeretnénk a témában olvasni, szakértői véleményeket megismerni, vagyis elmélyíteni a tudásunkat.
Ebből kiindulva úgy tűnhet, hogy a Chat-GPT rövid távon problémát jelent az oktatásban, de előnyös lesz hosszabb távon. Talán az iskolák nem mérték igazán jól a teljesítményt, mostanáig.
Lehet, hogy van jobb módja is egy téma megértésének ellenőrzésére annál, hogy amúgysem túl eredeti esszéket írassunk róla.
A nyelvi modellek az oktatást sok szempontból fenekestül felforgatják, de ez olyasvalami, amit az üzleti világban ünnepelve szoktunk fogadni. Biztos, hogy a legjobb tanárok gyorsan ki fognak dolgozni olyan módszertanokat, amelyek ezeknek az eszközöknek a felhasználásával mélyíteni, erősíteni képesek a diákok tudását.
Ez az amitől igazán fantasztikus a Chat-GPT: az élet bármilyen területén dolgozó, hétköznapi emberek számára ad lehetőséget arra, hogy megismerjék, hol tart ez a technológia, és milyen lehetőségek rejlenek benne.
Ebből a szempontból kifejezetten szerencsés, hogy az Open AI felrúgta a darázsfészket, vagy kiengedte a szellemet a palackból - még akkor is, ha ez egy alapos felügyelet alatt álló szellem, aki nem tud semmiről, ami 2021 óta történt.
Hogyan lehet kihozni a maximális üzleti értéket a Chat-GPT-ből és hasonló technológiákból?
Hangsúlyozni szeretnénk, hogy bármit is teszel: ne pánikolj. Nem fogsz egy szempillantás alatt "lemaradni". Nem szükséges azonnal "stratégiát implementálni". Fontos, hogy józanul figyeljük az eseményeket. Figyelmesen, de türelemmel.
Akármire is képesek ezek az új, generatív eszközök, a fejlesztés alatt állók még jobbak lesznek.
Jó taktika lehet, ha úgy tesszük fel a kérdést:
- Milyen folyamatok vannak a szervezetünkben, amelyek hasznot húzhatnak egy ilyen megoldásból?
Ne is szűkítsük a kérdést a Chat-GPT-re, hiszen rengeteg izgalmas eszköz elérhető még:
- a DALL-E és a Midjourney szöveges parancsok alapján generál képeket (A Chat-GPT-t pedig használhatod arra, hogy részletes leírásokat generáljon…)
- egy másik eszközzel kifejezetten stockfotókat generálhatsz
- szinte lehetetlen, hogy ne találkoztál volna a Lensa profilképekből mutált digitális avatárjaival a közösségi média-feedjeidben
- a Cleanvoice automatizáltan szerkeszt podcasteket
- a Krisp kiszűri a háttérzajt a videós megbeszéléseken
- háttérzenéket sem kell már venni a videós anyagokhoz: a Beatoven kérésre komponál neked
- a generatív videók is az ajtón kopogtatnak már, például itt a Synthesia
A generatív eszközökről is vannak folyamatosan frissített adatbázisok, tehát érdemes ezeket olyan szemmel nézni, hogy milyen céges részfeladatra hasonlítanak, hogyan lehetne őket beépíteni a rendszerbe?
Hasznos lehet egy 'AI-bajnokot', vagy akár egy kisebb csapatot kijelölni a cégen belül, akiket igazán érdekel ez a téma. Ők a munkaidejük egy részében ezeket a megoldásokat kutatják, olyan módszereket, amik a saját munkájukban segítenének nekik. (Itt írtunk korábban arról, hogyan tud egy cég jól felkészülni az 'AI-forradalomra')
Amikor összegyűlik néhány fejlesztési terv, amiket jó lenne rendszerbe foglalni és gördülékenyen integrálni a meglévő működésbe, akkor már magabiztosan tudnak a cégvezetők egyeztetni az ML ops szakértőkkel arról, hogy milyen időtávokkal és költségekkel lehet számolni, melyik irány mennyire kivitelezhető és ütőképes.
Néhány példa hasonló projektekre, amelyekkel cégeket, startupokat segítettünk a közelmúltban:
- elvégeztük a technikai megvalósítását egy böngészőbe építhető AI-asszisztensnek, amely valósidejű visszajelzéseket ad egy videókonferencián, így mindig optimálisan sikerülhetnek a prezentációk
- automatizáltuk az állásjelentkezés folyamatát jelöltoldalról
- létrehoztunk egy alkalmazást, ami automatikusan gyűjt bizonyos híreket, ezeket adatbázisba rendezi és címkézi
- képfelismerővel ellátott kárbejelentő alkalmazást fejlesztettünk, ami automatikus visszajelzést ad a felhasználónak, ha a fénykép nem felel meg a paramétereknek
A Chat-GPT és az ehhez hasonló AI eszközök minden cég számára lehetővé tehetik, hogy a nyelvi modellek és a gépi tanulás erejét saját célra hasznosítsák.
Az API-kapcsolatok, a felhőalkalmazások, a scraping és egyéb eszközök révén a létező példákat inspirációként felhasználva új lendületet lehet adni az üzlet teljesítményének és hatékonyságának.
Reméljük, sikerült néhány érdekes nézőpontot bemutatnunk ebben a cikkben. Minden véleményt szívesen olvasunk a hozzászólásokban, és ha bármilyen kérdésed vagy ötleted lenne a generatív AI-val, gépi tanulással kapcsolatban, keress minket elérhetőségeinken!