2023.08.07.
Írta: Katona Krisztián, IT toborzási üzletágvezető [LinkedIn]
A Mátrix című filmben (1999) a mesterséges intelligencia átvette az uralmat és létrehozott egy mesterséges, szimulált valóságot az emberek leigázására. A film hatalmas sikert aratott, egyfajta tanulságos meseként hívva fel a figyelmünket egy negatív jövőképre, miközben némileg megelőzte korát. Igazából csak az elmúlt években, sőt hónapokban ébredünk rá, mennyi területet befolyásol máris a mesterséges intelligencia (MI, angolul: artificial intelligence, AI).
Korábbi cikkünkben már röviden bemutattuk, hogy milyen változásokra számíthat a mindennapjaiban HR szakma az AI fejlődésével. Ezúttal három részes cikksorozatunkban kísérletet teszünk a mesterséges intelligencia részletes megismerésére és feltérképezzük hatását a recruitmentre valamint az IT munkaerőpiacra a magyar üzleti életben. Sorozatunk első részében az AI rövid történetének áttekintése után bemutatjuk a mesterséges intelligencia és a gép tanulás közötti különbségeket és állást foglalunk az MI kategorizálását tekintve.
A sorozat elérhető részei:
Az "mesterséges intelligencia" kifejezést 1956-ban alkották meg, de az AI (artificial intelligence) napjainkban vált igazán népszerűvé, sőt megkerülhetetlenné. A növekvő adatmennyiség, a fejlett algoritmusok, valamint a számítási teljesítmény és tárolási kapacitás fejlődésének köszönhetően nyílt lehetőségünk kiaknázni a benne rejlő valódi lehetőségeket.
Az 50-es évekbeli korai AI kutatások olyan témákat vizsgáltak, mint a problémamegoldás és a szimbolikus módszerek. A 60-as években ezek az eredmények felkeltették az USA Védelmi Minisztériumának érdeklődését is. Ennek következtében a fő terület az alapvető emberi gondolkodás utánzása lett. Például a Fejlett Védelmi Kutatási Projektek Ügynöksége (DARPA) a 70-es években sikeresen hajtott végre utcafeltérképezési projekteket, 2003-ban pedig intelligens személyi asszisztenseket hozott létre, jóval azelőtt, hogy a Siri, Alexa vagy Cortana léteztek volna.
Ma a fókusz az automatizáláson és formális gondolkodáson van, ezek segítségével hozhatunk létre az emberi képességeket kiegészítő és fokozó eszközöket, például keresőmotorokat és döntéstámogató rendszereket.
A továbbiakban két fontos fogalom sokat fog szerepelni, ezért meg kell vizsgálnunk, mit is értünk alattuk?
A köznyelvben gyakran összekeveredik használatuk, holott a mesterséges intelligencia (artificial intelligence, AI) és a gépi tanulás (machine learning, ML) nem ugyanaz, a fogalmak között lényeges különbségek vannak. Az AI a nagyobb halmaz, ezt használja számos alkalmazás, amely az emberi viselkedés utánzására jött létre. Az ML képes ezeknek az alkalmazásoknak a képességeit finomhangolni.
Gyakran keveredik össze a két kifejezés, nem kis részben azért, mert számos esetben együttesen használt technológiákról van szó. Vegyük példának a keresőmotorokat. Amikor valamit beírunk a keresősávba, a keresés gépi tanulási algoritmusokat és mesterséges intelligenciát is használ (RankBrain, neural matching, BERT, MUM stb.) annak előrejelzésére, hogy mit is szeretnénk keresni.
Tekintsük át az AI és a gépi tanulás közötti egyértelmű különbségeket:
A mesterséges intelligencia (AI) a számítógépes rendszerek az emberi intelligenciát igénylő feladatok elvégzésére irányuló képességét jelenti.
A gépi tanulás (ML) adatok és algoritmusok használatával tanul és alkalmazkodik.
A döntéshozatalra összpontosít.
Gépi tanulási algoritmusok segítségével történő tanulásra összpontosít.
Célja olyan számítógépes rendszerek fejlesztése, amelyek az emberhez hasonlóan képesek tervezni, értelmezni, tanulni és döntéseket hozni.
Célja, hogy saját algoritmusokat létrehozva tanuljon.
Strukturált, félig strukturált és strukturálatlan adatokat használ.
Strukturált és félig strukturált adatokat használ.
Az AI minimális emberi beavatkozást igényel.
A ML-ben emberi szakértelem szükséges az algoritmusok képzéséhez.
Siri, Google Translate-szerű fordító szoftverek, Google Assistant és a chatbot-ok.
Javaslati motorok (recommendation engines), Facebook barát-ajánlások, forgalmi figyelmeztetések.
Ha meg akarjuk vizsgálni, hogy milyen AI-okat ismerünk, rövidesen állást kell foglalnunk azt illetően, hogy milyen szempont mentén csoportosítsuk őket.
Egyik lehetséges út a mesterséges intelligenciák tanulási kapacitása alapján: beszélhetnénk szűk (avagy gyenge), általános (avagy erős) és szuper MI-kről. Ezen belül azonban újabb alkategóriákat kellene képeznünk, hogy többet tudjunk meg például a ChatGPT-ről vagy a Midjourney-ről és lássuk a köztük lévő különbségeket.
Keressünk hát egy másik lehetséges keretrendszert. Sok cikkben használják azt a funkcionális kategorizációt, amellyel megnézzük, hogy az AI miképpen képes feldolgozni az adatot, válaszokat adni a bejövő ingerekre, valamint interakcióba lépni a környezettel. Ez alapján négy típus különül el: reaktív gépezetek, limitált memória-kapacitású MI-k, a tudatelmélettel bíró MI-k és öntudattal bíró MI-k. Ezen csoportosítás azonban abba az akadályba fut bele, hogy lényegében valamennyi jelenleg használt alkalmazás a második kategóriába tartozik, így számunkra kevésbé alkalmas bemutatni a mesterséges intelligenciát. A harmadik és negyedik kategória egyelőre a tudományos fantasztikum terepe, valódi előrelépés ezekbe az irányokba csak nagyon lassan várható az elkövetkező időszakban.
Válasszunk hát egy, a számunkra minden szempontból kényelmes csoportosítást - a funkcionalitást - amellyel plasztikusan tudjuk bemutatni, mennyi területen vesszük immár igénybe a technológiát. Az is megkönnyíti a dolgunkat ezzel a metódussal, hogy könnyen tudunk példákat társítani az egyes kategóriákhoz.
Ezek a platformok széles felhasználási körrel bírnak, elsősorban a fejlesztőket segítik. Általában a gépi tanulásra és a deep learning-re helyezik a hangsúlyt. A legnépszerűbbek open source (nyílt hozzáférésű) szoftverek.
Ilyen például az alábbiak:
A nyelvtechnológia a strukturálatlan (folyó szövegek) vagy kis mértékben strukturált szöveges állományokból történő ismeret-kinyerés tudománya. Konkrét alkalmazási feladatai pedig a szövegek gépi elemzésével az abban rejlő információk automatikus összegyűjtése, rendszerezése, szűrése. A nyelvtechnológia területéhez sorolhatóak továbbá a felhasználót dokumentumok létrehozásában segítő különböző helyesírás-ellenőrző, nyelvi-ellenőrző, tördelést végző, automatikus címkéző stb. programok.
Ilyen kulcstechnológiák az OpenAI GPT sorozata, a BERT, a RoBERTa, és a Hugging Face Transformers-e.
A gépi látás általános gyűjtőfogalom azon eljárásokra és rendszerekre, amelyekkel (mozgó)kép alapú adatgyűjtés és -kiértékelés után vagy annak hatására valamilyen vezérlési, szabályozási vagy gépi értelmezési mechanizmus indul be. Vagyis, ezek a technológiák arra lettek tervezve, hogy segítsenek értelmezni a valódi világ vizuális ingereit, éppen úgy, ahogy az emberek teszik.
Nevezetes példák: OpenCV, TensorFlow Object Detection API, és a YOLO (You Only Look Once).
A beszéd- és hangfeldolgozó technológiákat hasonló analógia mentén értelmezhetjük, mint az előző pont esetében, csak ezúttal az ebbe a kategóriába sorolt megoldások az emberi beszéd megértésére, interpretálására és szintetizálására törekszenek.
Ide sorolhatók a Mozillától a DeepSpeech, a Google-től a Speech-to-Text és az Amazon-tól az Alexa Voice Service.
Az AutoML megoldások segítségével laikusok számára is elérhetővé válik a gépi tanulás (machine learning) technológiájában rejlő lehetőségek kiaknázása.
Példák: Google-től az AutoML, az Auto-sklearn és a H2O AutoML-je.
A gépi tanulás egy fajtája, amelyben a program képes jutalmakat kiosztani, mivel a döntéshozatalt cselekvés közben tanulja meg.
Ennek a technológiának példái az OpenAI Gym és a Google Dopamine.
Az RPA-k olyan rutinfeladatok automatizálására tervezett technológiák, amelyeket hagyományosan emberek végeztek. Évek óta jelen van a munkaerőpiacon is ez a rendkívül keresett szakértelem.
A UiPath, az Automation Anywhere és a Blue Prism néhány a vezető alkalmazások közül.
Ez a technológia lehetővé teszi a gépek számára, hogy emberi társalgásra hasonlító beszélgetést folytassanak.
A példák közé tartoznak a chatbot platformok, mint a Rasa, a Microsoft Bot Framework és a Google Dialogflow.
A fogalmi keretek kiválasztásával és áttekintésével az a célunk, hogy segítsünk eligazodni ebben a robbanásszerűen fejlődő és még annál is felkapottabb területen. A JobGroup kollégái is számos területen kapcsolatba kerülnek a mesterséges intelligenciával, legyen szó akár a társalgó MI-k képességeinek kiaknázásáról, akár egy új IT pozíció során elvárt készségként megjelenő technológia megértéséről. Nem érdemes lemaradni a legújabb fejleményekről, hiszen különlegesen izgalmas megoldásoknak lehetünk hamarosan a szemtanúi.
Felhasznált cikkek