19° C
Ma 2024. május 02., csütörtök, Zsigmond napja van.
19° C
Ma 2024. május 02., csütörtök, Zsigmond napja van.

A bábelhal már itt van velünk

szept 4, 2023 | interjú

Antal Péter egyetemi docens, a BME VIK Méréstechnika és Információs Rendszerek Tanszék Mesterséges Intelligencia kutatócsoportjának vezetője szerint néhány éven belül a mérnöki tevékenység sokkal könnyebb lesz. Könnyebb és élvezetesebb azoknak, akik a kreatív feladatokat szeretik, mert a rutinmunkát átveszi tőlük a mesterséges intelligencia. Mely területen várható áttörés, miért kell etikusnak lennie az MI-nek és hol állunk a nemzetközi versenyben? – interjúnkban egyebek mellett e témákról beszélgettünk.

 

Egyszerű felhasználóként jól érzékelem-e, hogy a mesterséges intelligencia fejlődése olyan távlatokat nyit a technikai civilizáció előtt, amely alapvetően változtatja meg az életünket?

Ha rövid választ akar hallani, akkor azt emelném ki, hogy az MI-nek köszönhetően az informatika világának alapjait jelentő formális leírások, például kötelezettségeket, terveket vagy elvárt tevékenységeket leíró programok és szabályozások mindenki számára elérhetővé tétele lesz a soron következő terület, amely alapvetően alakítja majd át a világunkat. Korábbi ipari-technológiai-kulturális forradalmak esetében a könyvnyomtatás, a gőzgép vagy az elektromos hálózatok is egy-egy univerzális jelenséget tettek a társadalom számára elérhetővé, ezt teszi most az MI is az informatika, a tudásreprezentáció és a számítástudomány esetében. A mesterséges intelligencia kutatása az ötvenes években kelt önálló életre, például a nyelvészeti problémákra fókuszálva a teljes értékű fordítás kérdéskörét próbálták megoldani. A hatvanas években fedezték fel a számítási feladatok komplexitás-osztályait, vagyis azt, hogy hogyan érdemes definiálni könnyebb és nehezebb számítási feladatokat, vagy másképpen fogalmazva azt, hogy egy-egy számításhoz mennyi idő, tárhely kell. Ekkor arra jöttek rá, hogy bizonyos feladatokat egy adott időnél gyorsabban vagy kevesebb tárhellyel nem lehet megoldani. Ez teljesen új perspektívákat teremtett, de az 1930-as években megjelent szimbolikus számítás univerzalitása változatlan maradt. Ez azt jelenti, hogy mindegy, milyen számítógépet használunk egy szint felett: a számítási osztályok nem változnak, és ezt nem befolyásolja a Moore-törvény sem. (Moore-törvénynek nevezzük azt a tapasztalati megfigyelést, mely szerint az integrált áramkörök összetettsége körülbelül 18 hónaponként megduplázódik, és ez alapvetően kihat a számítástechnikai eszközök képességeire. – A szerk.) A kvantum számítástechnika, illetve számítógép bizonyos esetekben várhatóan áttörést fog hozni, hatékonyabb megoldásokat kínálva, de ez még minimum több éves távolságban van.

Ott tartunk, hogy a számítás univerzális fogalmából az következik, hogy bizonyos számítási problémák univerzálisan, azaz egyetemlegesen nehéznek bizonyulnak, amelyek a mesterséges intelligencia kutatások egyes ágaiban rendre megjelentek és természetes célpontok voltak.

Az MI-kutatók 99,999 százaléka számára ez valóban egy klasszikus helyzetet jelentett. 2010-ig a mesterséges intelligencia egy olyan vágányon haladt, hogy azok a feladatok, amelyek az emberek számára könnyűek – látás, beszédértés (akár verbális, akár írott formában), motorikus mozgás, hierarchikus tervezés, intuitív döntés, kreativitás, szakértői tudás kialakítása – a gépnek nehezen, illetve szinte egyáltalán nem voltak megfoghatóak. Megoldásuk sem praktikus időkorlátok mellett, sem praktikus mennyiségű statisztikai adatból nem tűnt megvalósíthatónak. A 2010-es évektől ez változott meg nagyon váratlan módon: a számítógépes grafikában használt videokártyákat lehetővé vált univerzális számítási hardverként olyan tanulási algoritmusokban használni, amelyek – bár a hatvanas évek óta ismertek voltak – addig nem tűntek felskálázhatónak. Az újabb, fejlettebb videokártyák már képesek az időközben elérhető rengeteg adattal dolgozni, és ügyes módszertani trükköknek is köszönhetően az eredmény a képfeldolgozás minőségének látványos javulása volt, itt már emberi szintű teljesítményt értek el a gépek. A következő terület – amely az utóbbi pár év fejleménye csupán – a nyelvek feldolgozása volt. Itt az hozta meg az áttörést, hogy a számítógépek nagyságrendekkel bővebb adathalmazt tudnak átnézni, mint korábban, továbbá megjelent egy új tanulási modell. Összességében tehát a ’60-as évek óta ismert gépi tanulási technológia a mai hardvereken az internetes és digitális világ tárházából merítve már emberi szintű teljesítményt képes elérni. Az elmúlt két év talán még nem kellően megértett fejleménye, hogy az univerzális fordítás hétköznapi szinten megoldottá vált. Képletesen szólva a nyelvi akadályok eltűnhetnek, mivel a Douglas Adams Galaxis útikalauz stopposoknak című művéből ismert bábelhal itt van velünk: a valós idejű fordítás realitássá vált.  A motorikus vonalon más történt: itt az analitikus megoldások vittek el bennünket odáig, hogy a robotok már emberfeletti akrobatikus mutatványokat képesek bemutatni, gondoljon csak a Boston Dynamics MI vezérelte gépeire.

Maradjunk még a fordításnál! A saját tapasztalatom az, hogy a fordító alkalmazások 80-90 százalékos pontossággal dolgoznak, ami egy nagyon magas szintű nyersanyagot jelent, de a végleges szöveg kialakítása a szinonimák, a stílusárnyalatok, a szlengek miatt mégiscsak emberi beavatkozást igényel, legalábbis egyelőre. El tudja képzelni, hogy egyszer eljutunk oda, hogy valós időben ad hibátlan szöveget az MI?

Az adatmennyiség a kritikus tényező. A nyelv élő dolog, folyamatosan és dinamikusan változik, új szlengek, stíluselemek és kifejezések kerülnek be a nyelvi áramlatokba. Én az orvosbiológia területén alkalmazom a mesterséges intelligenciát, ahol például a baktériumok újabb és újabb fegyvereket, azaz enzimeket fejlesztenek ki az ellenük harcoló antibiotikumok ellen, ami tehát egy véget nem érő harc. És az elérhető adat mennyisége ennek az evolúciónak a folyamatában ki is jelöli az elérhető teljesítményszintet. A nyelv alakulása is hasonló, és paradox módon éppen a fordítás maga katalizálhatja a fordítások tökéletességének elérhetetlenségét, hiszen azok a nyelvek is kifejthetik a hatásukat a világ kultúrájára, amelyek eddig izolálva voltak. A könnyen elérhető fordítási megoldások lehetővé teszik, hogy a kis nyelvek is bekapcsolódjanak a nyelvi kavalkádba. Ha ez így történik, akkor viszont nem lesz elég adat ahhoz, hogy ezt a gép közel 100 százalékos pontossággal kövesse. Ez is egy evolúciós folyamatot jelent, amelyben az ember halad a frontvonalban, a gépek pedig követik az adatok segítségével, amelyek mennyisége a fordítás minőségét nagyban behatárolja. De a hétköznapi életben, a mindennapok kommunikációjában akár néhány száz szó ismerete is elegendő ahhoz, hogy „ne adjanak el bennünket”. Nagyon jól el lehet boldogulni az életben a jelenlegi fordítási színvonal mellett is, ami kiemelkedő eredmény, és még néhány éve sem mert volna senki erre fogadni.

Melyek azok a területek, ahol jelentős segítséget kaphatunk a mesterséges intelligenciától?

A tervezés, dokumentálás, fejlesztés, tesztelés, auditálás MI alapokra helyezésétől szintlépést várok a mérnökség minden ágában. Vegyük például a számítógépes kódok fejlesztését: sokan ismerik a jelenséget, amikor egy kód „elszabadul”, úgynevezett spagetti kóddá válik, hiszen a programírás egy nehezen kordában tartható műfaj. Nem kevesen gondolnak úgy a szoftveriparra, hogy a zsenialitás és az őrület határán egyensúlyozó magányos programozó kitalál valamit, ami aztán forradalmasítja a világot. De ez egyre kevésbé van így, itt is egyre inkább a futószalagokra lebontott csapatmunka dominál már, ami egy dokumentált folyamat kellene, hogy legyen, és ebben a mesterséges intelligencia sokat tud segíteni. Kis lépésnek tűnik, de például a szkriptek ad hoc írogatását is átvállalja az MI és magasabb szintre képes emelni. (Az informatikában a szkript névvel rövid programokat illetnek, amelyek gyakran egy-egy részfeladat automatizálására szolgálnak. – A szerk.) Az is megoldhatóvá válik, hogy magát a szoftvert auditáljuk, ami nem egy megszokott dolog. Ad absurdum, az MI képes lesz fejleszteni önmagát az MI repertoárt is, új MI kódokat és modelleket gyártva, s ezeket a kis partikuláris MI megoldásokat a nagy MI modellek átveszik és továbbfejlesztik. Ez hasonló folyamat lesz, mint hogy a neten fellelhető adatokból dolgozva kész beszélgetéseket kreál.

Ha jól értem Önt, a szoftverfejlesztés terén drasztikus átalakulás előtt állunk.

Az MI leveheti a mechanikus szoftverfejlesztő munka nagy részét a gondolkodó mérnök válláról. Nem kell azzal foglalkozni, hogy miként lehet(ne) egy adott környezetben kifejleszteni egy programot egy adott problémára, mert egy helyes absztrakt modell vagy algoritmus alapján az MI ezt elvégzi helyettünk. Ez szerintem gátszakadás szintű eredményt fog hozni. Egy jól megfogalmazott szabatos protokollt a mesterséges intelligencia lefordít egy algoritmussá, és mások számára is elérhetővé tesz. Mondjuk egy klinikán megoldást találnak egy problémára, ami, ha beválik, akkor felskálázható, és másutt is követhető – a klinikán, az országban, és akár az egész világon. De nem csak a szoftverfejlesztés változik. A papírmunka mindenütt háttérbe szorulhat a kreativitás javára, kicsit hasonlóan, mint ahogyan a keresőprogramok könnyítették meg a munkánkat: nem járunk könyvtárba újságokat átlapozni, mikrofilmeket olvasni és összeszedni az alapinformációkat. Egy jó kérdésre válaszul a keresőprogram összeszedi nekünk az összes vagy majdnem összes releváns információt, hogy aztán néhány napi tanulással eljussunk arra a szintre, amikor már a tényleges feladaton dolgozhatunk. Az MI ugyanezt végezheti el majd magasabb szinten: egy jó draft – vázlat, nyers megoldási javaslat – alapján már konkrét megoldásokat fog adni. Az MI segít, hogy a mérnöki elképzelés kézzelfogható valósággá váljon.

Előfordulhat, hogy egy emberek által követett protokollra, azt mondja az MI, hogy ez így sem nem hatékony, sem nem helyes, például egy orvosok által követett eljárás esetében?

Egy terápiákat ajánló vagy munkahelyi felvételi rendszer esetében az MI kialakíthat egy javasolt sorrendet, megpróbálva csökkenteni az emberi döntéshozatali torzításokat. Ez azonban egy nagyon komplex kérdéskör és átvezet bennünket az etikus MI felségvizeire, ami azzal foglalkozik, hogy meghatározza, milyen kontextusban hogyan lehet, illetve mikor tiltott MI technológiákat használni. Például az EU-ban tilos automatizált társadalmi pontrendszereket használni, különösen közterületeken történő észrevétlen, valós idejű személyes beazonosítással kombinálva.

Olyasmire gondol, mint amit Kínában építenek? Ők olyan szintű megfigyelési rendszert hoztak létre az MI segítségével, amely megakadályozza, hogy egyes egyének hozzáférjenek bizonyos (számítógépes) rendszerekhez a nem megfelelő viselkedésük miatt, például mert olyan eszméket képviselnek, amelyek az algoritmus szerint nem megfelelőek, vagy rossz irányba viszik a társadalmat.

Igen, ezt a fajta pontrendszert az Európai Unió tiltja. Ne a gép döntse el, hogy mi számít közösség elleni izgatásnak vagy gyűlöletbeszédnek, kell, hogy legyen egy olyan döntési pont, amikor az ember felügyeli a rendszert, és emberként tekint a döntésben érintettre. A kanti elv szerint, ha emberről döntünk, nem tekinthetjük eszköznek. Az európai szabályozás nagyon helyesen nem engedi, hogy az embert teljesen kikapcsoljuk ezekből a rendszerekből („human in the loop” elv). Jó példa erre az autonóm fegyverrendszerek világa: a dilemmát jól ismerjük a vegyi, biológiai és nukleáris fegyverek kontextusából. Mivel egy kontrollálatlan helyzetben senki sem jár jól, az ilyen, az emberiséget globálisan vagy egzisztenciálisan fenyegető rendszereket szigorú egyezményekkel kell szabályozni, és nem szabad kihagyni az emberi tényezőt. Jól hangzik, hogy mi állítjuk elő a legjobb drónt, ami felismeri az ellenséget, de valójában az ellenséges hasonló teljesítményű drónok miatt a veszteségek összességében csak nőnek és ráadásul fennáll a veszélye, hogy ez a civil lakosságra vagy akár a teljes földi ökoszisztémára, az általunk egyedinek ismert életre is potenciális veszélyt jelenthet.

Mi adja most az MI fejlesztésének hajtóerejét?

A kezdeti évtizedekben a katonaság rengeteg MI kutatási irányt támogatott, például a már említett természetes nyelvi fordítás kapcsán is. Részben ennek kudarca miatt is következett be a ’70-as években az „MI tél” időszaka, limitált állami támogatással, amelyet a ’80-as években az első MI „fegyverkezési verseny” váltott fel Japán ötödik generációs számítógépes projektje által motiválva. Ez a „szakértői rendszer”-korszak kifulladt a ’90-es évekre, és az MI fejlesztések – mint például a természetes nyelvi kereső és ajánlórendszerek – inkább az internet és az adattudomány részeként jelentek meg 2010-ig. Ekkortól viszont a magánszektor lépett előre. Ma a privát intézmények dominálnak, dollármilliárdokat tudnak az MI legkülönfélébb ágait – tehát nem csak az önvezetés vagy a nyelvi programok tökéletesítését – célzó fejlesztésekre fordítani. Ezekkel az akadémiai, de még a kormányzati, katonai támogatások sem tudják felvenni a versenyt. Amiben az akadémiai szféra versenyelőnye megmaradt, az az interdiszciplináris jelleg, vagyis a mesterséges intelligencia összekapcsolása más tudományágakkal. Az ipari kutatásoknak nincs lehetősége kivárni a több évtizedig tartó (alap)kutatások eredményét, például, a nehezen definiálható betegségek, mint a depresszió vagy az öregedés molekuláris hátterének megértését és az új hatóanyagok kifejlesztését. Számukra nem tervezhető rizikó, ha nem látják a kereskedelmi végpontokat. Egyes üzleti angyalok esetenként igen ambiciózus, az MI-hez nagyon lazán kapcsolódó kutatásokat is finanszíroznak, mint például Elon Musk a Neuralink Corporation nevű cégét, amely azzal foglalkozik, hogy összekösse a gépet és az emberi neuronokat, vagyis beültethető agy-gép interfészeket (BMI) fejlesztenek.

Az Ön által vezetett mesterséges intelligencia kutatócsoport a BME-n mivel foglalkozik?

Nálunk az orvosbiológiai kutatások vannak előtérben, annak teljes spektruma: az egészségmegőrzés és öregedéskutatás, biomarker felfedezés és diagnosztika, illetve döntéstámogatás és terápiás javaslatok kidolgozása. Ezen belül két fő területen dolgozunk. Az egyik a statisztikus genetikai kutatások támogatása MI módszerekkel, különösen depresszió és multimorbiditás esetében. A másik a gyógyszerkutatás, azaz miként lehet a korai gyógyszerkutatásban ígéretes hatóanyagokat találni, illetve hogyan tudnánk az ideálishoz legközelebbi megoldásokat – molekuláris útvonalakat, célpontokat – találni egy betegség befolyásolására, aminek aztán terápiás lehetősége van. Miként lehet elérni a terápiás hatást kis molekulákkal, természetes hatóanyagokkal, életmódváltással – ennek támogatására is fejlesztünk mesterséges intelligencia módszereket.  Ez is egy olyan interdiszciplináris kutatási terület, ahol több szakterület kapcsolódik össze, mint a kemoinformatika, a bioinformatika, az egészségügyi informatika, illetve a biostatisztika, gépi tanulás és mesterséges intelligencia.

Mennyire eszközigényes a kutatás?

Az egyik oldal az adat. 15 éve a UK Biobank adatait használjuk, amely egy fél milliós populáció adatait tartalmazza. Ez a nagyságrend ebben a műfajban sztenderd. A lakosság adatait profilírozták, anonimizálták, és elérhetővé tették a teljes betegség-, gyógyszer- és életmódprofillal együtt, amit előfizetésért cserébe mi is használhatunk. Ezt az adatbázisépítést elvégezték a finnek és az észtek is. Sajnos hazai viszonylatban bár az EESZT-nél vannak is erre konkrét kezdeményezések, egyelőre nem történt előrelépés ezen a területen, nem született meg egy olyan magyar populációs adatbázis, amely hasonló biobank-szinten használható lenne kutatási célra. Ez fájó tény. A másik fájó pont a hardver.

„Tavaly megérkezett a világ TOP 500 szuperszámítógépének rangsorára is felkerült szuperszámítógép, a Komondor, az 50 000 laptop teljesítményű szuperszámítógép. A High Performance Computing (HPC) infrastruktúra ma már éppúgy nélkülözhetetlen a tudományos életben, mint az innovatív ipari megoldások kidolgozásánál.  A Kormányzati Informatikai Fejlesztési Ügynökség által üzemeltetett rendszer hamarosan a felhasználók rendelkezésére áll” – erről tavaly mi is beszámoltunk, és – feltételezem – az olyan feladatok elvégzése miatt vált szükségszerűvé, illetve észszerűvé a beszerzés, mint az MI kutatása.

Örömmel tudom megerősíteni, hogy éppen most vált lehetővé hozzáférés igénylése, amit meg is kaptunk.

Engedjen meg egy személyes kérdést!  A publikációs jegyzékéből látom, hogy Önt szerte a világban jegyzik. Soha nem akarta külföldön folytatni a munkát?

A helyzet fordított, mivel doktori kutatásaimat Belgiumban, a Leuveni Katolikus Egyetemen végeztem MI témában, de ezt követően hazajöttem. A nemzetközi színtérre gondolva úgy látom, hogy nem csak Belgiumhoz, de mondjuk Szlovéniához vagy Csehországhoz képest is furcsa helyzetbe kerültünk, mert miközben már több éve százmilliárd forintos állami MI támogatási programokról lehet hallani, közben élvonalbeli MI kutatók kényszerültek külföldre vagy senki számára nem ideális módon ipari környezetbe. Továbbá számunkra, akik már éppen 30 éve foglalkozunk a mesterséges intelligencia oktatásával is – a BME-n mi oktatjuk a VIK-es BSc hallgatóknak a mesterséges intelligencia alapjait és vezetjük az MSc szintű MI specializációs képzést is – különösen fájó az MI oktatási anyagok fejlesztését támogató hazai programok teljes hiánya.

Félretéve a tudós társadalomban kötelező szerénységet, mi az, amire az elmúlt negyed évszázadra visszatekintve a legbüszkébb?

Valóban lassan 25 éve, hogy az IOTA projekt* MI ágaként tudományos szempontból elsők között hoztunk létre az élettudományoknak egy igen nagy részét átfogó és integráló mesterséges intelligencia rendszert, amely több ma is a kutatás élvonalába eső funkciónak tartalmazta a prototípusát, például oksági kutatásnak, bayesi következtetésnek, transzfer tanulásnak, federált tanulásnak, magyarázható MI-nek és megbízható MI-nek. A bioinformatikai, molekuláris biológiai terület akkori embrionális állapota miatt az akkori koncepciók a mai napig sok kutatásunkban még mindig mintául szolgálnak, sőt, bár ez nem biztos, hogy büszkeségre kellene, hogy okot adjon “;-)”, de több esetben ugyanazon célokat próbáljuk elérni, csak éppen egy sokszorosára növekedett területen. További személyes öröm, hogy jelenleg részt veszünk a Human-Centred Artificial Intelligence Masters** projektben, amely az elsők között hoz létre egy etikus MI MSc programot és nagyon izgalmas látni azon jogi szabályozási kereteknek a megszületését***, amelyek remélhetőleg lehetővé teszik, hogy a hajdani kutatási témák eljuthassanak végre a társadalmi felhasználásig.

 

Rozsnyai Gábor

 

Jegyzetek:

*: https://www.iotagroup.org/welcome/about-iota

**: https://hcaim.bme.hu/

***: https://www.bme.hu/hirek/20230726/Bizalmat_a_felhasznaloknak_kiszamithato_biztonsagot_a_fejlesztoknek_keszul_az_AI_Act