Az MI válaszok pontossága javul
(2026 január)
Az MI szövegértelmezése és az intelligencia* eltérő fogalmak, a szövegértelmezés %-ban mérhető. Az MI nem fogalmakat, hanem mintázatokat ismer fel, még mintázat-láncokat is: mintázatok azonosításával értelmezi a szöveget. Bátran használhatjuk a bonyolult mintázat fogalmi képet, azaz hogy a helyes válaszhoz tartozó mintázat mennyire fedi a pontos kérdéshez tartozó mintázatot? Itt a mintázat egy absztrakció, de lehet formálisan egy egyszerűbb-bonyolultabb mintázatra gondolni. Az MI válaszok pontosságára, azaz a mintázatok hasonlóságának mérésére kiértékelő módszer nem ismeretes, de a helyes válaszok %-a használható.
Az értelmezést egy szó kontextusának, szövegkörnyezetének nevezik az irodalomban. A szövegértelmezéssel történő fordítást 2017-ben kezdték csak használni a nyelvi modellekben, de a felismerés az 1950-es évekből származik: Danica Seleskovitch (1921–2001), egy neves francia tolmács és kutató volt, aki az 1950-es évektől dolgozta ki elméleti alapjait annak, amit ma értelmező fordításelmélet-nek nevezünk.
Az MI szövegértelmezésének pontossága függ az elegendő mennyiségű bemeneti adatoktól, azaz megvannak-e szükséges és megfelelő mintázatai a gépnek a kérdésre vonatkozóan. Továbbá függ a kérdés pontosságától is, mert a gép a pontosan-pontatlanul feltett kérdéshez keres mintázatot. (A pontatlan kérdés mintázata mennyire fedi a pontos kérdés mintázatát?) Az MI pontatlan kérdés esetén a pontatlan kérdés mintázatára válaszol. Az is előfordulhat, hogy eltéved a mintázat keresésben, és "hallucinál". Az adott kérdés témakörében kielégítő (min. 80-90%-os*) input ismertekre van szüksége a kielégítő pontosságú, mintázatú válaszhoz.
Mérhető-e az AI pontossága %-okban? Ha egy tanuló legalább 80%-ban helyesen értelmez egy szöveget, amikor válaszol egy kérdésre, akkor minimum négyes osztályzatot érdemel. A "józan paraszti ész" legalább 80%-ban* helyes. A legismertebb összehasonlító vizsgálat a Nature 2005-ös tanulmánya volt, amely szerint a Wikipédia tudományos szócikkei kb. azonos pontosságúak voltak, mint az Encyclopaedia Britannica cikkei (hibaszám alapján csak kis különbség volt). Későbbi vizsgálatok általában azt találták, hogy az MI által is idézett Wikipédia kb. 80–90% pontosságú a stabil, jól követett témákban, de a friss, vitatott vagy szűk csoportokra vonatkozó témákban a pontosság jelentősen csökken. Lehetségesnek tűnik az MI pontosságát a helyes válaszok %-ában mérni, ezért használni fogjuk, és a megfelelő valószínűség százszorosa.
2025-ben a nagy MI-k pontossága már meghaladta a 90%-ot, a 100% -ot pedig nem érheti el.
Az MI hol téveszthet mintázatot, ha a kérdés pontos (mintázata adott)?
- A bemenő adatok pontatlanok,
- Kevés bemenő adat miatt pontatlan az AI mintázat készlete,
- A kérdés megfogalmazása pontatlan,
- Az MI pontatlanul illeszti a mintázatot,
- A felhasználó félre értelmezi az egyébként helyes választ, pl. szokatlan szóhasználat (ami szintén mintázat) miatt.
- Az Mi meghív sokféle -matematikai, zenei és videószerkesztő- algoritmust,
- Első lépésben figyelmen kívül hagyjuk, hogy a gépnek, pl. az áramellátásának is van megbízhatósága, ami a rendelkezésre állás valószínűsége, a rendelkezésre állás idejének százalékában adják meg, pl. 99.99%.
(Ha minden mintázat tévesztéshez tudnánk ismert %-ot rendelni, a válasz pontosságát százalékokban úgy kapnánk, hogy a szorzatot elosztjuk 100 annyiadik hatványával, ahány tényezőt összeszoroztunk.)
Javasolt teszt típus: valamely művelet és inverz művelete után az eredmények összehasonlítása, pl. oda-vissza fordítás, képszerkesztés visszafordítása-.. Nyilván a pontosság műveletenként változik, és nem minden esetben tesztelhető az inverz művelet.**
*A természetes gondolkozás (józan paraszti ész, NQ): a véleményeink azért egyeznek, mert közel mindenki ugyanazon következtetésekre juthat, ha a gondolkozása természetes. Az "egyszerűség elve": két, az adott jelenséget egyformán jól leíró magyarázat közül az egyszerűbbet érdemes választani. (Latinul „lex parsimoniae”, azaz a „tömörség elve”, azaz „Pluralitas non est ponenda sine necessitate”, magyarul: „Csak szükség esetén feltételezzük a sokféleséget”.) A józan ész válaszai a "Miért?" kérdésekre nem feltétlenül tudományos válaszok, hanem tapasztalatokon, megfigyeléseken alapulnak, pl. az időjárással kapcsolatos megfigyelések, de általában egybe esnek a tudományos érveléssel. A mindennapi józan ész logikája (angolul commonsense reasoning) azt jelenti, ahogyan az emberek természetes módon következtetnek a világban szerzett hétköznapi tapasztalataik alapján: rugalmas, tapasztalat-alapú gondolkodás, amely gyorsan és hatékonyan működik hétköznapi helyzetekben. A józan ész logikája segít a túlélésben, megóv hibás döntésektől általában, és gyors döntéshozatalt tesz lehetővé, a helyzetek legvalószínűbb alapértelmezéséit adja. Mások tapasztalatain alapul, a legvalószínűbb kimenetelt, egyszerű, gyakorlati megoldásokat keres, és nézőpontok váltásával fejleszthető. A józan ész mondatja velünk, hogy "Kés, (villa, olló) és az MI 16 év alatti gyerekek kezébe nem való, de utána már tanítandó"!*
Az emberi természetes intelligencia (IQ) fő ismérvei: az ember képes a folyamatosan ismereteket gyűjteni, a változó körülményekhez alkalmazkodni, és a problémákat rugalmasan, a korábbi tapasztalatokból merítve megoldani. Az egyén képes új, eredeti ötletek, megoldások és alkotások létrehozására is, ami a mesterséges intelligencia számára utánozható terület. Az emberi speciális intelligencia többféle területen nyilvánul meg, például nyelvi, logikai-matematikai, vizuális-térbeli, zenei, mozgási formákban. Külön tesztelhető.
Az emberi természetes intelligencia (IQ) fő ismérvei: az ember képes a folyamatosan ismereteket gyűjteni, a változó körülményekhez alkalmazkodni, és a problémákat rugalmasan, a korábbi tapasztalatokból merítve megoldani. Az egyén képes új, eredeti ötletek, megoldások és alkotások létrehozására is, ami a mesterséges intelligencia számára utánozható terület. Az emberi speciális intelligencia többféle területen nyilvánul meg, például nyelvi, logikai-matematikai, vizuális-térbeli, zenei, mozgási formákban. Külön tesztelhető.
Érzelmi intelligencia (EIQ): magában foglalja a saját és mások érzelmeinek felismerését, megértését és kezelését, a képesség kulcsfontosságú a sikeres emberi interakciókban és a mentális jólétben. Képesség a másokkal való hatékony kommunikációra, együttműködésre, empátiára és a társas normák megértésére. Önreflexió és tudatosság esetén valaki képes önmagára, saját gondolataira, érzéseire és cselekedeteire reflektálni, vállalni a hibáit, és ezek tudatában fejlődni. Egy képesség, hogy tudatosan figyeljük és irányítsuk saját gondolkodási folyamatainkat, tanulási stratégiáinkat. Az emberi viselkedést gyakran belső motivációk vezérlik.
Az intellektus (ami mérhetetlen tesztekkel) meghatározása: az "intellektus" értelmi képességet, a tudatot, tudatost jelent. Magába foglalja az észlelés, az emlékezés, a gondolkodás, általánosítás, az elvonatkoztatás, az érvelés, eszközkeresés, készítés és a döntéshozatal képességeit. A (cél-) tudatosság és a célhoz az eszközkeresés, taktika- és stratégiakeresés a legmagasabb szintű integrált mentális tevékenységek, a humor magas rendű emberi tulajdonságok. Az intellektuálisan fejlett embereket az új problémák felismerése és megfogalmazása jellemzi, jól, jókor és jót kérdezni kevesek képessége, és sokkal nehezebb mint válaszolni.
**Az AI felismeri, hogy az AI írta a szöveget?
A válasz nem egyértelmű, bár az ember többnyire felismeri: akik használnak mesterséges intelligencia által írt szövegeket, azok felismerik az AI által írt szövegeket. (https://index.hu/techtud/2026/01/04/mesterseges-intelligencia-szoveg-akotas-viz-jel-ai/). Használhatjuk az AI-t annak felismerésére is, hogy AI készítette-e a szöveget. Ha betanítunk egy modellt változatos AI-s szövegekkel a megkülönböztetésére, akkor a betanítás után az esetek valamilyen %-ban felismeri az AI-s szövegeket. Ekkor a tanulásalapú algoritmusok elemzik, hogy az új szöveg mennyire hasonlít azokhoz az adatokhoz, amelyeken betanították őket, pontosságuk viszont csökken, ha a szöveg jelentősen eltér a betanító szövegek mintázataitól.
Egy másik módszer statisztikai paramétereket keres a szövegben, annak felismerésére, hogy a szöveg AI által generált-e. Ha a modell szokatlanul magas valószínűséget, %-ot rendel a szavak AI típusú mintázataihoz, ez annak a jele lehet, hogy a szöveget egy AI-modell generálta. A módszer olyan mintázatokra támaszkodik, amelyek nem kizárólag a szöveg tartalmából, formai jegyeiből állnak rendelkezésre, és az esetek valamilyen %-ban felismeri az AI-s szövegeket. A statisztikáknak más jellegű korlátai vannak, több olyan feltételezéseken alapul, hogy az AI-modellek hogyan generálnak szöveget, vagy a modellek valószínűségi eloszlásait használják.
