A mesterséges intelligencia (MI) mindig hallucinál

A mesterséges intelligencia (MI) hallucinál, és fog is

(2026 június)

Az AI (mesterséges intelligencia) azért hallucinál, mert nem tényeket vagy valóságos tudást keres a memóriájában, hanem matematikai valószínűségek alapján írja ki a következő legvalószínűbb szót. Az AI modellek (például a ChatGPT) fejlett szövegkiegészítő rendszerek, amelyek a betanított adatminták alapján működnek, nem pedig logikus gondolkodás vagy bizonyított állítások alapján.

A hallucináció fő okai:

- Hiányos vagy hibás tanítóadatok: ha a modell adathalmazában téves információk szerepeltek, vagy az egyes témákról kevés adat áll rendelkezésre, az AI hiányos tudásból építkezik. A kényszeres válaszadás miatt- mert a rendszereket úgy tervezték, hogy minden esetben válaszoljanak-, amikor az AI nem talál pontos tényt, választ, akkor nem "hallgat", hanem statisztikai logika szerint elkezd tippelni.

- Túltanulás esetén a modell ragaszkodik a tanítási adatok specifikus mintáihoz, és képtelen rugalmasan, helyesen reagálni az új kérdésekre, azaz új mintázatot keresni.

- Kontextus félreértelmezése: hosszú vagy bonyolult kérdések (promptok) esetén a modell elveszítheti a fonalat, összekeveri a részleteket, és téves összefüggéseket válaszol.

- Magabiztos mintakövetés: a betanított emberi szövegek többsége határozott és magabiztos hangvételű, az AI a téves vagy kitalált információkat is tökéletes nyelvtannal és meggyőző stílus-ban másolja és tálalja.

A leggyakoribb esetek: nem létező források, könyvek vagy tudományos cikkek kitalálása, pl. valótlan történelmi eseményeket talál ki, dátumokat téveszt. Olyan programozási kódokat ír, amelyek nem létező funkciókra hivatkoznak.

Hogyan csökkenthető a hallucináció? Teljesen még a legújabb modelleknél sem küszöbölhető ki a probléma, és elvi okokból kis valószínűséggel, de mindig lesznek téves válaszok. Pontos promptokkal, utasításokkal csökkenthető a hallucináció, világos, egyértelmű és részletes utasításokra pontosabb válaszokat kapunk. Forrásmegjelölés kéréséval meg lehet követelni, hogy csak ellenőrizhető hivatkozásokat használjon az AI, pl. élő internetes kereséssel. A parancsban szerepelhet, hogy "Te egy precíz tényellenőrző vagy", és "Ha nem tudod a biztos választ, mondd azt, hogy nem tudod, és ne találgass!"

A RAG a Retrieval-Augmented Generation (Kereséssel Kiterjesztett Generálás) rövidítése, ami a jelenlegi leghatékonyabb technológia az AI-hallucinációk csökkentésére. Ekkor az AI-nak nem a betanított adatok között kell kitalálnia a választ, hanem a válaszadás előtt kikeresi a pontos információt egy külső adatbázisból vagy dokumentumból, majd a külső adatok alapján fogalmazza meg a választ egy három lépéses folyamatban. Első lépésben a rendszer átkutat egy megbízható külső forrást (pl. céges dokumentumokat, PDF-eket, belső wikiket vagy az élő internetet). Második lépésben a megtalált szövegrészleteket és tényeket a rendszer hozzácsatolja az eredeti kérdéshez (prompthoz). Az utolsó lépésben a nyelvi modell (LLM) megkapja a kérdést és a pontos tényeket is, így már az LLM képes pontosan válaszolni. Csak a kapott forrásra támaszkodhat, ami megszünteti a hallucinációt.

Bizalmas adatok kezelésére is alkalmas a RAG, segítségével az AI képes biztonságosan válaszolni cégspecifikus adatokkal, belső szabályzatokkal vagy HR dokumentumokkal kapcsolatos kérdésekre is. RAG nélkül az AI olyan, mint egy diák, aki vizsgázik, de otthon hagyta a könyveit, emlékezetből próbál válaszolni, ezért ha valamit elfelejtett, elkezd tippelni (hallucinálni), és ezt magabiztosan is teszi. RAG-gel az AI olyan, mint egy diák, aki előtt ott van a nyitott tankönyv a vizsgán. Kikeresi a pontos fejezetet, elolvassa, és hibátlanul megválaszolja a kérdést. A RAG rendszer vektoros adatbázisokat használ, -melyek a jövő nagy megbízhatóságú AI adatbázisai-, vagy kész eszközökkel (pl. Notebook) tud saját dokumentumokból RAG-alapú asszisztenst készíteni.

Tehát az AI meglepően gyakran hallucinál, ami függ a feladattól, a modelltől, az utasítástól, és attól, hogy használ-e külső tudásforrásokat. Az MI hallucinációja azt jelenti, hogy magabiztosan állít valamit, ami nem igaz, vagy részben kitalált, ami lehet nem létező tudományos cikk, hibás történelmi adat, kitalált idézet, nem létező személy vagy intézmény, hibás matematikai vagy logikai következtetés. De az AI nem "hazudik": csak nem tudja, hogy amit mond, igaz vagy hamis, mert a legvalószínűbb következő szavakat keresi és állítja elő. Egyszerű, jól ismert témákban: 1% alatt is lehet a hallucináció. Bonyolult szakmai kérdéseknél: 5–20% sem ritka. Ismeretlen, ritka témáknál vagy ha forrásokat kell kitalálnia: akár 30–50% is lehet. A hallucináció oka az, hogy nem tudja, mi az igazság. A nyelvi modell nem adatbázis. Arra a kérdésre keresi a választ, hogy "Mi lenne t a legvalószínűbb következő szó, mondat?"

Ha kevés adat szerepelt a tanításban, akkor a modell "kitölti a hézagokat" az általa legvalószínűbbnek vélt szavakkal.

Ha sok hasonló példát látott, akkor is talál hasonló mintát, és hamis állításra, következtetésre jut, mert a tanítás célja elsősorban az, hogy a következő szó legyen minél valószínűbb, és nem az, hogy minden állítás helyes legyen.

Ritka témáknál kombinál, például egy kevéssé ismert fizikai jelenség esetén több különböző publikáció elemeit összekeverheti, ami fontos kutatási témáknál, mert könnyebben előfordulhat, hogy egy valós eredményt egy másik kutatás valós részleteivel kombinál.

A hallucinációt nem lehet teljesen megszüntetni, mert a nyelvi modellek működésének egyik alapelve, hogy mindig adjanak választ.

Ha nem biztosak valamiben, két lehetőség lenne: azt válaszolja "nem tudom"; vagy megpróbál következtetni. A legtöbb modell a következtet, mert ez sok feladatban hasznos, de növeli a hallucináció esélyét, ami emberi visszajelzésekkel is csökkenthető. Az újabb modellek már ritkábban hallucinálnak, ha hozzáférnek megbízható külső forrásokhoz. A fontos vagy tudományos állításokat továbbra is érdemes ellenőrizni, ami különösen igaz új, vitatott vagy kevéssé kutatott témákra, ahol a rendelkezésre álló információ önmagában is korlátozott, vagy bizonytalan.

Példa: (https://444.hu/2026/06/12/mesterseges-intelligencia-hallucinaciokkal-volt-tele-a-mesterseges-intelligencia-elonyeirol-szolo-kpmg-jelentes) A KPMG októberben írt egy jelentést arról, hogy hogyan használják a vállalatok a mesterséges intelligenciát világszerte, amiben esettanulmányok is szerepeltek, melyekről kiderültek, hogy nem csupán eltúlozták a technológia elterjedtségét, hanem egyszerűen hamisak, AI találta ki őket. És olyan szervezeteknél, mint a svájci UBS bank, az Egyesült Királyság Nemzeti Egészségügyi Szolgálata (NHS), valamint a Svájci Szövetségi Vasutak (SBB) és a Transport for London tömegközlekedési vállalatok. A KPMG-jelentés azt állította, hogy a globális vagyonkezelő UBS „AI-ágenseket integrál a befektetési tanácsadás, a kockázatkezelés és a megfelelőség-ellenőrzés területén”. A KPMG így fogalmazott: „Ezek az ágensek a Microsofttal közösen kifejlesztett, moduláris platformon belül működnek, lehetővé téve a személyre szabott, hatékony és a szabályoknak megfelelő pénzügyi folyamatokat.” A bank szóvivője az FT-nek elmondta, hogy az állítások „tényszerűen hibásak”. A tanácsadó cégek jelenleg is reklámozzák szolgáltatásaikat a vállalati ügyfelek körében, mint az AI-bevezetés szakértői, beleértve a technológia felelősségteljes használatát, és a hibák elkerülését szolgáló belső szabályzatok kialakítását, és az elmúlt néhány évben több száz „szakmai vitaindító” anyagot adtak ki az AI-ről, hogy ügyfeleket vonzzanak.