A Mesterséges Intelligencia rövid története
(2025 november)
AI (Artificial Intelligence, Mesterséges Intelligencia) = adatvezérelt rendszer, melyet szövegértelmező algoritmus jellemez.
1956 volt a Dartmouth-i Konferencia, ahol a „Mesterséges intelligencia” (MI) kifejezést megalkották. 1957-ben Frank Rosenblatt kifejlesztette a Perceptront, az első mesterséges neurális hálózatot, amelyet mintázat- és képfelismerésre terveztek. A 1960-as és 1980-as évek a stagnálás és újjáéledés időszakai voltak. 1967-ben kifejlesztették a „legközelebbi szomszéd” algoritmust, amely lehetővé tette az alakfelismerést, és a hatékony útvonal elemzést (megoldva az utazó ügynök problémáját). Megszülettek az első tételbizonyító alkalmazások, pl. a Geometry Theorem Prover, mely explicit axiómákra támaszkodva
tételeket bizonyított. A korai AI-programok többsége úgy dolgozott, hogy a megoldandó problémára vonatkozó alapvető tényekből kiindulva véletlen lépés sorozatokat próbálkozott a megoldás megtalálásához. 1980-as éveket a szakértői rendszerek felemelkedése jellemezte, a hangsúly a tudásalapú rendszerekre helyeződött át, amelyek kereskedelmi sikert arattak. 1980-as évek közepén a neurális hálózatok újjáéledtek a visszaterjesztési algoritmus - a kimenet hibáját visszacsatolták, elosztva- értelmezésével.
tételeket bizonyított. A korai AI-programok többsége úgy dolgozott, hogy a megoldandó problémára vonatkozó alapvető tényekből kiindulva véletlen lépés sorozatokat próbálkozott a megoldás megtalálásához. 1980-as éveket a szakértői rendszerek felemelkedése jellemezte, a hangsúly a tudásalapú rendszerekre helyeződött át, amelyek kereskedelmi sikert arattak. 1980-as évek közepén a neurális hálózatok újjáéledtek a visszaterjesztési algoritmus - a kimenet hibáját visszacsatolták, elosztva- értelmezésével.
De a 1987–1993-ban eljött a második MI-tél, a finanszírozás és az érdeklődés második csökkenésének időszaka, Az adatvezérelt megközelítések 1990-es években: a gépi tanulás területe elmozdult a szimbolikus mesterséges intelligenciától a statisztikában és a valószínűségszámításban gyökerező módszerek felé, a digitális adatok mennyisége és a számítási teljesítmény növekvő elérhetősége következtében. 1997: Az IBM Deep Blue számítógépe legyőzte Garri Kaszparov sakkvilágbajnokot, ami jelentős nyilvános mérföldkőnek bizonyult, és bemutatta, hogy a gépi intelligencia felülmúlja az emberi képességeket egy összetett feladatban. Volt egy dámajátékot játszó program, melynek játékereje a versenyzői szintet is elérte. A program először kezdő szinten játszott, de sok önmagával lejátszott játszma után erős emberi versenyeken is méltó ellenfél volt.
A statisztikai modellek kora (1980–2010)
Rejtett Markov-modellek (HMM, 1980–1990), beszédfelismerésben és egyszerű szekvenciagenerálásban használták, már képesek voltak szöveg vagy beszéd együtt valószínűséget modellezni.
Nyelvi modellek (1990–2000), a generálás alapja: „n” darab egymást követő szó statisztikai valószínűsége. a Google és más korai keresők is ezeket használták. A neurális hálók megjelentek (1990–2010), melyek képesek voltak hosszabb szekvenciákból is tanulni, elindítva a modern szöveggenerálás fejlődését.
Rejtett Markov-modellek (HMM, 1980–1990), beszédfelismerésben és egyszerű szekvenciagenerálásban használták, már képesek voltak szöveg vagy beszéd együtt valószínűséget modellezni.
Nyelvi modellek (1990–2000), a generálás alapja: „n” darab egymást követő szó statisztikai valószínűsége. a Google és más korai keresők is ezeket használták. A neurális hálók megjelentek (1990–2010), melyek képesek voltak hosszabb szekvenciákból is tanulni, elindítva a modern szöveggenerálás fejlődését.
A mélytanulás forradalmának kezdete (2006 – napjainkig)
2006: Geoffrey Hinton megalkotta a „mélytanulás” kifejezést a neurális hálózatok új, hatékonyabb architektúráinak leírására.
2006: Geoffrey Hinton megalkotta a „mélytanulás” kifejezést a neurális hálózatok új, hatékonyabb architektúráinak leírására.
2011: Az IBM Watson számítógépe megnyerte a Jeopardy! című játékshow-t, bemutatva a fejlett természetes nyelvi feldolgozási képességeket.
2012: Geoffrey Hinton csapata által kifejlesztett mély neurális hálózat jelentős áttörést ért el az ImageNet számítógépes látás versenyén, amely elindította a jelenlegi mélytanulási fellendülést.
2016: A Google DeepMind AlphaGo algoritmusa legyőzte a Go világbajnokát, egy játékot, amely sokkal összetettebb, mint a sakk, és kreatív és fejlett gépi gondolkodást mutatott be.
2016: A Google DeepMind AlphaGo algoritmusa legyőzte a Go világbajnokát, egy játékot, amely sokkal összetettebb, mint a sakk, és kreatív és fejlett gépi gondolkodást mutatott be.
A 2010-es évek végétől napjainkig: a generatív MI-modellek, például a GPT (Generative Pre-treated Transformer) sorozat megjelenése, amelyek képesek emberszerű szövegek és képek generálására. Manapság a gépi tanulás (ML) alapvető technológia, amely számtalan alkalmazásba beágyazódik, az ajánlómotoroktól az önvezető járművekig. A mélytanulási generátorok az AI aranykora 2014–2018 között. Generatív ellenséges hálók (GAN, 2014) kialakulása: Ian Goodfellow bemutatja a GAN-eket: két háló verseng egymással (generátor vs. diszkriminátor): fotorealisztikus képalkotásban, elvezetett a modern képmodellekhez. A valószínűségi generálás új szintje: képes zárt vektortérben kreatív variációkat létrehozni. A neurális szöveggenerálók első hulláma: Seq2Seq modellek (2014, Google), a fordítók, chatbotok egyik alapja.
Szövegértelmezés: Az értelmező (attention) mechanizmus (2014–2015): javuló hosszú távú kontextus, a Transzformer forradalom (2017– ): "Attention is All You Need” (Vaswani et al., 2017), megjelennek a Transzformer modellek, amelyek gyökeresen megváltoztatják az MI generálást, amelyek párhuzamosíthatóak, hatalmas adatmennyiségek esetén is működnek, jól bővíthetőek. Részletesen a Vaswani et al. cikk: "Attention is All You Need” (2017,
https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf), Abstract: "A domináns szekvencia-transzdukciós modellek komplex rekurrens vagy konvolúciós neurális hálózatokon alapulnak egy kódoló-dekódoló konfigurációban. A legjobban teljesítő modellek a kódolót és a dekódolót egy értelmező mechanizmuson keresztül is összekapcsolják. Egy új, egyszerű hálózati architektúrát javaslunk, a Transformert, amely kizárólag értelmező mechanizmusokon alapul, teljesen elhagyva a rekurrenciát és a konvolúciókat. Két gépi fordítási feladaton végzett kísérletek azt mutatják, hogy ezek a modellek minőségben kiválóak, miközben jobban párhuzamosíthatók, és jelentősen kevesebb időt igényelnek a betanításukhoz. Modellünk 28,4 BLEU-t ér el a WMT 2014 angol-német fordítási feladatban, ami több mint 2 BLEU-val javítja a meglévő legjobb eredményeket, beleértve az együtteseket is. A WMT 2014 angol-francia fordítási feladatban modellünk egy új, egyetlen modellen alapuló, csúcstechnológiás 41,8-as BLEU-pontszámot ér el 3,5 napos, nyolc GPU-n történő betanítás után, ami a szakirodalomban szereplő legjobb modellek betanítási költségeinek kis töredéke. Megmutatjuk, hogy a Transformer jól általánosítható más feladatokra azáltal, hogy sikeresen alkalmazza angol nyelvű felhasználói csoport elemzésére mind nagy, mind korlátozott betanítási adatokkal".
A Transzformer (transformer) modellek lényege a saját értelmező mechanizmus (a self-attention) alkalmazása, amely lehetővé teszi a modell számára, hogy a szekvenciális adatokban (például mondatokban a szavak között) fennálló kapcsolatokat és a kontextust értelmezze, leírja. A megközelítés paradigmaváltást hozott a természetes nyelvi feldolgozásban (NLP). Főbb jellemzői és előnyei:
• Saját értelmező mechanizmus: lehetővé teszi, hogy a modell egy bemeneti sorozat (pl. egy mondat) minden egyes részének fontosságát mérlegelje a többi részhez viszonyítva. Például képes felismerni, hogy egy névmás a mondatban korábban említett melyik főnévre vonatkozik, még akkor is, ha távol helyezkednek el egymástól. (Előtte szó szerint fordított a gép, nyelvtani szabályokkal, de nem kapott értelmezhető szöveget,)
• Párhuzamos feldolgozás: ellentétben a korábbi, szekvenciálisan (sorban) dolgozó modellekkel (például a rekurrens neurális hálózatokkal, RNN-ekkel), a transzformerek a teljes bemenetet egyszerre, párhuzamosan tudják feldolgozni, ami jelentősen felgyorsítja a betanítási folyamatot és a futási időt.
• Hosszú távú függőségek kezelése: a párhuzamos feldolgozás és az értelmező mechanizmus révén a transzformerek hatékonyan kezelik a hosszú, összetett szövegeket, amelyek értelmezése korábban nehézséget okozott.
• Encoder-Decoder architektúra: a transzformerek gyakran egy kódoló (encoder) és egy dekódoló (decoder) részből állnak. A kódoló sűríti az információt, a dekódoló pedig felhasználja azt a kimenet generálására, mindkét részben alkalmazva az értelmező mechanizmust.
Jelentősége, hogy a transzformer architektúra képezi a modern mesterséges intelligencia rendszerek, köztük a nagy nyelvi modellek (LLM-ek, mint a GPT-család vagy a BERT) alapját. Alkalmazásai közé tartozik a gépi fordítás, a szöveg összefoglalás, a chatbotok, valamint a kód- és szöveggenerálás. (Részletek az NVIDIA műszaki blogjában.)
• Hosszú távú függőségek kezelése: a párhuzamos feldolgozás és az értelmező mechanizmus révén a transzformerek hatékonyan kezelik a hosszú, összetett szövegeket, amelyek értelmezése korábban nehézséget okozott.
• Encoder-Decoder architektúra: a transzformerek gyakran egy kódoló (encoder) és egy dekódoló (decoder) részből állnak. A kódoló sűríti az információt, a dekódoló pedig felhasználja azt a kimenet generálására, mindkét részben alkalmazva az értelmező mechanizmust.
Jelentősége, hogy a transzformer architektúra képezi a modern mesterséges intelligencia rendszerek, köztük a nagy nyelvi modellek (LLM-ek, mint a GPT-család vagy a BERT) alapját. Alkalmazásai közé tartozik a gépi fordítás, a szöveg összefoglalás, a chatbotok, valamint a kód- és szöveggenerálás. (Részletek az NVIDIA műszaki blogjában.)
A Vaswani et al. (2017) cikk, az értelmező fordítási módszer indította el az AI már intelligensnek nevezhető szakaszát, amely mára néhány nagy (hét) AI rendszert eredményezett. Visszatérve az AI történetéhez, a nagy nyelvi modellek (2018–2020):
• GPT (2018) – a generatív előtanított transzformer prototípusa.
• GPT-2 (2019) – már folyékony, összefüggő szöveg.
• BERT (2018) – a kontextus jobb megértése ( alapmodell).
• GPT-2 (2019) – már folyékony, összefüggő szöveg.
• BERT (2018) – a kontextus jobb megértése ( alapmodell).
Multimodális generatív AI-k, azaz szöveg, beszéd, kép (2020–2024)
• GPT-3 (2020) – 175B paraméter, „few-shot learning”.
• GPT-4 (2023) – multimodális (szöveg + kép).
• LLaMA, PaLM, Claude és más nyílt/kereskedelmi modellek megjelenése.
Csak képgenerátorok:
• DALL·E (2021) – szövegből kép.
• Stable Diffusion (2022) – nyílt forrású robbanás.
• Midjourney (2022–) – művészi képalkotás új stílusban.
Diffúziós modellek (2020–2023):
• Képek generálása „zajból”, visszafelé tanulva.
• Stabil, részletgazdag képek gyors fejlődése.
• GPT-3 (2020) – 175B paraméter, „few-shot learning”.
• GPT-4 (2023) – multimodális (szöveg + kép).
• LLaMA, PaLM, Claude és más nyílt/kereskedelmi modellek megjelenése.
Csak képgenerátorok:
• DALL·E (2021) – szövegből kép.
• Stable Diffusion (2022) – nyílt forrású robbanás.
• Midjourney (2022–) – művészi képalkotás új stílusban.
Diffúziós modellek (2020–2023):
• Képek generálása „zajból”, visszafelé tanulva.
• Stabil, részletgazdag képek gyors fejlődése.
Generatív AI integrációja a mindennapokba (2024–2025)
Multimodális, ügynökszerű modellek, ahol az LLM-ek képesek:
◦ képet értelmezni,
◦ videót generálni,
◦ hangot szintetizálni,
◦ kódot írni,
◦ eszközöket működtetni (agentic AI).
Multimodális, ügynökszerű modellek, ahol az LLM-ek képesek:
◦ képet értelmezni,
◦ videót generálni,
◦ hangot szintetizálni,
◦ kódot írni,
◦ eszközöket működtetni (agentic AI).
◦ Az felügyelet nélküli tanulásnak (new self-learning) kialakult egy új
változata, amikor a gép kérdéseket generálva, saját magát tanítja.
Egyesített alapmodellek (foundation models, 2024–2025)
• Ugyanaz a modell képes szöveg, kép, hang, videó kezelésére.
• Jelentősen nő a terápiás, oktatási, ipari és kreatív alkalmazások száma.
• Jelentősen nő a terápiás, oktatási, ipari és kreatív alkalmazások száma.
Az AI-vel integrált modern keresők listája (2025)
1) Google Search + AI Overview
A legnagyobb keresőbe épített generatív összefoglaló és asszisztens funkció.
2) Microsoft Bing + Copilot
Erős generatív válaszok, képgenerálás, kontextusos keresés.
3) Perplexity AI
Gyors, forráshivatkozásos keresőasszisztens, szakmai közösségekben népszerű.
4) DuckDuckGo AI Chat / AI keresés
Anonimitás-barát, több AI-modellt is kínál.
5) Brave Search + Answer Engine
Saját index, AI-alapú tömör válaszok reklámmentesen.
6) You.com
Interaktív, moduláris AI-kereső, pluginekkel.
7) Baidu (Ernie Bot integráció)
Kína legnagyobb AI-alapú keresője.
1) Google Search + AI Overview
A legnagyobb keresőbe épített generatív összefoglaló és asszisztens funkció.
2) Microsoft Bing + Copilot
Erős generatív válaszok, képgenerálás, kontextusos keresés.
3) Perplexity AI
Gyors, forráshivatkozásos keresőasszisztens, szakmai közösségekben népszerű.
4) DuckDuckGo AI Chat / AI keresés
Anonimitás-barát, több AI-modellt is kínál.
5) Brave Search + Answer Engine
Saját index, AI-alapú tömör válaszok reklámmentesen.
6) You.com
Interaktív, moduláris AI-kereső, pluginekkel.
7) Baidu (Ernie Bot integráció)
Kína legnagyobb AI-alapú keresője.
Azt mondják, hogy gyorsul a világ és az idő múlása, mert a társadalmi, gazdasági és technológiai változások gyorsan követik egymást, az információáramlás pedig szinte azonnali. Az információáramlás gyorsulása az utóbbi években: a 2000-es években milyen arányban nőtt az előállított, továbbított és tárolt információ mennyisége? (AI válasz). A 2000-es években az internetforgalom évi 50–100% közötti ütemben nőtt, az évtized elején a szélessávú internet terjedése indította be a növekedést, és a 2007 utáni időszakban az okostelefonok megjelenése okozott ugrást. 2000 és 2010 között a globális adatforgalom nagyjából 40–60-szorosára nőtt.
2000–2010 között a világban tárolt digitális adatmennyiség kb. 500-szorosára nőtt, 2000-ben: ~2 exabájt., és 2010-ben: ~1200 exabájt volt.
2000–2010 között a világban tárolt digitális adatmennyiség kb. 500-szorosára nőtt, 2000-ben: ~2 exabájt., és 2010-ben: ~1200 exabájt volt.
Internetfelhasználók száma 2000-ben: ~360 millió felhasználó, 2010-ben: ~2 milliárd volt, ami kb. 5,5-szeres növekedés, ami az információcirculáció gyorsulását is jelentősen fokozta.
A 2000-es években az információáramlás éves növekedése 50–100% körüli volt, és évtizedes összegzésben:
◦ adatforgalom: 40–60x,
◦ digitális adattömeg: ~500x,
◦ felhasználók száma: ~5,5x nőtt.
A 2000-es években az információáramlás éves növekedése 50–100% körüli volt, és évtizedes összegzésben:
◦ adatforgalom: 40–60x,
◦ digitális adattömeg: ~500x,
◦ felhasználók száma: ~5,5x nőtt.
On line függőség: Ami sok az sok. Drasztikus lépésekre szánták el magukat azok az amerikai frusztrált szülők, akik belefáradtak abba, hogy már a vacsoraasztalhoz sem lehet leülni telefon nélkül. Így olyan digitális detox programba íratják be gyermekeiket,
A közösségi oldalak térhódfítása : manipulativoak..A közösségi oldalak hátrányai közé tartozik a függőség, a mentális egészség romlása (szorongás, depresszió, alacsony önbecsülés), az online zaklatás, az adatvédelmi és biztonsági kockázatok, valamint a valós társas kapcsolatok elszegényedése. A túlzott használat csökkentheti a produktivitást és időpazarláshoz vezethet, a mások által idealizált életek látványa pedig elégedetlenséget kelthet.
Mentális egészségre gyakorolt hatások
• Függőség: A közösségi média könnyen okozhat függőséget, ami elszigetelhet a valós élettől.
• Szorongás és depresszió: A túlzott használat növelheti a szorongásos zavarok és a hangulatzavarok kockázatát.
• Alacsony önbecsülés: Az idealizált, "tökéletesre" szerkesztett profilok összehasonlításhoz és elégedetlenséghez vezethetnek.
• Testképzavarok: Különösen a fiatalok körében növelheti a negatív testkép kialakulásának kockázatát.
• Alvásminőség romlása: A közösségi média túlzott használata negatívan befolyásolhatja az alvás minőségét.
Biztonsági és adatvédelmi kockázatok
• Online zaklatás (cyberbullying): Megalázó üzenetek, kommentek és képek küldése, valamint fenyegetés előfordulhat.
• Adatainkkal való visszaélés: Személyes adatok, képek és bejegyzések illetéktelen kezekbe kerülhetnek, és visszaélhetnek velük.
• Csalások és átverések: A hiszékeny felhasználókat könnyen átverhetik kamu profilok vagy csaló oldalak.
• Kártékony szoftverek terjedése: A közösségi oldalakon keresztül (például rövidített linkekkel) elterjedhetnek vírusok és más kártékony programok.
• Hosszú távú következmények: A régi, meggondolatlan posztok és fotók később hátrányt jelenthetnek a munkaerőpiacon vagy a felsőoktatásban.
Társadalmi és életmódbeli hatások
• Valós kapcsolatok romlása: Az online jelenlét elszigetelhet a valós emberi kapcsolatoktól, csökkentve azok mélységét.
• Időpazarlás és figyelemelterelés: Az értesítések és a folyamatos görgetés megzavarhatja a koncentrációt, csökkentheti a produktivitást.
• Torzult valóságérzet: A stilizált online tartalmak hamis képet adhatnak a valós életrő
Mentális egészségre gyakorolt hatások
• Függőség: A közösségi média könnyen okozhat függőséget, ami elszigetelhet a valós élettől.
• Szorongás és depresszió: A túlzott használat növelheti a szorongásos zavarok és a hangulatzavarok kockázatát.
• Alacsony önbecsülés: Az idealizált, "tökéletesre" szerkesztett profilok összehasonlításhoz és elégedetlenséghez vezethetnek.
• Testképzavarok: Különösen a fiatalok körében növelheti a negatív testkép kialakulásának kockázatát.
• Alvásminőség romlása: A közösségi média túlzott használata negatívan befolyásolhatja az alvás minőségét.
Biztonsági és adatvédelmi kockázatok
• Online zaklatás (cyberbullying): Megalázó üzenetek, kommentek és képek küldése, valamint fenyegetés előfordulhat.
• Adatainkkal való visszaélés: Személyes adatok, képek és bejegyzések illetéktelen kezekbe kerülhetnek, és visszaélhetnek velük.
• Csalások és átverések: A hiszékeny felhasználókat könnyen átverhetik kamu profilok vagy csaló oldalak.
• Kártékony szoftverek terjedése: A közösségi oldalakon keresztül (például rövidített linkekkel) elterjedhetnek vírusok és más kártékony programok.
• Hosszú távú következmények: A régi, meggondolatlan posztok és fotók később hátrányt jelenthetnek a munkaerőpiacon vagy a felsőoktatásban.
Társadalmi és életmódbeli hatások
• Valós kapcsolatok romlása: Az online jelenlét elszigetelhet a valós emberi kapcsolatoktól, csökkentve azok mélységét.
• Időpazarlás és figyelemelterelés: Az értesítések és a folyamatos görgetés megzavarhatja a koncentrációt, csökkentheti a produktivitást.
• Torzult valóságérzet: A stilizált online tartalmak hamis képet adhatnak a valós életrő
Az Európai Parlament szerdán elfogadott nem jogalkotási jelentésében európai uniós szinten egységesen 16 évben határozná meg a közösségimédia-platformok, videómegosztók és mesterséges intelligencián alapuló digitális társalkalmazások használatának alsó korhatárát.A képviselők szerint szükség van a függőséget okozó online funkciók visszaszorítására, valamint a szabályokat tartósan megszegő platformok akár teljes betiltására is. A parlament ezért erősebb védelmet sürget az olyan manipulatív digitális gyakorlatokkal szemben, amelyek növelhetik a függőség kialakulásának esélyét, és rontják a gyermekek koncentrációs képességét.
A javaslat kitér a célzott hirdetések, az influenszer marketing és más manipulatív technikák korlátozására, illetve arra, hogy a szerencsejátékszerű elemeket a jövőben ne lehessen kiskorúak számára elérhetővé tenni. A képviselők sürgetik továbbá a mesterséges intelligencia által jelentett etikai és jogi kihívások kezelését, különösen a deepfake-tartalmak, az MI-alapú virtuális társak és a nem kívánt, manipulált felvételeket készítő alkalmazások miatt.
• Technológia és automatizálás: A mesterséges intelligencia és az automatizálás felgyorsítja a gazdasági és társadalmi folyamatokat.A technológia folyamatosan felgyorsítja az életet: a kommunikáció azonnali, számtalan hírforrás, melyeket néha egyidejüleg figyelünk (multitasking9. A hirek hossza rövidül, ez is a „gyosuló idő” képzetét kelti, nem is alaptalanul. A mobilok és az internet révén a hírek és információk azonnal elterjednek világszerte. A nemzetközi gazdaság gyors átrendeződésen megy keresztül, a globális konfliktusok: A háborúk és a politikai játszmák, mint például az orosz-ukrán háború, a gazdaságra és a társadalomra gyakorolt hatásai gyorsan terjednek


