A Mesterséges Intelligencia rövid története
 
 
 
(2025 november)
 
 
AI (Artificial Intelligence, Mesterséges Intelligencia) = adatvezérelt rendszer, melyet szövegértelmező algoritmus jellemez
 
1956 volt a Dartmouth-i Konferencia, ahol a „Mesterséges intelligencia” (MI) kifejezést megalkották. 1957-ben Frank Rosenblatt kifejlesztette a Perceptront, az első mesterséges neurális hálózatot, amelyet mintázat- és képfelismerésre terveztek. A 1960-as és 1980-as évek a stagnálás és újjáéledés időszakai voltak. 1967-ben kifejlesztették a „legközelebbi szomszéd” algoritmust, amely lehetővé tette az alakfelismerést, és a hatékony útvonal elemzést (megoldva az utazó ügynök problémáját). Megszülettek az első tételbizonyító alkalmazások, pl. a Geometry Theorem Prover, mely explicit  axiómákra támaszkodva
tételeket bizonyított. 
A korai AI-programok többsége úgy dolgozott, hogy a megoldandó problémára vonatkozó alapvető tényekből kiindulva véletlen lépés sorozatokat próbálkozott a megoldás megtalálásához. 1980-as éveket a szakértői rendszerek felemelkedése jellemezte, a hangsúly a tudásalapú rendszerekre helyeződött át, amelyek kereskedelmi sikert arattak. 1980-as évek közepén a neurális hálózatok újjáéledtek a visszaterjesztési algoritmus - a kimenet hibáját visszacsatolták, elosztva- értelmezésével.
De a 1987–1993-ban eljött a második MI-tél, a finanszírozás és az érdeklődés második csökkenésének időszaka, Az adatvezérelt megközelítések 1990-es években: a gépi tanulás területe elmozdult a szimbolikus mesterséges intelligenciától a statisztikában és a valószínűségszámításban gyökerező módszerek felé, a digitális adatok mennyisége és a számítási teljesítmény növekvő elérhetősége következtében. 1997: Az IBM Deep Blue számítógépe legyőzte Garri Kaszparov sakkvilágbajnokot, ami jelentős nyilvános mérföldkőnek bizonyult, és bemutatta, hogy a gépi intelligencia felülmúlja az emberi képességeket egy összetett feladatban. Volt egy dámajátékot játszó program, melynek játékereje a versenyzői szintet is elérte. A program először kezdő szinten játszott, de sok önmagával lejátszott játszma után erős emberi versenyeken is méltó ellenfél volt.
 
A statisztikai modellek kora (1980–2010)
Rejtett Markov-modellek (HMM, 1980–1990), beszédfelismerésben és egyszerű szekvenciagenerálásban használták, már képesek voltak szöveg vagy beszéd együtt valószínűséget modellezni.
Nyelvi modellek (1990–2000), a  generálás alapja: „n” darab egymást követő szó statisztikai valószínűsége. a Google és más korai keresők is ezeket használták. A neurális hálók megjelentek (1990–2010), melyek képesek voltak hosszabb szekvenciákból is tanulni, elindítva a modern szöveggenerálás fejlődését.
 
A mélytanulás forradalmának kezdete (2006 – napjainkig)
2006: Geoffrey Hinton megalkotta a „mélytanulás” kifejezést a neurális hálózatok új, hatékonyabb architektúráinak leírására.
2011: Az IBM Watson számítógépe megnyerte a Jeopardy! című játékshow-t, bemutatva a fejlett természetes nyelvi feldolgozási képességeket.
2012: Geoffrey Hinton csapata által kifejlesztett mély neurális hálózat jelentős áttörést ért el az ImageNet számítógépes látás versenyén, amely elindította a jelenlegi mélytanulási fellendülést.
2016: A Google DeepMind AlphaGo algoritmusa legyőzte a Go világbajnokát, egy játékot, amely sokkal összetettebb, mint a sakk, és kreatív és fejlett gépi gondolkodást mutatott be.
 
A 2010-es évek végétől napjainkig: a generatív MI-modellek, például a GPT (Generative Pre-treated Transformer) sorozat megjelenése, amelyek képesek emberszerű szövegek és képek generálásáraManapság a gépi tanulás (ML) alapvető technológia, amely számtalan alkalmazásba beágyazódik, az ajánlómotoroktól az önvezető járművekig. A mélytanulási generátorok az AI aranykora 2014–2018 között. Generatív ellenséges hálók (GAN, 2014) kialakulása: Ian Goodfellow bemutatja a GAN-eket: két háló verseng egymással (generátor vs. diszkriminátor): fotorealisztikus képalkotásban, elvezetett a modern képmodellekhez. A valószínűségi generálás új szintje: képes zárt vektortérben kreatív variációkat létrehozni. A neurális szöveggenerálók első hulláma: Seq2Seq modellek (2014, Google), a fordítók, chatbotok egyik alapja.
 
Szövegértelmezés: Az értelmező (attention) mechanizmus (2014–2015): javuló hosszú távú kontextus, a Transzformer forradalom (2017– ): "Attention is All You Need” (Vaswani et al., 2017), megjelennek a Transzformer modellek, amelyek gyökeresen megváltoztatják az MI generálást, amelyek párhuzamosíthatóak, hatalmas adatmennyiségek esetén is működnek, jól bővíthetőek. Részletesen a Vaswani et al. cikk:  "Attention is All You Need” (2017,
https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf), Abstract: "A domináns szekvencia-transzdukciós modellek komplex rekurrens vagy konvolúciós neurális hálózatokon alapulnak egy kódoló-dekódoló konfigurációban. A legjobban teljesítő modellek a kódolót és a dekódolót egy értelmező mechanizmuson keresztül is összekapcsolják. Egy új, egyszerű hálózati architektúrát javaslunk, a Transformert, amely kizárólag értelmező mechanizmusokon alapul, teljesen elhagyva a rekurrenciát és a konvolúciókat. Két gépi fordítási feladaton végzett kísérletek azt mutatják, hogy ezek a modellek minőségben kiválóak, miközben jobban párhuzamosíthatók, és jelentősen kevesebb időt igényelnek a betanításukhoz. Modellünk 28,4 BLEU-t ér el a WMT 2014 angol-német fordítási feladatban, ami több mint 2 BLEU-val javítja a meglévő legjobb eredményeket, beleértve az együtteseket is. A WMT 2014 angol-francia fordítási feladatban modellünk egy új, egyetlen modellen alapuló, csúcstechnológiás 41,8-as BLEU-pontszámot ér el 3,5 napos, nyolc GPU-n történő betanítás után, ami a szakirodalomban szereplő legjobb modellek betanítási költségeinek kis töredéke. Megmutatjuk, hogy a Transformer jól általánosítható más feladatokra azáltal, hogy sikeresen alkalmazza angol nyelvű felhasználói csoport elemzésére mind nagy, mind korlátozott betanítási adatokkal".
 
Jömesterseges
 
                                                                             (https://www.securityjourney.com/ai/llm-tools-secure-coding)
 
 
A Transzformer (transformer) modellek lényege a saját értelmező mechanizmus (a self-attention) alkalmazása, amely lehetővé teszi a modell számára, hogy a szekvenciális adatokban (például mondatokban a szavak között) fennálló kapcsolatokat és a kontextust értelmezze, leírja. A megközelítés paradigmaváltást hozott a természetes nyelvi feldolgozásban (NLP). Főbb jellemzői és előnyei:
• Saját értelmező mechanizmus: lehetővé teszi, hogy a modell egy bemeneti sorozat (pl. egy mondat) minden egyes részének fontosságát mérlegelje a többi részhez viszonyítva. Például képes felismerni, hogy egy névmás a mondatban korábban említett melyik főnévre vonatkozik, még akkor is, ha távol helyezkednek el egymástól. (Előtte szó szerint fordított a gép, nyelvtani szabályokkal, de nem kapott értelmezhető szöveget,)
 Párhuzamos feldolgozás: ellentétben a korábbi, szekvenciálisan (sorban) dolgozó modellekkel (például a rekurrens neurális hálózatokkal, RNN-ekkel), a transzformerek a teljes bemenetet egyszerre, párhuzamosan tudják feldolgozni, ami jelentősen felgyorsítja a betanítási folyamatot és a futási időt.
• Hosszú távú függőségek kezelése: a párhuzamos feldolgozás és az értelmező mechanizmus révén a transzformerek hatékonyan kezelik a hosszú, összetett szövegeket, amelyek értelmezése korábban nehézséget okozott.
• Encoder-Decoder architektúra: a transzformerek gyakran egy kódoló (encoder) és egy dekódoló (decoder) részből állnak. A kódoló sűríti az információt, a dekódoló pedig felhasználja azt a kimenet generálására, mindkét részben alkalmazva az értelmező mechanizmust. 
Jelentősége, hogy a  transzformer architektúra képezi a modern mesterséges intelligencia rendszerek, köztük a nagy nyelvi modellek (LLM-ek, mint a GPT-család vagy a BERT) alapját. Alkalmazásai közé tartozik a gépi fordítás, a szöveg összefoglalás, a chatbotok, valamint a kód- és szöveggenerálás. (Részletek az NVIDIA műszaki blogjában.)
 
Vaswani et al. (2017) cikk, az értelmező fordítási módszer indította el az AI már intelligensnek nevezhető szakaszát, amely mára néhány nagy (hét) AI rendszert eredményezett. Visszatérve az AI történetéhez, a nagy nyelvi modellek (2018–2020):
• GPT (2018) – a generatív előtanított transzformer prototípusa.
• GPT-2 (2019) – már folyékony, összefüggő szöveg.
• BERT (2018) – a kontextus jobb megértése ( alapmodell).
Multimodális generatív AI-k, azaz szöveg, beszéd, kép (2020–2024)
• GPT-3 (2020) – 175B paraméter, „few-shot learning”.
• GPT-4 (2023) – multimodális (szöveg + kép).
• LLaMA, PaLM, Claude és más nyílt/kereskedelmi modellek megjelenése.
Csak képgenerátorok:
• DALL·E (2021) – szövegből kép.
• Stable Diffusion (2022) – nyílt forrású robbanás.
• Midjourney (2022–) – művészi képalkotás új stílusban.
Diffúziós modellek (2020–2023):
• Képek generálása „zajból”, visszafelé tanulva.
• Stabil, részletgazdag képek gyors fejlődése.
 
Generatív AI integrációja a mindennapokba (2024–2025)
Multimodális, ügynökszerű modellek, ahol az LLM-ek képesek:
◦ képet értelmezni,
◦ videót generálni,
◦ hangot szintetizálni,
◦ kódot írni,
◦ eszközöket működtetni (agentic AI).
◦ Az felügyelet nélküli tanulásnak (new self-learning) kialakult egy új
változata, amikor a gép kérdéseket generálva, saját magát tanítja.
 
Egyesített alapmodellek (foundation models, 2024–2025)
• Ugyanaz a modell képes szöveg, kép, hang, videó kezelésére.
• Jelentősen nő a terápiás, oktatási, ipari és kreatív alkalmazások száma.
 
Az AI-vel integrált modern keresők listája (2025)
1) Google Search + AI Overview
A legnagyobb keresőbe épített generatív összefoglaló és asszisztens funkció.
2) Microsoft Bing + Copilot
Erős generatív válaszok, képgenerálás, kontextusos keresés.
3) Perplexity AI
Gyors, forráshivatkozásos keresőasszisztens, szakmai közösségekben népszerű.
4) DuckDuckGo AI Chat / AI keresés
Anonimitás-barát, több AI-modellt is kínál.
5) Brave Search + Answer Engine
Saját index, AI-alapú tömör válaszok reklámmentesen.
6) You.com
Interaktív, moduláris AI-kereső, pluginekkel.
7) Baidu (Ernie Bot integráció)
Kína legnagyobb AI-alapú keresője.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Azt mondják, hogy gyorsul a világ és az idő múlása, mert a társadalmi, gazdasági és technológiai változások gyorsan követik egymást, az információáramlás pedig szinte azonnali. Az információáramlás gyorsulása az utóbbi években: a 2000-es években milyen arányban nőtt az előállított, továbbított és tárolt információ mennyisége? (AI válasz). A 2000-es években az internetforgalom évi 50–100% közötti ütemben nőtt, az évtized elején a szélessávú internet terjedése indította be a növekedést, és a 2007 utáni időszakban az okostelefonok megjelenése okozott ugrást. 2000 és 2010 között a globális adatforgalom nagyjából 40–60-szorosára nőtt.
2000–2010 között a világban tárolt digitális adatmennyiség kb. 500-szorosára nőtt, 2000-ben: ~2 exabájt., és 2010-ben: ~1200 exabájt volt.
Internetfelhasználók száma 2000-ben: ~360 millió felhasználó, 2010-ben: ~2 milliárd volt, ami kb. 5,5-szeres növekedés, ami az információcirculáció gyorsulását is jelentősen fokozta.
A 2000-es években az információáramlás éves növekedése 50–100% körüli volt, és évtizedes összegzésben:
◦ adatforgalom: 40–60x,
◦ digitális adattömeg: ~500x,
◦ felhasználók száma: ~5,5x nőtt.
On line függőség: Ami sok az sok. Drasztikus lépésekre szánták el magukat azok az amerikai frusztrált szülők, akik belefáradtak abba, hogy már a vacsoraasztalhoz sem lehet leülni telefon nélkül. Így olyan digitális detox programba íratják be gyermekeiket, 
 
A közösségi oldalak térhódfítása : manipulativoak..A közösségi oldalak hátrányai közé tartozik a függőség, a mentális egészség romlása (szorongás, depresszió, alacsony önbecsülés), az online zaklatás, az adatvédelmi és biztonsági kockázatok, valamint a valós társas kapcsolatok elszegényedése. A túlzott használat csökkentheti a produktivitást és időpazarláshoz vezethet, a mások által idealizált életek látványa pedig elégedetlenséget kelthet. 
Mentális egészségre gyakorolt hatások
• Függőség: A közösségi média könnyen okozhat függőséget, ami elszigetelhet a valós élettől.
• Szorongás és depresszió: A túlzott használat növelheti a szorongásos zavarok és a hangulatzavarok kockázatát.
• Alacsony önbecsülés: Az idealizált, "tökéletesre" szerkesztett profilok összehasonlításhoz és elégedetlenséghez vezethetnek.
• Testképzavarok: Különösen a fiatalok körében növelheti a negatív testkép kialakulásának kockázatát.
• Alvásminőség romlása: A közösségi média túlzott használata negatívan befolyásolhatja az alvás minőségét. 
Biztonsági és adatvédelmi kockázatok
• Online zaklatás (cyberbullying): Megalázó üzenetek, kommentek és képek küldése, valamint fenyegetés előfordulhat.
• Adatainkkal való visszaélés: Személyes adatok, képek és bejegyzések illetéktelen kezekbe kerülhetnek, és visszaélhetnek velük.
• Csalások és átverések: A hiszékeny felhasználókat könnyen átverhetik kamu profilok vagy csaló oldalak.
• Kártékony szoftverek terjedése: A közösségi oldalakon keresztül (például rövidített linkekkel) elterjedhetnek vírusok és más kártékony programok.
• Hosszú távú következmények: A régi, meggondolatlan posztok és fotók később hátrányt jelenthetnek a munkaerőpiacon vagy a felsőoktatásban. 
Társadalmi és életmódbeli hatások
• Valós kapcsolatok romlása: Az online jelenlét elszigetelhet a valós emberi kapcsolatoktól, csökkentve azok mélységét.
• Időpazarlás és figyelemelterelés: Az értesítések és a folyamatos görgetés megzavarhatja a koncentrációt, csökkentheti a produktivitást.
• Torzult valóságérzet: A stilizált online tartalmak hamis képet adhatnak a valós életrő
 
Az Európai Parlament szerdán elfogadott nem jogalkotási jelentésében európai uniós szinten egységesen 16 évben határozná meg a közösségimédia-platformok, videómegosztók és mesterséges intelligencián alapuló digitális társalkalmazások használatának alsó korhatárát.A képviselők szerint szükség van a függőséget okozó online funkciók visszaszorítására, valamint a szabályokat tartósan megszegő platformok akár teljes betiltására is. A parlament ezért erősebb védelmet sürget az olyan manipulatív digitális gyakorlatokkal szemben, amelyek növelhetik a függőség kialakulásának esélyét, és rontják a gyermekek koncentrációs képességét.
A javaslat kitér a célzott hirdetések, az influenszer marketing és más manipulatív technikák korlátozására, illetve arra, hogy a szerencsejátékszerű elemeket a jövőben ne lehessen kiskorúak számára elérhetővé tenni. A képviselők sürgetik továbbá a mesterséges intelligencia által jelentett etikai és jogi kihívások kezelését, különösen a deepfake-tartalmak, az MI-alapú virtuális társak és a nem kívánt, manipulált felvételeket készítő alkalmazások miatt.
 
• Technológia és automatizálás: A mesterséges intelligencia és az automatizálás felgyorsítja a gazdasági és társadalmi folyamatokat.A technológia folyamatosan felgyorsítja az életet: a kommunikáció azonnali, számtalan hírforrás, melyeket néha egyidejüleg figyelünk (multitasking9. A hirek hossza rövidül, ez is a „gyosuló idő” képzetét kelti, nem is alaptalanul. A mobilok és az internet révén a hírek és információk azonnal elterjednek világszerte. A nemzetközi gazdaság gyors átrendeződésen megy keresztül, a globális konfliktusok: A háborúk és a politikai játszmák, mint például az orosz-ukrán háború, a gazdaságra és a társadalomra gyakorolt hatásai gyorsan terjednek