A mesterséges intelligencia
 
 
következő generációja
 
 
 
 
 (2025 október)
   
 
 
 
Sam Altman, az OpenAI vezérigazgatója beszélt a készülő GPT-5 modellről: https://www.pcwplus.hu/pcwlite/a-mesterseges-intelligencia-kovetkezo-generacioja-felelmetes-lehetosegeket-rejt-sajat-alkotoja-szerint-is-369219.html. A beszélgetés során nemcsak a technológiai előrelépésekről esett szó, hanem arról is, hogy a fejlesztés során saját maga is meglepődött a mesterséges intelligencia képességeit látva. A GPT-5 gyorsabb, okosabb és intuitívabb lesz, mint elődei, de Altman szavai alapján ez nemcsak fejlődést, hanem bizonytalanságot is jelent. Ugyanakkor a mesterséges intelligencia fejlesztésének egyik legfontosabb szempontja éppen a kiszámíthatóság. Altman több interjúban is beszélt arról, hogy az AI "elromolhat" -ld. Murphy törvénye-, és hogy a felelősségteljes fejlesztés kiemelt fontosságú. Ugyanakkor a GPT-5 kapcsán tett kijelentései azt a benyomást keltik, mintha maga a cég is csak félig-meddig tudná, mit is hoz létre valójában az MI? Feltehetően beszédértő és valós idöben emberi módon kommunikáló MI-t fejlesztenek.
Megj.: Az automatizálás eredményei az MI -vel összefonódva jelennek meg: az adatgeneráló MI jövőjét könnyebb megjósolni, mint az automatizálás jövőjét. Az összefonódás következtében lehet az MI tőzsdei buborék, ha nem fejlesztik tovább!
  
 
Jömesterseges
 
                                                                             (https://www.securityjourney.com/ai/llm-tools-secure-coding)
MI trendek:
Kisebb, de még hatékony modellek: a végtelen skálázás helyett, (https://hu.wikipedia.org/wiki/Sk%C3%A1l%C3%A1zhat%C3%B3s%C3%A1g. Kitérő: Magyarországon rövid távon a felhőalapú, külső megoldások járhatóak, a meglévő magyar szervertermek mindössze 43%-a skálázható, 38%-a alkalmas nagy teljesítményű szerverek befogadására. A hibrid modell jelenti a jövőt: a vállalatok külső megoldásokra építenek, pl. a  németországi Jülich Szuperszámítógépre, és hozzáadnak saját fejlesztéseket), és a memórianövelés helyett a fejlesztők  olyan kisebb modellekre összpontosítanak, amelyek elegendően nagy teljesítményt nyújtanak alacsonyabb számítási költségek mellett, és könnyebben telepíthetőek az eszközök és iparágak között.
MI-ágensek és interakciók: olyan MI-ágensek, interaktív rendszerek, amelyek képesek feladatokat elvégezni, értelmezni és alkalmazkodni a felhasználói igényekhez. A Claude AI például a természetes beszélgetést, az etikus válaszokat és a szövegkörnyezettel összefüggő, asszociatív memóriát, válaszokat célozza meg. (Mit csinálhatna jósnőként?***)
Generatív virtuális világok: A generált képek és videók felfutását követően a következő terület a generatív virtuális környezetek lesznek. Az olyan eszközök, mint a Google DeepMind Genie 2-je, egyetlen képet lejátszható videóvá alakít, utalva a jövőbeli játékok, oktatás és szimulációk alkalmazási lehetőségeire.
Multimodális intelligencia: Az MI- úgy fejlesztik, hogy egyszerre dolgozzon fel szöveget, képeket, hangot és videót, lehetővé téve a jobb megértést és interakciót, ami támogatja az alkalmazásokat a robotikától a személyre szabott orvoslásig.
Etikus és megbízható MI: A biztonság, a méltányosság és az átláthatóság kiemelt prioritások. Az olyan új szabályozások, mint az EU MI-törvénye, a felelősségteljes fejlesztést és telepítést célozzák. Az Mi aktív -bevatkozószerveket vezérlő- döntéseit korlátozzák.
 
Az alkalmazások továbbfejlesztése*: (Az alkalmazások az extenzív szakaszból az intenzív szakaszba jutnak.)
Egészségügy: A MI átalakítja a diagnosztikát és a személyre szabott orvoslást, a mély-tanulási modellek előrejelzik a rák terjedését és javítják a radiográfiai elemzést.
Oktatás és munkaerő: Az olyan egyetemek, mint a New Haven, MI-központú képzéseket indítanak, amelyek ötvözik a műszaki ismereteket az etikus tervezéssel, felkészítve a MI-mérnökök következő hullámát.
Hardver: Az Intel PowerVia és Panther Lake chipjei a MI működtetésének radikális újratervezését jelentik – a processzorokat hatékonyabbá és együttműködőbbé teszik a CPU, a GPU és az NPU között.
Üzlet és reklám: Az olyan vállalatok is, mint az Alphabet és a Meta, integrálják a MI-t a keresésbe, a hirdetésekbe és a felhasználói elköteleződésbe, egyedi chipeket és ajánlómotorokat használva a növekedés ösztönzésére.
Felügyelet nélküli, önfelügyelt tanulás**: A mesterséges intelligencia a valós interakciókból tanul, nem csak a címkézett válaszokat is tartalmazó adatokból, adathalmazokból készít statisztikákat, így adaptívabbá és autonómabbá válik.
Modellek: modellek érzékszervi bemenetek és interakciók révén tanulnak: a beszédfelismerés használata általános lesz.
A mesterséges intelligencia, mint együttműködő partner: A mesterséges intelligencia várhatóan eszközből csapattárssá fejlődik – együtt alkot, együtt dönt, utánozva és együtt tanul az emberekkel különböző területeken. 
kep
 
 
 
Oktatás megsegítése 
A mesterséges intelligencia lehetővé teszi a személyre szabott tanulást, átalakítja a tanári szerepeket, és átalakítja a tudás létrehozásának és elérésének módját (MI válasz).
Adaptív platformok: A mesterséges intelligencia által vezérelt eszközök, mint például a Khan Academy és a Duolingo, az órákat az egyes diákok tempójához és stílusához igazítják, valós idejű visszajelzést és személyre szabott kihívásokat kínálva.
Egyéni támogatás: A korlátozott oktatási erőforrásokkal rendelkező régiókban a csevegésalapú mesterséges intelligencia által támogatott oktatók biztosítják a tanulók számára az egyénre szabott oktatás élményét.
Adatvezérelt betekintés: A mesterséges intelligencia elemzi a diákok viselkedését az erősségek, gyengeségek és tanulási hiányosságok felismerése érdekében, segítve az oktatókat a hatékonyabb beavatkozásban. A mesterséges intelligencia olyan rutinfeladatokat kezel, mint az osztályozás és a tanórai tervezés, így a tanárok a kreativitásra és az érzelmi támogatásra koncentrálhatnak. A generatív MI képes kvízeket, összefoglalókat és akár teljes tanterveket is készíteni, lehetővé téve az oktatók számára, hogy méretezzék erőfeszítéseiket és személyre szabják az anyagokat. Új tantervi modellek: A diákok kevesebb évet tölthetnek mechanikus tanulással, és több időt az ötletek felfedezésével, a problémák megoldásával és a MI-rendszerek együttműködő irányításával.
Értékelés és visszajelzés: A MI-rendszerek azonnali visszajelzést adnak az írásról, a kódolásról és a problémamegoldásról, segítve, értékelve a diákok és a tanárok teljesítményeit. 
Nyelv és akadálymentesítés: A MI-eszközök lefordítják a tartalmat, hang-, és kép-, vdeóanyagokat generálnak, és adaptálják az anyagokat a fogyatékkal élő tanulók számára is.
 
 
*
Az MI főbb alkalmazási területei ma (2025) az egészségügytől a pénzügyeken át az ipari automatizálásig terjednek, és sok szektorban válik nélkülözhetetlenné. A legfontosabb területek, ahol az MI technológiák már most is jelentős szerepet játszanak: pénzügyi modellezésben a kockázatanalizis,  befektetési portfoliók optimalizálása, új gyógyszerek fejlesztése, a logisztikában jobb útvonaltervezés, hatékonyabb ellátási láncok kiépítése. (MI válasz):
 
Egészségügy
Diagnosztika és képalkotás: MI segít a betegségek korai felismerésében, például rákos elváltozások azonosításában CT vagy MRI képeken.
Gyógyszerkutatás: új molekulák felfedezése és klinikai vizsgálatok optimalizálása. Személyre szabott kezelések: genetikai adatok alapján javasolt terápiák. Pl.: Szingapúrban a nemzeti egészségügyi technológiai ügynökség, a Synapxe, 2025 júliusában együttműködési megállapodást kötött az OpenAI-jal – a ChatGPT fejlesztőjével – egy többügynökös mesterséges intelligencia- prototípus tesztelésére. Az új rendszer célja, hogy képes legyen kezelni a mindennapi egészségügyi interakciókat, például időpontfoglalásokat, betegkérdéseket és adminisztratív folyamatokat, ezáltal csökkentve az egészségügyi dolgozók terheit.
Pénzügy
Csalásfelderítés: tranzakciós minták elemzése a gyanús tevékenységek kiszűrésére.
Kockázatelemzés és portfóliókezelés: MI modellek segítenek a befektetési döntésekben.
Automatizált ügyfélszolgálat: chatbotok és digitális asszisztensek.
Közlekedés és járműipar
Önvezető járművek: MI vezérli az érzékelőket, navigációt és döntéshozatalt. Budapesten megjelennek az önvezető villamosok és autóbuszok.
Forgalomoptimalizálás: városi közlekedési rendszerek hatékonyabbá tétele.
Ipar és gyártás
Minőségellenőrzés: képfeldolgozással hibák felismerése a gyártósoron.
Karbantartás előrejelzése: gépek állapotának monitorozása és hiba megelőzése.
Robotika: intelligens robotok az összeszerelésben és logisztikában.
Az aszálykezelést segítő, vagy az állatjárványokat előrejelző alkalmazások. A precíziós agrárgazdálkodás ma már elképzelhetetlen MI nélkül.
Kereskedelem és marketing
Ajánlórendszerek: személyre szabott termékajánlások (pl. Netflix, Amazon).
Vásárlói viselkedés elemzése: trendek és preferenciák feltérképezése.
Dinamikus árképzés: MI elemzi a keresletet és versenytársakat.
Játékfejlesztés
Adaptív játékok: MI alkalmazkodik a játékos viselkedéséhez.
NPC-k intelligens viselkedése: valósághűbb interakciók és döntések.
Energiaipar
Fogyasztás optimalizálása: intelligens hálózatok és energiatárolás.
Megújuló energiaforrások kezelése: termelés előrejelzése és elosztása.
Nyelvfeldolgozás és kommunikáció
Fordítóprogramok és beszédfelismerés: gépek képesek megérteni és lefordítani emberi nyelvet.
Chatbotok és virtuális asszisztensek: ügyfélszolgálat, információszolgáltatás.
 
**
A felügyelet, megerősítés nélküli tanulás jövője az utánzás?
A megerősítés nélküli tanulás jövője nagymértékben támaszkodik az utánzásra(!) , az önfejlesztő rendszerekre és a személyre szabott interaktív eszközökre – de jelentős korlátokkal néz szembe az alkalmazkodóképesség és a célvezérelt intelligencia terén. A megerősítés nélküli tanulás vizsgálata meglepő utánzás alkalmazásokat tár fel az oktatás területén. A megerősítéses tanulás (Reinforced Learning) azért fontos, mert képes utánozni, hogyan tanulnak az emberek és az állatok próbálgatás, hiba és visszajelzés útján. Enélkül az alternatív modelleknek utánzásra, predikcióra vagy öngenerált feladatokra kéne csak támaszkodniuk – mindegyikre eltérő kompromisszumokkal.
A megerősítés nélküli tanulás trendjei:
Utánzásos tanulás és inverz RL: Az olyan technikák, mint az inverz megerősítéses tanulás (IRL), a viselkedések szakértők megfigyelésével történő elsajátítását célozzák, megkerülve az explicit jutalmazás szükségességét. A legújabb kutatások azt mutatják, hogy az IRL hatékonyabbá tehető a szakértői állapoteloszlások kihasználásával, csökkentve a teljes RL ciklusok szükségességét.
Nagy nyelvi modellek (LLM-ek): E modellek a sorozat következő szavának előrejelzésével tanulnak, nagy adathalmazokon. Bár hatékonyak, hiányzik belőlük a célszerű viselkedés. A mesterséges intelligencia kritikusai szerint az LLM-ek passzív utánzók, nem igazi tanulók – nem befolyásolják az eredményeket, és nem törekszenek célokra.
Önfejlődő rendszerek: Az Abszolút Zéró Érvelő (AZR) egy radikális megközelítést vezet be: külső adatok vagy emberi beavatkozás nélküli tanulást. Saját feladatokat generál és old meg, önállóan fejlődve. Bár továbbra is az RL (megerősítéses tanulás ellenőrizhető jutalmakkal) egy formáját használja, minimalizálja az emberi részvételt, az önirányított tanulás felé halad.
Párbeszédrendszerek minimális RL-lel: Az Oszakai Egyetem kutatói olyan párbeszédrendszereket fejlesztettek ki, amelyek minimális megerősítéssel beszélgetésen keresztül tanulnak új szavakat. A kérdések feltevésének optimalizálásával ezek a rendszerek csökkentik a felhasználók bizonytalanságait, miközben új szókincset sajátítanak el.
 
Kihívások megerősítés nélkül
Az Igazság (azaz jutalom) hiánya: Jutalmak vagy célok nélkül a rendszerek nehezen tudják meghatározni, mi a „helyes”. Az egyértelmű cél nélkül a tanulás önkényessé válik – nincs ok arra, hogy az egyik cselekvést vagy választ a másikkal szemben előnyben részesítse a gép.
Korlátozott alkalmazkodóképesség: A felügyelt és felügyelet nélküli tanulási módszerek gyakran sikertelenek a dinamikus környezetekben. Kurátált adatokat igényelnek, és nehezen boldogulnak új helyzetekkel, ellentétben az interakción keresztül alkalmazkodó valós idejű tanulási ágensekkel.
Skálázhatósági problémák: Míg az utánzáson és az előrejelzésen alapuló modellek jól skálázódnak adatokkal, de korlátokba ütköznek, amikor kevés adat áll rendelkezésre, vagy amikor a feladatok kutatást és döntéshozatalt igényelnek.
 
Jövőbeli lehetőségek
Hibrid modellek: Az utánzás, az önfelügyelet és a minimális megerősítés kombinálása hatékonyabb, skálázhatóbb tanulási rendszereket eredményezhet.
Személyre szabott tanulási ágensek: Az interakción keresztül tanuló rendszerek – mint például a háztartási szlenghez alkalmazkodó párbeszédes ágensek – megbízható társakká válhatnak, még korlátozott valós idejű tanulással is.
Etikai biztosítékok: Ahogy az önmagát fejlesztő mesterséges intelligencia növekszik, a felelős telepítés és monitorozás biztosítása kritikus fontosságúvá válik.
Fontos, hogy bár a megerősítés nélküli tanulás lehetséges és fejlődik, soha nem helyettesíti teljesen a valós idejű tanulás által biztosított alkalmazkodóképességet és célorientáltságot. A jövő valószínűleg a hatékonyság, az autonómia és az intelligencia (megerősítés) egyensúlyát biztosító megközelítések ötvözésében rejlik.
 
***

Hogy válna be jósnőként az MI ? (MI válasz)

A mesterséges intelligencia persze nem jósnő, de jól teljesít mint jövőkutató eszköz, ha megfelelőek a bemenő adatai. Bár nem lát a jövőbe, képes trendeket,  előrejelzéseket készíteni és valószínűségeket számítani,  ami sokszor pontosabb, mint az emberi intuíció.

MI mint jósnő: mit tud és mit nem?

Amit jól csinál:

  • Adatalapú előrejelzések: Az MI képes hatalmas mennyiségű adatot elemezni, és ezek alapján előre jelezni gazdasági, technológiai vagy társadalmi trendeket.
  • Valószínűségi modellek számítása: Nem jósol, hanem statisztikai valószínűségeket számol. Például megmondhatja, hogy egy adott technológia milyen eséllyel terjed el 5 éven belül.
  • Jövő-forgatókönyvek generálása: A fejlettebb MI-k, mint az AGI lesz (általános mesterséges intelligencia), képesek lesznek  jövőképeket alkotni, több változatban is.

Amit nem tud:

  • Nem látja a jövőt: Nincs ember feletti képessége, nem tudja megmondani, ki nyeri a lottót vagy mikor jön el a világvége...
  • Nem érti az emberi sorsot. lelket: Nem tudja értelmezni az álmokat vagy horoszkópot úgy, mint egy jósnő.
  • Nem helyettesíti az intuíciót vagy a bölcsességet: Az MI nem rendelkezik érzelmekkel, megérzésekkel vagy emberi tapasztalattal.

Milyen területeken tud „jósolni” az MI?

Terület

MI képességei „jóslásra”

Megbízhatóság

Gazdaság

Piaci trendek, infláció, munkaerőpiac előrejelzése

 Magas

Egészségügy

Betegségmegelőzés, gyógyszerkutatás

Magas, de nem tévedhetetlen

Technológia

Új eszközök, innovációk megjelenése

Magas-közepes

Időjárás

Rövid távú előrejelzések

 Pontos

Emberi kapcsolatok

Korlátozott (pl. párkapcsolati tanácsok)

Alacsony

MI vs. klasszikus jósnő

Tulajdonság

Mesterséges intelligencia

Hagyományos jósnő

Módszer

Adatalapú elemzés

Intuíció, szimbólumok

Pontosság

Mérhető, statisztikai

Szubjektív, változó

Spirituális dimenzió

Nincs

Van (pl. tarot, asztrológia)

 
 
 
****
Beszéd generálás az MI segítségével (https://chaosbot.tizennegy.hu/kaoszpedia/mi-beszed/) 
A mesterséges intelligencia (MI) képes arra, hogy bármelyikünk hangját „utánozza”, és ezt a hangot használva szövegeket mondjon el, akár egy másik nyelven is (angolul Voice Cloning). Ez a technológia az utóbbi években vált igazán fejletté, lehetővé téve, hogy személyes hangunkat digitális asszisztensek, audiokönyvek felolvasására, vagy akár videojátékokban szereplő karakterek számára használjuk fel. Az első és talán legfontosabb lépés a folyamatban a hangfelvételek gyűjtése. Itt különféle mondatokat, szavakat, és hangokat rögzítünk, amelyek segítenek a gépnek megérteni, milyen egyedi jellemzőkkel rendelkezik egy adott személy hangja. A gép nemcsak a hang jellemzőit tanulja meg, hanem a nyelvet vagy nyelveket is, amelyeken a felvételek készültek. Ez magában foglalja a szavak, nyelvtani szabályok és kifejezések megértését. Miután a mesterséges intelligencia elemeire bontotta és megértette a hangot, képes újraalkotni azt, lehetővé téve, hogy bármilyen szöveget elmondjon ebben a hangban. Érdekes módon ez lehetővé teszi a technológiát arra is, hogy más nyelveken is „beszéljen”, amennyiben rendelkezik elegendő információval a nyelv szabályairól.
Hangfelvétel: szinkronizálás filmekben, televíziós műsorokban vagy videójátékokban, ahol az eredeti hangot lecserélik egy másik nyelvű vagy hangú színész felvételére. Ez különösen hasznos a többnyelvű tartalom terjesztésekor, lehetővé téve a tartalom adaptálását különböző piacokra anélkül, hogy az eredeti előadást újra kellene produkálni.
 
Első lépés: Hangfelvételek gyűjtése.
Második lépés: Akusztikus modellezés.
Harmadik lépés: Nyelvi modellezés.
Negyedik lépés: Hangszintézis.
Ötödik lépés: Finomhangolás.

Voice Cloning programok
Emberi hangból készített Mesterséges Intelligencia hangok
Text-to-Speech (TTS)
Text-to-Speech vagy Text-to-Voice programok
Voice Dubbing
Voice Dubbing programok
Voice Conversion
Voice Conversion programok
Speech-to-Speech Translation:
Speech-to-Speech Translation programok
Emberi hangból énekhangot készítő MI programok (Revocalizer vagy Singing Voice Synthesis)
Revocalizer programok
Szintetikus hangok
Mi történik a Synthetic Voice Generation során?
Az előnyök és kihívások
Technikák
Mesterséges beszéd hangok
Mesterséges beszéd hang generáló programok
Mesterséges ének
Mesterséges éneket generáló programok
Videóból írott szöveg (video-to-text)