Milyen hipotéziseket állít fel a mesterséges intelligencia?
Az MI által generált hipotézisláncok, a független események hipotézisei
(2025 október)
Az MI többségében valószínűségi állításokat, hipotéziseket generál, az adatokban található mintázatok azonosításával, és statisztikai módszerekkel teszteli a hipotéziseket. A hipotézis- láncokat is képez összetett bonyolult, tudományos rendszerek vizsgálatakor:
- Korrelációs hipotézisek: pl. „A képernyő előtt töltött idő növekedése korrelál a csökkent alvás minőségével.”
- Oksági hipotézisek*: pl. „Egy adott génmutáció rezisztenciát okoz egy gyógyszerrel szemben.”
- Prediktív hipotézisek: pl. „Az A terméket vásárló vásárlók valószínűleg a B terméket is megvásárolják.”
- Független és megengedő, kizáró események hipotézisei*: pl. a "félig tele pohár víz."
- Tudományos hipotézisek: pl. „Az X fehérje gátolja az Y útvonalat a rákos sejtekben.”
- Tagadott valószínűségi állítások, nullhipotézisek: pl. „Az A terméket vásárló vásárlók valószínűleg a B terméket nem megvásárolják meg.”
Az MI-modellek, pl. a SparkBeyond Hypothesis Engine-je, hatalmas adathalmazok és szakirodalom átvizsgálásával több millió hipotézist tudnak generálni, gyakran olyan ötleteket tárva fel, amelyeket a szakemberek figyelmen kívül hagynak.
Az MI a következő módszerek kombinációjával teszteli a hipotéziseket:
- Statisztikai elemzés: Regresszió, szórásanalízis és más technikák a kapcsolatok validálására.
- Gépi tanulási modellek: Modellek betanítása annak megállapítására, hogy az előrejelzések igazak-e az adathalmazokon keresztül.
- Szimuláció és szintetikus adatok: Virtuális kísérletek futtatása, amikor a valós tesztelés nem megvalósítható.
- Keresztvalidáció: Annak biztosítása, hogy az eredmények általánosíthatók legyenek a betanítási adatokon túl is.
Sajnos a virtuális térben, esetünkben az MI állítások, a hipotézisek manipulálhatóak, aminek van pozitív oldala is, mert a tudományos állítások igazságát, érvényességi területét gondosan ellenőrzik, bizonyítják.
Hipotézisláncok:
Néhány platform automatizálja a folyamatot, a hipotéziseket rangsorolja, hogy mennyire támasztják alá a hipotéziseket az adatok, és azonosítja, hogy milyen típusú adatok cáfolhatják meg őket. Az MI valódi hipotézisláncokat is képez, ami kezd érdekessé válni. A MI képes hipotéziseket összekapcsolni logikai szekvenciák létrehozásához, például:
A hipotézis: „Az X gén hatással van az Y fehérjére.”
B hipotézis: „Az Y fehérje befolyásolja a sejtek növekedését.”
C hipotézis: „A sejtnövekedés hatással van a tumorképződésre.”
D hipotézis: „Az A és B események függetlenek"*.
A láncok segítenek feltárni az ok-okozati utakat, a többlépcsős érvelést vagy a rendszerszintű dinamikát. A tudományos felfedezésekben a láncok utánozzák a kutatók elméletalkotási módszerét, az MI gyorsabban és gyakran szélesebb hatókörrel végzi a kutatást.
Korlátok és kihívások
A mesterséges intelligencia által generált hipotézisek redundánsak vagy triviálisak lehetnek, ha túlságosan a meglévő szakirodalomra épülnek. A komplex vagy új hipotézisek tesztelése emberi értelmezést, kísérleti tervezést vagy etikai felügyeletet igényel. A hipotézisláncok törékennyé válhatnak, ha a kezdő hipotézisek gyengék vagy nincsenek ellenőrizve.
Pl. közgazdaságtanban az MI képes hipotéziseket generálni a piaci viselkedésről, a politikai hatásokról, a fogyasztói trendekről és a makrogazdasági dinamikáról, majd ezeket szimulációk, ökonometriai modellek és valós adatok segítségével tesztelni. Hipotézisláncokat épít az összetett ok-okozati összefüggések feltárására. A hipotézisgenerálás a közgazdaságtanban: az MI eszközei – különösen a nagy nyelvi modellek (LLM-ek) – hatalmas adathalmazokat, tudományos cikkeket és politikai dokumentumokat képesek átvizsgálni, hogy olyan hipotéziseket javasoljanak, mint:
- Viselkedési közgazdaságtan: „A célzott hirdetéseknek kitett fogyasztók nagyobb valószínűséggel halasztják el a vásárlásokat.”
- Makroökonómia: „A kamatemelések hatékonyabban csökkentik az inflációt, ha a fogyasztói adósság magas.”
- Fejlődés-gazdaságtan: „A mobilbanki hozzáférés növeli a női vállalkozói tevékenységet a vidéki területeken.”
Ezek a hipotézisek gyakran idősor adatok mintázatfelismeréséből, az országok közötti összehasonlításokból, vagy gazdasági jelentések hangulatelemzéséből fakadnak.
Hogyan teszteli a mesterséges intelligencia a gazdasági hipotéziseket?
A mesterséges intelligencia a következő módszerekkel tesztelheti ezeket az ötleteket:
- Ökonometriai modellezés: Regresszió, paneladat-elemzés és ok-okozati következtetési technikák.
- Ágensalapú szimulációk: Egyéni szereplők (fogyasztók, vállalatok, kormányok) modellezése a kialakuló viselkedés megfigyelése érdekében.
- Szintetikus kontrollmódszerek: A kezelt és a kontrollcsoportok összehasonlítása időben és földrajzi elhelyezkedésben.
- Természetes nyelvi feldolgozás (NLP): Politikai dokumentumok, hírek és közösségi média elemzése a gazdasági hangulat felmérésére.
Például a mesterséges intelligencia szimulálhatja, hogy a szén-dioxid-adó hogyan befolyásolja a különböző jövedelmi csoportokat, vagy az NLP segítségével nyomon követheti az inflációs várakozásokat a központi banki beszédek alapján.
A szimuláció néha félrevezető: Például egy nem létező malajziai tévéadó mesterséges intelligenciával készített videóriportjában arról beszél a nem létező riporternő, hogy megnyitott a „Kuak Skyride” libegő. "A jegyet váltó turisták nem csak meseszép látványon ámulhatnak, de szintén a természetre néző, luxus étkezési élményben részesülhetnek, és még őzeket is simogathatnak." A videó annyira meggyőző volt, hogy turisták jelentek meg a nemlétező látványosságnál.
Nem létező malajziai tévéadó MI-vel készített nem létező riporternője
Hipotézisek láncolása a közgazdaságtanban:
A mesterséges intelligencia többlépcsős hipotézisláncokat építhet fel összetett rendszerek feltárására, pl.:
„A távmunka növeli a városból vidékre irányuló migrációt.”
„A migráció csökkenti a városi lakások iránti keresletet.”
„Az alacsonyabb kereslet stabilizálja a városi bérleti díjakat.”
Ami segít a közgazdászoknak modellezni a politikai változások vagy a technológiai változások hullámhatásait. Az LLM-ek akár kutatókkal is együttműködhetnek ezen láncok interaktív finomítása érdekében.
Példa alkalmazások
- Törvények, rendeletek szimulációja: A kormányok mesterséges intelligenciát használnak annak tesztelésére, hogy az adóreformok vagy támogatások hogyan befolyásolhatják az egyenlőtlenséget vagy a növekedést.
- Piaci előrejelzés: A mesterséges intelligencia a makromutatók láncolása révén előrejelzi az eszközbuborékokat vagy a recesszió kockázatait.
- Munkagazdaságtan: A mesterséges intelligencia azt vizsgálja, hogy az automatizálás hogyan befolyásolja a bérdinamikát az ágazatokban.
*Függetlenség (nehéz fogalom!):
A statisztikai függetlenség és a kauzális függetlenség két különböző dolog. A statisztikai függetlenség valószínűségi mértékek és események absztrakt tulajdonsága, ami szimmetrikus, (https://hu.wikipedia.org/wiki/F%C3%BCggetlen_esem%C3%A9nyek), és ami nem teljesül az oksági függetlenségre. Statisztikai vizsgálatoknál két esemény együttes valószínűsége, P(AB) nem adott. Hipotézisvizsgálatot a χ²-próbával lehet elvégezni.
Az események függetlensége általánosítható halmazrendszerek függetlenségére, ami valószínűségi változókra is kiterjeszthető. Feltételes várható érték használatával mindezek feltételes függetlensége is definiálható. Az események függetlensége szimmetrikus tulajdonság. Beszélhetünk A és B események függetlenségéről. A függetlenség nem azonos a diszjunktsággal, a diszjunkt események csak akkor függetlenek, ha egyikük valószínűsége 0 vagy 1.
Függetlenség és hatás-függőség
Dobjunk két kockával, legyen az
esemény, hogy az első kocka páros számot mutat, a
esemény, hogy a dobott számok összege páros! Ekkor
és P(AB) = 1/4, a két esemény független, de
függ
-tól, mivel az első kockával kidobott szám hozzájárul az összeghez.
Függetlenség, mint hatás-függetlenség
Dobjunk két kockával, legyen az
esemény, hogy az első kockával 6-ot dobunk, a
esemény, hogy a második kockával 6-ot dobunk! Ekkor
és P(AB) = P(A) P(B) = 1/36, a két esemény független, és hatás- függetlenek, és az is igaz, hogy P(A) = 
Összefüggés és hatás-függés
Dobjunk egy érmével kétszer, legyen az
esemény, hogy mindkétszer fejet dobunk, a
esemény, hogy az első dobás írás! Ekkor
és
, viszont P(AB) = 0. Az események diszjunktak, összefüggőek és hatás-függőek.
A korreláció méri két tetszőleges érték közötti lineáris kapcsolat erősségét. A korrelálatlanság nem feltétlenül jelent függetlenséget, de bizonyos, hogy nincs az értékek között lineáris összefüggés. Ha két véletlen mennyiség korrelációja nulla, amikor korrelálatlanok, és a kapcsolatot feltételes valószínűségekkel írjuk le.
A normális eloszlású valószínűségi változókra jellemző, hogy ha korrelálatlanok, akkor függetlenek is. A zérus várható értékű egyenletes eloszlású valószínűségi változók szórásai (és terjedelmei) tetszőleges értékűek lehetnek, azaz függetlenek, ha a terjedelmek szimmetrikusak az origóra. A korreláció függvény alkalmas a fehér vagy normális eloszlású forrás zajú -melyek a folyamatokat generáló zajok- folyamatok változói közötti lineáris kapcsolat erősségének elemzésére, ezek az ARMA modellek, más alakban az állapotteres folyamatmodellek.
A feltételes várható értéket a valószínűségszámításban (https://en.wikipedia.org/wiki/Conditional_expectation) a feltételes valószínűség definiálására is használják. A feltételes várható érték lehet valószínűségi változó vagy függvény, amelyet feltételes valószínűségi eloszlás segítségével számítanak, vagy a folyamat jövőjéből képzett vektorának a folyamat múltjára történő vetítésével, pl. a realizációelméletben, és a káoszelméletben zérus, esetleg konstans. Ha a valószínűségi változó csak véges számú értéket vehet fel, akkor a "feltétel" az, hogy a változó ezeknek az értékeknek csak egy részhalmazát veheti fel. Formálisan, abban az esetben, ha a valószínűségi változó egy diszkrét valószínűségi téren lett definiálva, a "feltételek" ennek a valószínűségi térnek a partíciói. A Kálmán-szűrőnél, az ARMA prediktornál, amelyek feltételes várhatóértékeket számítanak: a jelekről feltesszük, hogy zérus várható értékűek, és bizonyítható, hogy amennyiben a zajok független normális, azaz fehér Gauss-folyamatok, illetve fehér zajok, azaz független egyenletes eloszlású zajfolyamatok, akkor Kálmán-szűrő, az ARMA prediktor becslései optimális legkisebb négyzetes LSQ) becslések, és az LSQ, MLH és Bayes becslések egybeesnek. Egyenletes eloszlásnál zérus várható érték esetén a szórásnégyzet (és az origóra szimmetrikus terjedelem) tetszőleges értékű lehet.
Függetlenség halmazokon: az elemi események halmaza páronként független, ha két esemény együttes bekövetkezésének valószínűsége a két esemény valószínűségeinek szorzata, vagy egy másik meghatározás szerint: egy esemény feltételes valószínűsége az esemény valószínűségével egyenlő. A páronkénti függetlenség általánosabb feltétel mint egy halmaz elemeinek a függetlensége.
A nem együttesen bekövetkező, egymás utáni események sorozatot alkotnak.
A sorozatokban az elemi események ismétlődnek, ekkor a függetlenség definíciója: ha egy esemény (vagy elemek) bekövetkezése csak a legutolsó eseménytől, elemtől függ, és az előzőektől független, akkor sorozat Markov folyamat. Ha egy esemény (vagy elem) bekövetkezése nem függ sem a múltjától, sem a jelenétől, akkor az örökifjú folyamat, amely nem megjósolható, memória nélküli kaotikus folyamat, és exponenciális vagy geometriai eloszlású (memorylessnessang,
Azaz: a kaotikus, megjósolhatatlan rendszerek esetén a rendszerleírásra használt eloszlások a normális, az egyenletes, a geometriai és az exponenciális eloszlások, továbbá az ezekből származtatott eloszlások, folyamatok. Mert normális eloszlásnál a várható érték és a szórásnégyzet független mennyiségek, az egyenletes eloszlásnál, ha zérus a várható érték, a szórás és a terjedelem értéke tetszőleges lehet. A geometriai és az exponenciális örökifjú, memória nélküli tulajdonságúak, azaz a folyamat jövője független a folyamat jelenétől és a múltjától.
A Markov folyamatoknál csak a folyamat jelenétől függ a folyamat jövője. A Markov-folyamat kifejezés egy sztochasztikus folyamat részleges emlékezet nélküli tulajdonságára utal, ami azt jelenti, hogy a jövője független a korábbi történetétől, csak a jelenétől függ. Nevét Andrej Markov orosz matematikusról kapta. Az erős Markov-tulajdonságnál a „jelen” jelentését egy leállási időként ismert valószínűségi változóval határozzuk meg. A Markov féle véletlen mező kiterjeszti a tulajdonságot két vagy több dimenzióra. A Markov-lánc egy olyan diszkrét sztochasztikus folyamat, melynél adott jelenbeli állapot mellett a rendszer jövőbeni állapota nem függ a múltbeli állapotoktól. Azt is jelenti, hogy a jelen állapot leírása teljesen magába foglalja az összes olyan információt, ami befolyásolhatja a folyamat jövőbeli helyzetét. A rendszer korábbi állapotai a későbbi állapotokra csak a jelen állapoton keresztül gyakorolhatnak befolyást, adott jelen mellett a jövő feltételesen független a múlttól. A. Markov rájött arra, hogy a folyamatok függetlensége általánosabb fogalom, mint az események függetlensége az idő szerepe miatt, ezért a legáltalánosabb függetlenség fogalom az örökifjú folyamatok függetlensége(memorylessnessang,
https://en.wikipedia.org/wiki/Memorylessness) a függetlenség miatt, továbbá a Markov féle egy lépéses függés. Az ok-okozati kapcsolat, a kauzalitás állítása, nem azonos az egy valószínűségű állításokkal. Mert az egy valószínűségű állítás nem biztos állítás, ahogy a 0 valószínűségű esemény sem lehetetlen esemény, ezért a klaszikus, kauzális világunk, nem határesete a valószínűségszámításnak.
A megengedő vagy kapcsolat (diszjunkció) akkor igaz, ha az A és B állítások közül legalább az egyik igaz. A kizáró vagy (antivalencia) akkor igaz, ha az állítások közül csak az egyik igaz, a kettő együtt nem lehet igaz.
A megengedő vagy kapcsolat (diszjunkció) logikai művelet azt jelenti, hogy a két állítás közül legalább az egyiknek igaznak kell lennie ahhoz, hogy az összetett állítás igaz legyen. Az állítások lehetnek függetlenek. Példa: "Tegnap esett az eső vagy fagy volt." Ez az állítás akkor is igaz, ha csak esett, ha csak fagy volt, és akkor is, ha egyszerre mindkettő volt.
Kizáró vagy kapcsolat (antivalencia) logikai művelet: azt jelenti, hogy az összetett állítás csak akkor igaz, ha a két állítás közül kizárólag az egyik igaz, a kettő együtt nem. Az állítások nem függetlenek, kizárják egymást antivalens esetben (a kizárt harmadik problémája). Példa: "Most vagy kerékpározom, vagy úszom." Ez az állítás nem igaz, ha egyszerre csinálná mind a kettőt, és egy harmadik sportot nem csinál.