Fedezhet-e fel új módszereket a mesterséges intelligencia?
Az ELTE TTK Fizikai Intézetének kutatói tanulmányukban a mesterséges neuronhálózatok módszerével vizsgálták a gravitációs lencsézést ábrázoló térképeket.
A mesterséges intelligencia modern módszerei a mindennapi élet és a tudomány számos területét forradalmasítják – talán már túl sok tanulmány is jelenik meg „Deep learning ...” címmel. Az ELTE TTK Fizika Intézetének kutatói, a Nature Astronomy folyóiratban közölt tanulmányukban nem csupán használják ezt a technikát, hanem egy olyan módszert mutatnak be, amit egy mesterséges neuronhálózattól „lestek el”, és amelyik minden eddiginél jobban képes kozmológiai paramétereket becsülni gravitációs lencsézést ábrázoló térképekből.
A modern asztrofizikának egyik legnagyobb kihívása a sötét anyag és sötét energia természetének megértése. A rejtély megfejtésére számos nagyszabású kozmológiai felmérés indult, amelyek nagy komplex adathalmazokat eredményeznek. Ilyen volt például a Sloan Digital Sky Survey, amelyben évek óta fontos szerepet játszanak ELTE-s kutatók is: a projekt galaxisok millióit észlelve megalkotta az univerzum háromdimenziós térképét.
Jelenlegi tudásunk szerint a világegyetem anyagmérlegének azonban csak töredékét alkotja a látszó anyag. A domináns mennyiségben előforduló sötét anyag nem bocsájt ki elektromágneses sugárzást, így közvetlenül nem látható, hatása egyedül a gravitáción keresztül jelentkezik. Ennek egyik megnyilvánulása az úgynevezett gyenge gravitációs lencsézés. Miközben a távoli galaxisok fénye felénk közeledik, a sötét anyag sűrűbb és ritkább régiói kis mértékben eltérítik a fénysugarak útját, így a galaxisok alakját torzítottan látjuk. A jelenség ahhoz hasonlítható, mint mikor nyáron az aszfalt fölött felhevült vibráló levegőn át szemléljük a távoli tájat. Sok-sok távoli galaxis megfigyelésével az „átvilágított” sötét anyag eloszlásáról térkép készíthető. Ez a gyenge gravitációs lencsézést ábrázoló térkép információt hordoz az univerzum történetéről, jellemzőiről, melynek leírására a fizikusok úgynevezett kozmológiai paramétereket vezettek be.
Ezt az információt azonban nehéz kinyerni a térképekből: a kozmológiai paraméterek, mint például az anyagsűrűség vagy a korai sűrűség fluktuációk mértéke, hosszú és bonyolult fizikai folyamatokon keresztül befolyásolják a lencsézést ábrázoló térképek pontos megjelenését. Ezt a folyamatot közvetlenül nem lehet megfordítani, megoldása egy nehéz inverz probléma. A vibráló levegős hasonlatban ennek megfelelően a háttérben eltorzult táj képéből kellene a hőmérsékletet, a légnyomást vagy éppen a nitrogén-oxid légszennyezés mértékét meghatározni.
A kutatók különböző statisztikai módszerekkel próbálnak információt kinyerni. A vizsgálatok során sötét anyag-szimulációk segítségével virtuális univerzumokat hoznak létre, melyekben sorra más és más a kozmológiai paraméterek értéke. Mindegyikben végigkövetik a fénysugarak útjait, és a torzulásokból virtuális lencsézés térképeket számolnak ki. Ezek statisztikai jellemzőit lehet aztán összevetni a valódi észlelésekkel, majd meghatározni az igazi világegyetem paramétereit. A paraméterbecslés pontossága azon múlik, hogy a statisztikai módszer mennyi információt tud kivonni a térképekből. Az eddig használt két-pont statisztikán alapuló módszerekről, pl. a legelterjedtebb és legjobban megértett teljesítmény sűrűség spektrum módszerről lehet tudni, hogy nem nyeri ki a maximális információt, de nehéz jobbat tervezni nála. Egy másik, kicsivel érzékenyebb módszer a térképeken lévő „hegyek” magasságainak hisztogramjával dolgozik. A minél pontosabb módszer azért is fontos lenne, mert annak hiányában csak – költségét tekintve is é – jóval nagyobb, sokkal több galaxist érintő észlelési programmal lehet precízebb eredményt elérni.
A Komplex Rendszerek Fizikája Tanszékén dolgozó Csabai István egyetemi tanár és PhD-hallgatói más területeken már sikerrel használtak gépi tanulási módszereket. Ribli Dezső és Pataki Bálint Ármin első és második helyezést értek el orvosbiológia aktuális kihívásait megcélzó, ezernél több kutatót megmozgató nemzetközi DREAM Challenge versenyen. Pataki Bálint olyan módszert dolgozott ki, amelyik mobil szenzorok adataiból képes a Parkinson-kór korai jeleit felismerni, Ribli Dezső pedig mammográfiai képek diagnosztikájához fejlesztett ki egy pontos eljárást.
Az ELTE kutatóinak sikerült kialakítani egy olyan mélytanulási (deep learning) hálózatot, amelyik a gravitációs lencsézést ábrázoló térképekből az eddigieknél sokkal precízebben tudja meghatározni a kozmológiai paramétereket. Ez önmagában is fontos eredmény, azonban a gépi tanulási módszereket gyakran gyanakodva fogadják az egyes szakmák kutatói. Egy-egy modern mesterséges neuronhálózat több millió neuront, s akár sok millió belső paramétert tartalmazhat. A hálózat működése az ember számára áttekinthetetlen „fekete doboz”, általánosan nehéz bebizonyítani, hogy az eddig nem látott bemenetekre vajon szintén ugyanolyan pontos választ ad-e majd, mint azokra, amelyeken tanították és tesztelték.
Annak érdekében, hogy a hálózat rejtett működését feltárják, a kutatók „belenéztek a fekete dobozba”, és egy olyan részegységet találtak, amelyik különösen fontos volt a becslés során. Megvizsgálva annak paramétereit meglepve tapasztalták, hogy az nagyon hasonlít az úgynevezett Roberts-kereszt (Roberts cross) operátorhoz, amely képfeldolgozó körökben nem ismeretlen, viszont a kozmológusoknak eddig alkalmazták azt az adatok elemzésére. Kiderült, hogy a neuronháló milliónyi paramétere helyett, önmagában ennek az operátornak a használatával felépített módszer is remekül működik: a neuronháló egy olyan új egyszerű ötletet „fedezett fel”, amelyik gyorsan, átlátható módon, stabilan használható precíz kozmológiai paraméter-becslésre.
A tudományos közlemény teljes szövege itt érhető el.