Význam správných návrhů pro zrychlení učení v systémech vizuální AI

Výzkum provedený na Johns Hopkins University ukazuje, že umělé inteligence (AI) založené na biologicky inspirovaných strukturách mohou vykazovat aktivity podobné těm v lidském mozku, dokonce i před samotným tréninkem.

Tato studie, publikovaná v Nature Machine Intelligence, naznačuje, že design AI modelu může mít větší význam než rozsáhlé procesy hlubokého učení, které často trvají měsíce, vyžadují obrovské množství energie a stojí miliardy dolarů.

„Současný trend v oblasti AI směřuje k tomu, že se na modely vrhá obrovské množství dat a budují se výpočetní zdroje o velikosti malých měst. Takovéto investice vyžadují desítky miliard dolarů. Mezitím se lidé učí vidět s velmi malým množstvím dat,“ uvedl vedoucí autor Mick Bonner, asistent profesor kognitivní vědy na Johns Hopkins University. „Evoluce možná z nějakého důvodu došla k tomuto designu. Naše práce naznačuje, že architektonické návrhy, které více odpovídají mozku, umísťují systémy AI na velmi výhodný startovní bod.“

Vědecké zkoumání architektur AI

Bonner a jeho kolegové prozkoumali tři hlavní kategorie návrhů sítí, které často určují výstavbu moderních systémů AI: transformátory, plně propojené sítě a konvoluční sítě.

Testování AI architektur ve srovnání s aktivitou mozku

Vědci opakovaně modifikovali tři návrhy, neboli architektury AI, aby vytvořili desítky unikátních umělých neuronových sítí. Poté tyto nové a netrénované AI sítě vystavili obrazům různých objektů, lidí a zvířat a porovnali reakce modelů s aktivitou mozku lidí a primátů vystavených stejným obrázkům.

Když byly transformátory a plně propojené sítě modifikovány přidáním mnoha dalších umělých neuronů, ukázaly jen malé změny. Vylepšení architektur konvolučních neuronových sítí obdobným způsobem však umožnilo výzkumníkům generovat vzorce aktivity v AI, které lépe simulovaly vzory v lidském mozku.

Architektura hraje větší roli, než se očekávalo

Netrénované konvoluční neuronové sítě se vyrovnaly konvenčním AI systémům, které byly obvykle vystaveny milionům nebo miliardám obrázků během tréninkového procesu, což naznačuje, že architektura hraje důležitější roli, než si předtím výzkumníci uvědomovali.

„Pokud je trénink na masivních datech skutečně klíčovým faktorem, pak by nemělo být možné dosáhnout systému AI podobného mozku pouze architektonickými modifikacemi,“ poznamenal Bonner. „To znamená, že počátečním výběrem správného návrhu a možná začleněním dalších poznatků z biologie bychom mohli dramaticky urychlit učení v systémech AI.“

Dalším krokem je vývoj jednoduchých učebních algoritmů modelovaných podle biologie, které by mohly informovat o novém rámci hlubokého učení.

Reference: „Konvoluční architektury jsou na úrovni kůry de novo“ od Atlase Kazemiana, Erika Elmoznina a Michaela F. Bonnera, 13. listopadu 2025, Nature Machine Intelligence. DOI: 10.1038/s42256-025-01142-3

Spread the love