Vstup do světa umělé inteligence: Příběh dvou přátel od školních lavic k AGI

Před dvěma lety se dva dvaadvacetiletí přátelé, kteří se potkali na střední škole v Michiganu, ocitli v laboratoři mozku na Tsinghua University v Pekingu, kde dostali nabídku ve výši několika milionů dolarů od Elona Muska.

Oba studenti právě vytvořili něco neobvyklého pro danou dobu: vybudovali malý jazykový model (LLM), který nebyl školen na masivních datech z internetu, ale na pečlivě vybraném souboru kvalitních konverzací. Naučili ho zlepšovat se pomocí posilovacího učení (RL), techniky, při které model učí jako člověk nebo zvíře: prostřednictvím rozhodování, přijímání zpětné vazby a následného zdokonalování chování na základě odměn a trestů.

V té době se tím téměř nikdo nezabýval. Jedinou další skupinou, která zkoumala RL pro LLM, byla DeepSeek, čínský konkurent OpenAI, který později vyděsil Silicon Valley.

Studenti William Chen a Guan Wang nazvali svůj model OpenChat a otevřeně ho představili na internetu. Překvapili se, když OpenChat strmě vzrostl na popularitě.

„Stal se velmi známým,“ řekl Chen magazínu Fortune. Vědci z Berkeley a Stanfordu si stáhli jejich kód, postavili na něm a začali na něj citovat práci. V akademických kruzích se stal jedním z prvních příkladů, jak malý model trénovaný na kvalitních datech, na rozdíl od většího objemu dat, mohl překonat očekávání.

Nakonec se dostal i do e-mailové schránky, kterou Chen nikdy neočekával: do inboxu Elona Muska. Ten zaslal e-mail prostřednictvím své tehdy nové společnosti xAI, která chtěla studenty přivést s balíčkem ve výši několika milionů dolarů. Byla to nabídka, o které mladí zakladatelé sní.

Váhali. Nakonec nabídku odmítli. „Rozhodli jsme se, že velké jazykové modely mají své limity,“ uvedl Chen. „Chceme novou architekturu, která překoná strukturální omezení [velkého strojového učení].“

Místo přijetí nabídky opustili pohodlné momentum OpenChat a vydali se za mnohem ambicióznějším cílem: vyvinout „mozku inspirovaný“ systém uvažování, o kterém věřili, že by mohl překonat současné AI modely.

Toto rozhodnutí vedlo, o dva roky později, k vzniku Sapient Intelligence — a modelu, který překonal některé z největších AI systémů na testech abstraktního uvažování. Jsou přesvědčeni, že jejich model bude první, který dosáhne „AGI“, neboli umělé obecné inteligence, což je takzvaný svatý grál výzkumu AI, kde inteligence stroje může odpovídat nebo překonávat lidskou v jakémkoli kognitivním úkolu.

Mezi světy zbrojního závodu

Chenova cesta k odmítnutí Muska nezačala v Pekingu, ale v Bloomfield Hills v Michiganu a byla spojena s dětství plným posedlosti, která jeho rodiče šílenstvím.

„Když jsem byl mladý, rozebíral jsem věci a nikdy je zpět neskládal,“ vzpomínal. „To mě dostalo na začátek.“

Chen se narodil v Číně, částečně vyrůstal v San Diegu a Šen-čenu, a nakonec byl poslán na Cranbrook Schools — prestižní soukromou internátní školu v Michiganu — zhruba v době, kdy potkal Wanga, chlapce jeho věku, který navštěvoval jinou školu, ale měl také neobvyklou posedlost.

Na první den, kdy se setkali, se oba dali do dlouhé debaty o tom, co Chen nazývá jejich „metacíli“, konečným smyslem jejich životů. Pro Wanga byl tímto metacíl AGI, dávno předtím, než se tento termín stal populárním. Popisoval ho na střední škole jako „algoritmus, který řeší jakýkoliv problém“, protože terminologie v té době ještě neexistovala. Chenův metacíl byl jiný, ale komplementární: optimalizovat všechno, od inženýrských problémů po reálné systémy.

„Bylo to okamžité sladění,“ dodal Chen.

Dnes se oba ještě ptají každého nového zaměstnance, jaké jsou jejich metacíle.

Chen založil školní dronový klub, požádal administrátory, aby povolili studentům létat s kvadrokoptérami na kampusu a hodiny trávil v laboratořích robotiky. Byli to ti chlapci, kteří zůstávali dlouho ve škole, rozebírali hardware a stále experimentovali.

„Byla to skvělá doba,“ řekl Chen.

Když nastal čas na přihlášky na vysokou školu, Chen byl přijat na Carnegie Mellon a Georgia Tech — samozřejmé, prestižní cesty pro nadaného studenta robotiky. Wang byl mezitím přijat na Tsinghua University, elitní inženýrskou školu v Číně, často přirovnávanou k „čínskému MIT“.

Chen navštívil pekingský kampus, prohlédl si laboratoře a učinil rozhodnutí, které by málo amerických středoškoláků udělalo: následoval Wanga na Tsinghua.

Přechod nebyl snadný. Kurz byl intenzivní a oba se potýkali, dokonce i s neúspěchem v některých předmětech. „Většina čínských dětí je opravdu — nerad bych byl stereotypní — ale jsou opravdu dobří ve studiu,“ zasmál se Chen. „Jsou opravdu bystří.“

Stejně ho překvapilo, jak podpůrní byli jeho profesoři, jakmile se dozvěděli, co on a Wang vytvářejí. „Byli jako: ‚Hej, vím, co se snažíte udělat — je to velmi dobrá věc. O opravdu věřím v koncept AGI.’“

Do té doby téměř všichni v Tsinghua’s Brain Cognition and Brain-Inspired Intelligence Lab věděli, co se dva studenti pokoušeli: novou přístup k strojové inteligenci, který zpochybnil dominantní předpoklady v oboru.

Průlom ve 3 ráno

Bylo to v Tsinghua’s brain lab, kde vyvinuli Hierarchical Reasoning Model (HRM), architekturu, o které věří, že může plně překonat transformátory. Pokud byl OpenChat jejich důkaz o konceptu, HRM byl měsíčním cílem, na který cíle usilovali. A okamžik, kdy se to prokázalo, přišel, jak jinak, uprostřed noci.

Jedno náhodné ráno v červnu tento rok, ve 3 ráno, Chen a Wang zírali na benchmarkové výsledky, které vrátil jejich malý experimentální model. Jejich drobný prototyp HRM — pouhých 27 milionů parametrů, mikroskopický v porovnání s GPT-4 nebo Claude — překonával systémy od OpenAI, Anthropic a DeepSeek v úlohách navržených specificky na měření úvah. Řešil Sudoku-Extreme, nacházel optimální cesty v 30×30 bludištích a dosahoval ohromujících výkonů v benchmarku ARC-AGI — a to vše bez vyžadování myšlení nebo brutálního škálování.

„Bylo to šílené,“ řekl Chen. „Jen změnou v architektuře dal modelu to, čemu říkáme hloubka myšlení.“

Na rozdíl od transformátoru, který předpovídá další slovo na základě statistických vzorců, používá HRM dvoudílnou rekurzivní strukturu volně modelovanou na způsobu, jakým lidský mozek mísí pomalé, záměrné myšlení s rychlými reflexivními reakcemi. Systém umí plánovat, rozebírat problémy a uvažovat pomocí interní logiky namísto napodobování. „Není to hádání,“ dodal Chen. „Je to myšlení.“

Chen říká, že jejich modely méně halucinuji než tradiční LLM a již dosahují state-of-the-art výkonu v předpovědních úlohách, jako je předpověď počasí, kvantitativní obchodování a sledování zdravotního stavu.

V současnosti pracují na škálování HRM na všeobecný motor uvažování, s jednoduchou, ale radikální tezí: že AGI nepřijde z větších transformátorů, ale z menší, efektivnější architektury. Dnešní špičkové modely jsou masivní — v některých případech stovky miliard parametrů — ale i jejich tvůrci přiznávají, že mají potíže s uvažováním, plánováním a vícestupňovým rozkladem problémů, řekl Chen.

Věří, že toto omezení je strukturální, ne dočasné. „Můžete přidat více vrstev,“ říká. „Ale stále narážíte na limity pravděpodobnostního modelu.“

Společnost Sapient se nyní připravuje na otevření kanceláře v USA během následujícího měsíce, získání dalších investic a možná změnu názvu, aby mohli začít nasazovat druhou verzi svého modelu. Zakladatelé věří, že kontinuální učení — schopnost modelu absorbovat nové zkušenosti bezpečně, aniž by musel přeučovat od začátku — je další velkou hranicí.

„AGI je svatý grál AI,“ říká Chen. A očekává, že se objeví v následujících deseti letech. „Jednoho dne budeme mít AI, která je chytřejší než lidé,“ dodal Chen. „Guan a já vždy říkáme, že je to jako Pandořina skříňka, pokud to neuděláme my, udělá to někdo jiný. Takže doufáme, že budeme první, kdo to uskuteční.“

Spread the love