Vědci zjistili, že lidský mozek chápe mluvený jazyk velmi podobným způsobem jako pokročilé systémy umělé inteligence. Nová studie ukazuje, že lidský mozek rozumí mluvené řeči prostřednictvím souboru kroků, které se výrazně podobají tomu, jak fungují moderní jazykové modely umělé inteligence. Zaznamenáním aktivity mozku při poslechu mluveného příběhu vědci zjistili, že pozdější mozkové signály odpovídaly hlubším úrovním AI modelů, zejména v klíčových jazykových oblastech, jako je Brocova oblast.
Výsledky zpochybňují dřívější teorie založené na striktních pravidlech týkajících se jazyka a jsou podpořeny novou veřejnou datovou sadou, která nabízí významný nástroj pro zkoumání toho, jak mozek vytváří význam. Výzkum, publikovaný v časopise Nature Communications, provedli vědci z Hebrejské univerzity v Izraeli, Princetonské univerzity ve Spojených státech a výzkumníci z Google Research. Tým odhalil nečekané spojení mezi tím, jak lidé interpretují mluvené slovo, a způsobem, jakým moderní modely umělé inteligence zpracovávají text.
Studie a metodologie
Používaje elektroencefalografické záznamy od osob, které poslouchaly třicetiminutový podcast, vědci s vysokou přesností sledovali mozkové reakce. Jejich analýza ukázala, že zpracování jazyka v mozku probíhá podle strukturované sekvence, která se těsně shoduje s vícestupňovou architekturou velkých jazykových modelů, jako jsou GPT-2 a Llama 2.
Když někdo poslouchá řeč, mozek okamžitě nezachycuje smysl. Naopak každé slovo prochází řadou neuronových fází. Vědci zjistili, že tyto fáze se vyvíjejí v průběhu času způsobem, který se velmi podobá fungování umělé inteligence. Rané úrovně AI se soustředí na základní charakteristiky slov, zatímco hlubší úrovně kombinují kontext, tón a celkový význam.
Tento vzor byl také pozorován v mozku. Rané mozkové reakce odpovídaly počátečním fázím zpracování AI, zatímco pozdější reakce byly v souladu s hlubšími úrovněmi modelů. Tato časová shoda byla obzvláště výrazná v pokročilých jazykových oblastech, jako je Brocova oblast, kde se maximální mozková aktivita objevila později, když souvisela s hlubšími úrovněmi modelů.
Podle Dr. Goldsteina bylo nejvíce překvapující, jak úzce časový vývoj vytváření významu v mozku odpovídá pořadí transformací uvnitř velkých jazykových modelů. Ačkoli byly tyto systémy vytvořeny velmi odlišnými způsoby, zdá se, že obě přistupují k podobnému krok za krokem procesu porozumění.
Důležitost zjištění
Výsledky naznačují, že umělá inteligence není pouze nástrojem pro generování textu. Může také pomoci vědcům lépe chápat, jak lidský mozek zpracovává význam. Po mnoho let byla chápání jazyka považována za založenou na stabilních symbolech a přísných jazykových pravidlech. Tato studie zpochybňuje tento názor a podporuje flexibilnější, daty řízený přístup, kde se význam postupně formuje prostřednictvím kontextu.
Vědci také zkoumali tradiční jazykové prvky, jako jsou fonémy a morfémy. Tyto rysy nevysvětlovaly aktivitu mozku v reálném čase tak dobře, jako reprezentace kontextu vytvářené modely AI. To posiluje myšlenku, že mozek se více spoléhá na širší kontext než na přísně definované jazykové jednotky.
Aby podpořili další výzkum v této oblasti, tým zveřejnil celé spektrum neuronálních záznamů spolu s odpovídajícími jazykovými rysy. Veřejným zpřístupněním těchto dat mohou vědci z celého světa porovnávat různé teorie porozumění jazyku a vyvíjet výpočetní modely, které přesněji odrážejí způsob fungování lidského mozku.




















