Viceprezident divize, která vytvořila Gemini, věří, že umělá inteligence bude stále více přítomná ve hlasu, videích a robotice.
Když Walter Benjamin napsal Umění v době technické reprodukovatelnosti v roce 1939, uplynulo už sto let od doby, kdy fotografie přišla do světa díky vynálezu daguerrotypu, a více než čtyřicet let od chvíle, kdy bratři Lumièrovi vynalezli cinematograf. Nicméně, i po tak dlouhé době filozofové jako Benjamin stále přemýšleli a byli ohromeni nástupem těchto technologií a jejich schopností odpojit lidskou zkušenost od technických procesů. Dnes, v době technologického pokroku, se zdá, že pochopení toho, co se děje, je téměř nemožné, a to i pro ty, kteří se nacházejí za těmito inovacemi.
Poslední rozhovor s Oriolem VinyALSEM, který se uskutečnil v prosinci 2022, ukázal, že umělá inteligence teprve začínala masově pronikat mezi uživatelské masy prostřednictvím textových nebo obrazových aplikací jako je ChatGPT. O tři roky později a sotva se s tím chápeme, všechny softwarové programy tuto technologii integrují, vědci ji používají k testování svých teorií, umělci ji začínají brát jako další prvek své palety, studenti ji považují za nezbytnou a dokonce funguje jako psycholog. To vše s narůstajícími riziky a nejistotami, které se zvyšují, jak se technologie stává stále přesnější a ohromující.
Vinyals (z Sabadellu, 42 let) uznává, že tempo se velmi zrychlilo, ačkoli přiznává, že požadavky trhu a „vzrušení“ z toho, že dělají něco přirovnatelného k výletu na Měsíc, neumožňují zpomalit. I přes zvěsti o možné bublině v byznysu s umělou inteligencí peníze stále tečou a technici nepropásnou příležitost. Vinyals cítí odpovědnost za současnou situaci, neboť je jedním z největších světových expertů na umělou inteligenci, viceprezidentem společnosti Google DeepMind, anglické firmy, kterou Alphabet, mateřská společnost Google, koupila v roce 2014, aby se zaměřila na techniku hlubokého učení v oblasti umělé inteligence. Hlavním produktem DeepMind je Gemini, motor umělé inteligence, který konkuruje ChatGPT a jehož verze 3.0 byla uvedena na trh minulý týden. Tato společnost také vyvinula slavného AlphaGo, který uplatnil kreativitu a porazil světového šampiona ve hře Go, AlphaStar, který hraje a vyhrává ve videoře StarCraft II – jedné z oblíbených her Vinyalse, nebo AlphaFold, umělou inteligenci, která předpovídá strukturu proteinů a jejíž tvůrci získali Nobelovu cenu za chemii minulý rok.
Vinyals, matématik a inženýr telekomunikací, je tento týdne udělen čestný titul doktora touto univerzitou, ze které odešel jako mladá naděje, která při zkouškách téměř nestudovala. Promoval na Berkeley a poté se stal jednou z klíčových osobností v oblasti umělé inteligence. Často citovaný vědec, Vinyals stále přemýšlí o tom, jak mluvil počítač Hal ve filmu 2001: Vesmírná odysea, který poprvé viděl, když mu bylo osm let.
Příběh vývoje umělé inteligence
Otázka: Před třemi lety vstoupila umělá inteligence do našich životů. Co se stalo?
Odpověď: Pokusím se to shrnout. Technologie, kterou dnes používáme, je podobná té, která existovala před několika desetiletími; to, co děláme, je vylepšování receptu. Ale jako vždy se snažíme emulovat to, jak fungují neuronové spojení našeho mozku. Začal jsem v roce 2007, kdy to bylo pouze v oblasti vědeckého výzkumu. V roce 2013 jsem nastoupil do Googlu a během čtyř nebo pěti let jsme stále pokračovali v odborném výzkumu a publikování, ale postupně jsme si uvědomovali, že tato technologie může sloužit pro něco mnohem většího než jen výzkum. Následovaly klíčové chvíle, velké demonstrace jako AlphaGo nebo AlphaStar, které uvedly umělou inteligenci mezi širokou veřejnost, nebo AlphaFold, která revolucionalizovala biologii. V roce 2016 byla založena společnost OpenAI, která se rozhodla nepublikovat vědecké dokumenty, ale zaměřila se na velký krok směrem k mocnější inteligenci. To se podařilo s modely jako ChatGPT, který nejenže se ukázal jako vědecky zajímavý, ale také velmi užitečný; popularizoval se jako aplikace před třemi lety. V roce 2019 jsme se také zaměřili na vývoj velmi silného jazykového modelu a skončili jsme tím, že jsme spojili modely, na kterých jsme pracovali v Google Brain a Google DeepMind, aby vznikl nový projekt s názvem Gemini. Na začátku nebyl tak silný, ale stále vylepšujeme recept a nyní je na vysoké úrovni.
Aktualizace Gemini 3.0
Otázka: Jaké novinky přináší verze 3.0 Gemini?
Odpověď: Všechno vypadá docela podobně, ale kvalita se výrazně zvyšuje a možnosti toho, co je možné udělat, také. Schopnost vytvářet obrázky s motorem Nano Banana Pro je nyní mnohem silnější. Také se mnohem lépe orientuje ve kódu, matematických schopnostech, logice a zlepšili jsme jeho osobnost.
Co s problémem „halucinací“?
Otázka: Jak se vysvětlují halucinace nebo smyčky?
Odpověď: Ano, dochází k tomu, že například říká věci, které neexistují. Je obtížné to vysvětlit, závisí to na druhu problému. Pracujeme na testech. Například je test na otázku, kolik písmen má slovo ‚strawberry‘, a vždy odpovídá, že jich je dvě. Odpověď sice máme, ale nevíme, jak k ní dospěl. Nemůžeme zkoumat, kde v kódu došlo k chybě, protože to není program, ale neuronová síť. Nedokážeme pochopit, jak přesně funguje mentální proces, který vede mozek k tomu, aby dal odpověď. Co nám pomáhá to pochopit, je předložit mu otázku ve formě jazyka a zeptat se ho, proč poskytl tuto odpověď; poskytuje nám introspekci. Tak můžeme číst a interpretovat. Důvod, proč v AI dochází k chybám, spočívá také v tom, že na internetu existují chyby, a jazykový model čerpá odpovědi z internetu a od sebe samého. Existují způsoby, jak zlepšit, ale i uživatelé internetu vědí, že ne všechno, co najdou, je skutečné; to samé musí platit i pro AI.
Vnímání uživateli
Otázka: Myslíte, že si uživatelé vždy uvědomují toto riziko? Když se i vy sami divíte…
Odpověď: Ano, je to nová technologie s ohromujícími možnostmi, ale … Problém je v rychlosti, s níž se změníme. Demis Hassabis, generální ředitel DeepMind, někdy uvádí, že to, co se dnes děje, je desetkrát rychlejší než průmyslová revoluce. My uživatelé se adaptujeme na různé technologie. Vzdělání začíná u nás samotných, u zdravého rozumu. A firmy se také musí zlepšovat.
Osobnost umělé inteligence
Otázka: Mluvíte o osobnosti AI. Jak daleko můžeme říci, že je nebo bude jako my?
Odpověď: Již nyní je jasné, že modely nejen interpolují, tedy dosahují výsledku mezi dvěma věcmi. Mají také jistou kreativitu. Ne v každém aspektu, ale v některých případech dokážou přinést nové nápady. Je to díky jejich schopnosti: ve vědě dokážou přečíst všechny články ve dvou zcela odlišných oblastech a vytvořit propojení, které nikdo předtím neměl čas provést. Toto napomáhá generování nápadů s vědci. V matematice je to stejné: Terence Tao, který je označován za nejlepšího matematika světa, používá AI k opakovanému procesu. Je to společník pro výzkum. Není těžké si představit, že by umělá inteligence mohla vyřešit jeden z nejkomplexnějších matematických problémů. Vzhledem k měřítku: zatímco člověk může potřebovat 50 let na vyřešení Riemannovy hypotézy, pro tyto modely je jeden den ekvivalentní 600 letům.
Odpovědnost za rizika
Otázka: Geoffrey Hinton a další průkopníci AI varovali před riziky. Jaká je odpovědnost vědců a společností vůči těmto hrozbám?
Odpověď: S Geoffrey jsme společně publikovali a byli jsme kolegové v Googlu. Vědecká komunita se nikdy neshodne na všem stejným způsobem. Je dobré mít hlasy ze všech stran. Někteří vidí velké nebezpečí, zatímco jiní žádné. Já se nacházím uprostřed. A Google, nemohu mluvit za ostatní společnosti, je odpovědný, co se týče uvážlivého vydávání modelů; investuje do toho mnoho let. Je pravda, že pokud neuvolníte modely pro širší veřejnost, nebudete moci brzy vidět problémy, které mají. Momentálně je mezi několika společnostmi závod, a musíme být v něm, ale také předvídat důsledky.
Rychlost pokroku a budoucnost
Otázka: Budeme litovat, že jdeme tak rychle?
Odpověď: Jako vědec, ale také jako otec, myslím na svět, který přijde, a na to, jak se změní pracovní prostředí a vztahy. Hluboce přemýšlím o důsledcích, zda je dobré, aby mladí lidé měli přístup k chatbotům. Nemáme čas provádět studie, ale pomáhá přemýšlet o vlastním riziku, abychom to udělali správně. Ano, bylo by lepší jít pomaleji, mít více času pochopit, co je dobré a co ne. Ale v této dynamice je to obtížné; svět se pohybuje rychle a existuje mnoho pobídek. Je to také vzrušující, je to historický okamžik, jako když jsme letěli na Měsíc. Je tu mnoho optimismu, energie a ekonomických možností. Je složité, aby se to zastavilo nebo zpomalilo. Doufám, že pokud budeme mít dostatečné údaje, že něco nefunguje, můžeme mírně zpomalit.
Následky nástupu DeepSeek
Otázka: Jaký měl dopad příchod DeepSeek z Číny na vaši kariéru?
Odpověď: S malým týmem to zvládli dobře, dokázali okopírovat, co se dělalo. Ale nejpokročilejší modely jsou od Googlu a OpenAI. Problém je v tom, že u některých aplikací může nastat omezení, kde všichni přijdeme, a pak může být doba, kdy všechny AI mluví perfektní angličtinou a v tomto ohledu nebude další pokrok. V tomto smyslu neměl velký dopad. Ale měl ho v geopolitice, protože Čína a USA jsou hlavními konkurenty.
Evropa a její konkurenceschopnost
Otázka: Může být Evropa konkurenceschopná? Co si myslíte o regulaci, kterou podporujete?
Odpověď: Ano, no, bez komentáře. DeepMind se nachází v Londýně, na evropském území, existují některé silné startupy jako Mistral, ale co se týče kapitálových investic, a pokud se podíváte, kde se nacházejí datová centra a infrastruktury … všechna jsou v USA nebo Číně.
Energetický dopad datových center
Otázka: Obáváte se energetického dopadu datových center?
Odpověď: Google se zavázal k neutralitě v emisích a dosahujeme toho, protože naše datová centra produkují CO2, ale máme udržitelné investice, které to kompenzují. Také po počátečních investicích budou energetické náklady efektivnější, také protože trénink AI bude účinnější. Samotná AI nám může pomoci objevit materiály nebo technologie, které řeší problém skleníkových plynů. Například jedním z témat, na které se zaměřujeme, je výzkum jaderné fúze. Mohla by přijít dříve díky AI.
Budoucnost interakce s AI
Otázka: Nyní interagujeme s AI převážně pomocí textu a obrazu. Co nás čeká v blízké budoucnosti?
Odpověď: Nejpřirozenější je, že přijde ve formě hlasu, kdy budeme hovořit a komunikovat s AI, aniž bychom tím nahradili text. Další formou jsou videa, malé tutoriály, které nám vysvětlí věci. To uvidíme brzy. A pak něco, co není tak bezprostřední, ale může být realizovatelné za pět let, protože na to je mnoho investic, je robotika. Budeme interagovat s humanoidními roboty, stejně jako nyní interagujeme s autonomními vozidly. Technologii máme, ale chybí nám nalézt formuli, která by byla přístupná a užitečná pro širokou veřejnost.
























