Genie 3 je prvním modelovým systémem od DeepMind, který umožňuje reálné interaktivní procházení generovaných světů - a to dokonce při 24 snímcích za sekundu ve 720p rozlišení. To umožňuje vytvářet prostředí podle textových pokynů, která působí věrohodně. Dokonce i po několika minutách interakce.
Pusťte si celou epizodu také jako podcast:
Model zvládá simulovat fyziku, počasí, vegetaci i fantaskní krajiny - od sopkového terénu po mystické lesy nebo katastrofické scenérie. Zachovává si vizuální paměť až na několik minut, což umožňuje reálný pocit návaznosti scén.
Genie 3 nicméně generuje svět po jednotlivých snímcích, nikoli opravdový 3D prostor jako klasické enginy, ve kterých se tvoří videoherní svět. Výsledek je tedy spíš vizuální iluze než plnohodnotná interaktivní realita. Navíc má omezený akční prostor, nedokáže simulovat složitou interakci vícero postav ani přesně reprodukovat skutečná místa. Na nějakou konzistentní práci na svém vlastním virtuálním světě jen za pomoci textových příkazů si tedy budeme muset asi ještě chvíli počkat.
Pusťte si celý díl podcastu Krotitelé bossů: