Vyzkoušejte si SONIC: textové ovládání humanoidního robota přímo v prohlížeči
NVIDIA Labs zpřístupnila webové demo SONIC, ve kterém si lze přímo v internetovém prohlížeči vyzkoušet 3D simulaci humanoidního robota Unitree G1, aktivní motion-control policy a generování pohybů z textových příkazů. Pro vývojáře, výzkumníky i technologické nadšence jde o zajímavou ukázku toho, jak se humanoidní robotika posouvá od předem připravených pohybů směrem k univerzálnějším modelům pro whole-body control.
Humanoidní robotika se často prezentuje prostřednictvím krátkých videí, sestříhaných demonstrací nebo ukázek z laboratoří. SONIC od NVIDIA Labs je zajímavý tím, že část této technologie zpřístupňuje interaktivně – přímo ve webovém prohlížeči. Uživatel si tak nemusí jen pustit video, ale může sledovat 3D simulaci humanoidního robota, zapínat fyziku, aktivovat policy, manipulovat s kamerou a testovat, jak se robot snaží následovat zadaný pohyb. Demo je zaměřené na whole-body motion tracking humanoidního robota Unitree G1 a obsahuje také možnost generování pohybů pomocí systému Kimodo.

SONIC, celým názvem Supersizing Motion Tracking for Natural Humanoid Whole-Body Control, je výzkumný projekt zaměřený na škálování řízení humanoidních robotů. Autoři jej popisují jako přístup, který se nesoustředí na jednu konkrétní dovednost, ale na obecnější schopnost robota sledovat rozmanité lidské pohyby celým tělem. Místo vytváření samostatných controllerů pro jednotlivé úlohy se SONIC snaží využít motion tracking jako škálovatelný trénovací úkol pro jednu sjednocenou policy.
Prakticky to znamená, že robot není řízen pouze sadou předem připravených animací, ale jeho model se učí z velkého množství lidských pohybových dat a následně se snaží tyto pohyby převést do fyzicky realizovatelného chování humanoidního robota. SONIC byl natrénován jako humanoidní behavior foundation model, který má robotům poskytnout základní motorické schopnosti naučené z rozsáhlých lidských pohybových dat.
Co si lze v demu vyzkoušet
Webové demo SONIC umožňuje otevřít simulaci humanoidního robota G1 přímo v prohlížeči. Uživatel zde vidí referenční pohyb, 3D model robota a základní ovládací prvky simulace. Rozhraní obsahuje přepínače pro fyziku a policy, možnost restartu simulace, sledování kamery i interaktivní manipulaci s robotem. Součástí demo stránky je také sekce Generate Motion with Kimodo, která ukazuje směr k textovému zadávání pohybových příkazů.
To je důležité zejména proto, že textové nebo multimodální ovládání humanoidních robotů je jedním z klíčových směrů současného výzkumu. V projektové stránce SONIC autoři uvádějí, že přirozené jazykové příkazy mohou být převedeny na lidské pohyby, které humanoidní robot následně sleduje pomocí své control policy.
Jinými slovy: nejde pouze o „hezkou animaci robota.“ Demo ukazuje základní princip toho, jak může vypadat budoucí rozhraní mezi člověkem a humanoidním robotem. Člověk zadá záměr – například slovně, pohybem ve VR, videem nebo jiným vstupem – a nižší řídicí vrstva robota se pokusí tento záměr převést do stabilního pohybu celého těla.

Proč je SONIC zajímavý
Význam SONIC není jen v samotném webovém demu. Z výzkumného hlediska je důležité především to, že autoři ukazují škálování humanoidního řízení podobným směrem, jaký známe z velkých modelů v oblasti jazyka, obrazu nebo videa. V paperu popisují škálování ve třech osách: velikost modelu, objem dat a výpočetní výkon. Konkrétně uvádějí rozsah od 1,2 milionu do 42 milionů parametrů, více než 100 milionů framů pohybových dat a stovky hodin lidského motion capture záznamu.
Pro humanoidní robotiku je to podstatné, protože klasické řídicí přístupy často řeší jednotlivé dovednosti odděleně: chůzi, běh, dřep, manipulaci, vstávání nebo teleoperaci. SONIC se naopak snaží vytvořit obecnější základ, který může podporovat různé způsoby ovládání a různé typy pohybu v rámci jedné sjednocené policy. Autoři zmiňují využití pro motion tracking, teleoperaci, multimodální control i interaktivní kinematické plánování na humanoidním robotu Unitree G1.
To otevírá zajímavou otázku: pokud bude možné podobné modely dále škálovat, budou se humanoidní roboti učit nové pohyby spíše jako obecné motorické schopnosti než jako úzce definované programy pro konkrétní úlohu?
Simulace není totéž co reálné nasazení
Je důležité říct, že webové demo v prohlížeči není totéž jako bezpečné nasazení na fyzickém humanoidním robotu. Simulace je ideální prostředí pro experimentování, testování limitů a pochopení principu. Reálný robot ale přináší další vrstvy problémů: bezpečnost, latence, kontakt s prostředím, energetickou náročnost, spolehlivost senzorů, síťovou infrastrukturu i rizika při interakci s člověkem.
Ostatně i samotní autoři v diskusi uvádějí, že mezi limity budoucí práce patří formální řešení bezpečnosti, compliance a energetické efektivity pro delší nasazení.
Právě zde vzniká prostor pro pracoviště jako ICHR. Nestačí sledovat videa a předpokládat, že technologie je připravena k okamžitému nasazení. Je potřeba rozlišovat mezi výzkumnou demonstrací, simulací, laboratorním prototypem a robustním provozem v reálném prostředí.
Co si z toho odnést
SONIC je dobrá ukázka toho, kam se humanoidní robotika posouvá. Nejde už jen o mechanickou konstrukci robota nebo o základní stabilní chůzi. Stále důležitější roli hraje software: naučené policies, motion tracking, sim-to-real přenos, multimodální vstupy a propojení s foundation modely.
Pro zájemce o humanoidní robotiku je webové demo SONIC cenné právě tím, že si mohou část těchto principů vyzkoušet prakticky. Mohou pozorovat, jak robot reaguje v simulaci, jak se chová aktivní policy a jaké možnosti i limity má současné generování pohybů z textových nebo jiných vstupů.
Z pohledu ICHR je podobná ukázka důležitá ještě z jednoho důvodu: pomáhá přenést debatu o humanoidních robotech od obecných vizí k experimentům, které lze skutečně testovat, porovnávat a kriticky hodnotit. A právě takový přístup bude pro odpovědné nasazování humanoidních robotů v průmyslu, výzkumu i společnosti klíčový.
Zdroje
Výzkumný pracovník v Testbedu pro Průmysl 4.0 na CIIRC ČVUT, jehož odborné zaměření zahrnuje vývoj robotických aplikací, digitálních dvojčat a přechod ze simulací k reálným řešení (sim-to-real). Na Testbedu se podílí na projektech spojujících akademický výzkum s průmyslovou praxí — kombinace, která mu umožňuje soustavně rozšiřovat technické i metodické znalosti.