V tiché kanceláři v Cambridge ve státě Massachusetts se robotický chapač pohybuje s nečekanou grácií. Nechytá jen věci – on hledá. Když se mu žárovka vykutálí z ruky, robot nezamrzne ani neudělá chybu. Místo toho prohání žárovku po stole, zvedne ji a opatrně zašroubuje do objímky, aby si osvětlil pracovní prostor.
Robotika se po desetiletí potýká s frustrujícím paradoxem známým jako Moravcův paradox: myšlení na vysoké úrovni (jako je hraní šachů) je pro počítače snadné, ale senzomotorické dovednosti na nízké úrovni (jako držení křehkého předmětu nebo zavazování tkaniček) jsou neuvěřitelně obtížné. Zatímco umělá inteligence zvládla jazyk prostřednictvím modelů jako ChatGPT, fyzický svět zůstává chaotickou a nepředvídatelnou výzvou.
Startup s názvem Eka se nyní snaží tuto mezeru překlenout přechodem od neohrabané automatizace ke skutečné fyzické inteligenci.
Překážka typu Sim-to-Real
Abychom pochopili význam pokroku Eka, je nutné nahlédnout do historie učení robotů. V roce 2018 OpenAI předvedla „Dactyl“, robotickou ruku schopnou vyřešit Rubikovu kostku. Navzdory působivému výsledku byl tento úspěch „křehký“. Robot spoléhal na ideální podmínky a specializované senzory; pokud krychle sklouzla nebo se mírně změnil úhel, systém selhal.
Toto odvětví se dlouho potýká s propastí mezi simulacemi a realitou – s nesrovnalostí mezi dokonale řízeným digitálním prostředím a chaotickým reálným světem, který popírá gravitaci. Mnoho výzkumníků věřilo, že trénování robotů pouze v simulaci je slepá ulička, protože virtuální fyzika nikdy nedokáže dokonale zopakovat tření, váhu a nepředvídatelnost skutečného života.
Nový přístup: Vize – Síla – Akce
Zatímco mnoho společností se snaží trénovat roboty tím, že jim ukazuje videa lidí provádějících úkoly (technika známá jako modely Vision-Language-Action), Eka zvolila jiný přístup. Místo napodobování lidí umožňují robotům učit se sami prostřednictvím rozsáhlých simulací.
Spoluzakladatelé společnosti Pulkit Agrawal (profesor MIT) a Tuomas Haarnja (bývalý výzkumník Google DeepMind) vyvinuli svůj vlastní přístup:
- Samoučící se inteligence: Stejně jako se AlphaZero od Googlu naučil hrát šachy bojem sám proti sobě, tráví roboti Eka tisíce hodin v simulovaných prostředích a sami vymýšlejí pohybové strategie.
- Modely Vision-Power-Action: Na rozdíl od starších modelů, které „vidí“ pouze pixely, algoritmy Eka berou v úvahu fyzikální principy. Robot rozumí hmotnosti, setrvačnosti a hlavně síle.
- Haptická zpětná vazba: Eka vyvinula speciální chapadla, která poskytují pocit dotyku, což umožňuje robotovi snímat váhu předmětu nebo odpor povrchu.
Od kuřecích nugetek po globální průmysl
Praktické využití této technologie je obrovské. V nedávné ukázce robot provedl zdánlivě všední úkol: třídit kuřecí nugety z dopravního pásu do kontejnerů. Robot předváděl improvizaci podobnou lidské, někdy házel nugety do kontejneru, pokud byl mimo dosah – úroveň flexibility rozhodování, která se v tradiční robotice zřídka vyskytuje.
Tato schopnost je zvláště důležitá pro průmyslová odvětví, která stále silně závisí na lidské práci:
* Stravování: Manipulace s nestabilními, křehkými potravinami, jako je ovoce, zelenina a maso.
* Výroba: Provádění jemných montážních prací, jako je montáž elektroniky.
* Logistika a maloobchod: Navigace v obchodech a skladech, kde položky nejsou vždy v předvídatelných pozicích.
Cesta vpřed
Nyní se nacházíme v „éře GPT-1“ robotiky. Stejně jako rané jazykové modely byly často nekoherentní, než se z nich stali komunikační géniové, roboti Eka vykazují první záblesky ztělesněné inteligence. Začnou chápat nejen kde předmět je, ale také jak se cítí a jak se pohybuje.
Otázkou zůstává, zda tento simulačně náročný přístup dokáže nakonec překonat modely založené na demonstraci člověka. Pokud však Eka dokáže překlenout propast mezi simulací a realitou, „biliony dolarů“, které v současnosti procházejí lidskýma rukama, by brzy mohly zvládnout stroje se stejnou obratností.
Závěr: Upřednostněním fyzikálních zákonů a haptické zpětné vazby před pouhou imitací se Eka pokouší vyřešit nejtěžší problém v robotice: dát strojům schopnost navigovat a manipulovat s nepředvídatelným fyzickým světem s lidskou grácií.
