W cichym biurze w Cambridge w stanie Massachusetts robotyczny chwytak porusza się z nieoczekiwaną gracją. Nie tylko chwyta rzeczy – on szuka. Kiedy żarówka wymyka mu się z uścisku, robot nie zawiesza się i nie popełnia błędu. Zamiast tego goni żarówkę po stole, podnosi ją i ostrożnie wkręca w oprawkę, aby oświetlić swoje miejsce pracy.
Przez dziesięciolecia robotyka borykała się z frustrującym paradoksem znanym jako paradoks Moraveca: myślenie na wysokim poziomie (jak gra w szachy) jest łatwe dla komputerów, ale umiejętności sensomotoryczne na niskim poziomie (takie jak trzymanie delikatnego przedmiotu lub wiązanie sznurowadeł) są niezwykle trudne. Chociaż sztuczna inteligencja opanowała język dzięki modelom takim jak ChatGPT, świat fizyczny pozostaje chaotycznym i nieprzewidywalnym wyzwaniem.
Startup o nazwie Eka próbuje teraz wypełnić tę lukę, przechodząc od nieporadnej automatyzacji do prawdziwej inteligencji fizycznej.
Przeszkoda między Simem a Realem
Aby zrozumieć znaczenie postępu Eki, należy przyjrzeć się historii uczenia się robotów. W 2018 roku OpenAI zademonstrowało „Dactyl”, ramię robota zdolne do ułożenia kostki Rubika. Pomimo imponującego wyniku, sukces ten był „kruchy”. Robot działał w idealnych warunkach i wyspecjalizowanych czujnikach; jeśli kostka się poślizgnęła lub kąt został nieznacznie zmieniony, system uległ awarii.
Branża od dawna zmaga się z rozbieżnością między symulacją a rzeczywistością — rozbieżnością między doskonale kontrolowanym środowiskiem cyfrowym a chaotycznym, zaprzeczającym grawitacji realnym światem. Wielu badaczy uważało, że szkolenie robotów wyłącznie w symulacji to ślepy zaułek, ponieważ wirtualna fizyka nigdy nie byłaby w stanie idealnie odtworzyć tarcia, ciężaru i nieprzewidywalności prawdziwego życia.
Nowe podejście: wizja – moc – działanie
Podczas gdy wiele firm próbuje szkolić roboty, pokazując im filmy przedstawiające osoby wykonujące zadania (technika znana jako modele wizja-język-działanie), Eka przyjmuje inną taktykę. Zamiast naśladować ludzi, pozwalają robotom samodzielnie się uczyć poprzez symulacje na dużą skalę.
Współzałożyciele firmy Pulkit Agrawal (profesor MIT) i Tuomas Haarnja (były badacz Google DeepMind) opracowali własne podejście:
- Inteligencja samoucząca się: Tak jak AlphaZero firmy Google nauczył się grać w szachy, walcząc sam ze sobą, tak roboty Eka spędzają tysiące godzin w symulowanych środowiskach, samodzielnie wymyślając strategie ruchu.
- Modele wizja-moc-działanie: W przeciwieństwie do starszych modeli, które „widzą” tylko piksele, algorytmy Eka uwzględniają zasady fizyki. Robot rozumie masę, bezwładność i, co najważniejsze, siłę.
- Sprzężenie zwrotne dotykiem: Eka opracowała specjalne chwytaki zapewniające zmysł dotyku, który pozwala robotowi wyczuć ciężar przedmiotu lub opór powierzchni.
Od nuggetsów z kurczaka po światowy przemysł
Praktyczne zastosowania tej technologii są ogromne. Podczas niedawnej demonstracji robot wykonał pozornie przyziemne zadanie: sortował nuggetsy z kurczaka z przenośnika taśmowego do pojemników. Robot wykazywał się improwizacją przypominającą ludzką, czasami wrzucając bryłki do pojemnika, jeśli znajdował się poza jego zasięgiem – poziom elastyczności w podejmowaniu decyzji rzadko spotykany w tradycyjnej robotyce.
Ta umiejętność jest szczególnie ważna w branżach, które nadal w dużym stopniu opierają się na pracy ludzkiej:
* Usługi gastronomiczne: Obsługa niestabilnej, delikatnej żywności, takiej jak owoce, warzywa i mięso.
* Produkcja: Wykonywanie drobnych prac montażowych, takich jak montaż elektroniki.
* Logistyka i handel detaliczny: Nawigacja po sklepach i magazynach, w których towary nie zawsze znajdują się w przewidywalnych pozycjach.
Droga naprzód
Żyjemy obecnie w „erze GPT-1” robotyki. Tak jak wczesne modele językowe były często niespójne, zanim stały się geniuszami komunikacji, tak roboty Eka dają pierwsze przebłyski ucieleśnionej inteligencji. Zaczynają rozumieć nie tylko gdzie znajduje się przedmiot, ale także jak się czuje i jak się porusza.
Pozostaje pytanie, czy to podejście oparte na intensywnych symulacjach może ostatecznie przewyższyć modele oparte na demonstracjach na ludziach. Jeśli jednak Eka uda się wypełnić lukę między symulacją a rzeczywistością, „biliony dolarów”, które obecnie przechodzą przez ludzkie ręce, będą wkrótce mogły być obsługiwane przez maszyny o tej samej zręczności.
Wniosek: Przedkładając prawa fizyki i wrażenia dotykowe nad zwykłe naśladownictwo, Eka próbuje rozwiązać najtrudniejszy problem w robotyce: zapewnić maszynom możliwość nawigacji i manipulowania nieprzewidywalnym światem fizycznym z ludzką gracją.




















