Il detto “usare il bastone e la carota”, come metodo estremo per la formazione, sembra sia stato preso un po’ alla lettera dalla LimX Dynamics, quando ha presentato di recente il suo robot bipede: P1. Un robot che, grazie all’apprendimento per rinforzo, riesce a navigare e ad apprendere tutti i rischi della navigazione. Anche nel caso in cui, per fini scientifici, si provi a bastonarlo e a farlo cadere.
LimX Dynamics presenta un robot bipede che impara a colpi di bastone
Basato sull’apprendimento per rinforzo (RL), il robot bipede P1 si è avventurato per la prima volta nella montagna di Tanglang a Shenzhen. P1 è un robot bipede di LimX Dynamics, che serve come piattaforma importante per lo sviluppo sistematico e il testing modulare dell’apprendimento per rinforzo.
Utilizzando l’apprendimento senza alcuna supervisione, in condizioni di test non protette e completamente aperte, P1 ha navigato con successo una foresta a lui completamente sconosciuta, dimostrando un controllo eccezionale e una stabilità post-apprendimento per rinforzo, muovendosi dinamicamente su vari terreni complessi.
In questo test, la differenza più evidente rispetto all’ambiente del laboratorio o della città è che nessun passo, pendenza o terreno pianeggiante risulta identico al precedente. Dalla base della montagna alla vetta, il terreno varia significativamente.
Inoltre, durante l’allenamento di simulazione, a P1 non sono stati forniti dati relativi alle foreste o all’escursionismo. E le differenze rispetto all’ambiente sperimentale precedentemente sottoposto erano decisamente importanti.
Come ha notato Hardware Upgrade, gli ingegneri di LimX hanno voluto testare il suo sistema di autobilanciamento e la capacità di rimanere in piedi, in caso di spinte o impatti anche su terreni accidentati. Per questo hanno cominciato a picchiarlo con un bastone ad altezza del ginocchio e a spingerlo.
Tuttavia, nonostante tutti questi ostacoli, è riuscito comunque ad adattarsi ai nuovi dintorni, camminando attraverso la foresta imprevedibile. Questo successo è attribuibile all’allenamento sistematico di LimX Dynamics sull’apprendimento per rinforzo, garantendo che le politiche addestrate siano fattibili, utilizzabili e affidabili nelle applicazioni reali.
Oltre alla locomozione, LimX Dynamics continua a compiere progressi nella manipolazione e nella loco-manipolazione su robot umanoidi, con ulteriori sviluppi da condividere in futuro.