Een nieuw besturingssysteem stelt vierpotige robots in staat om in real-time over oneffen terrein te springen.
In de afgelopen jaren hebben vierpotige robots, geïnspireerd door de beweging van cheeta's en andere dieren, grote sprongen voorwaarts gemaakt. Maar ze lopen nog steeds achter op hun levende tegenhangers als het gaat om reizen door een landschap met snelle hoogteverschillen.
In die omgevingen is vision noodzakelijk gebruiken om falen te voorkomen. In een kuil stappen is moeilijk te vermijden als je het niet kunt zien. Hoewel er enkele methoden zijn om vision te integreren in beenbeweging, zijn de meeste niet echt geschikt voor gebruik met opkomende agile robotsystemen. Onderzoekers aan het MIT hebben Margolis een systeem ontwikkeld dat de snelheid en behendigheid van robots met poten verbetert terwijl ze over kuilen in het terrein springen.
Het nieuwe besturingssysteem is opgesplitst in twee delen: een deel verwerkt real-time invoer van een videocamera die aan de voorkant van de robot is gemonteerd, en een ander deel vertaalt die informatie in instructies hoe de robot zijn lichaam moet bewegen. De onderzoekers testten hun systeem op een op de MIT gebouwde mini-cheetah, een krachtige, wendbare robot.
In tegenstelling tot andere methoden voor het besturen van een robot met vier poten vereist dit tweedelige systeem niet dat het terrein vooraf in kaart wordt gebracht. In de toekomst zou de robot het bos in kunnen gaan voor een noodhulpmissie of een trap beklimmen om medicijnen te leveren aan een ingesloten bejaarde.
Veel 'blinde' controllers – zonder vision systeem – zijn robuust en effectief, maar hiermee kunnen robots alleen over ononderbroken terrein lopen. Systemen mét vision systeem vertrouwen meestal op een 'hoogtekaart' van het terrein, die vooraf moet worden geconstrueerd of direct moet worden gegenereerd. Dit is doorgaans een traag proces dat vatbaar is voor storingen en onjuistheden.
Om hun systeem te ontwikkelen, hebben de onderzoekers de beste elementen uit de robuuste 'blinde' controllers gehaald en gecombineerd met een aparte module die vision in real-time afhandelt. De camera van de robot legt dieptebeelden vast van het aankomende terrein, die worden doorgestuurd naar een controller op hoog niveau. Dit gebeurt samen met informatie over de toestand van het lichaam van de robot (gewrichtshoeken, lichaamsoriëntatie, enz.). De hogere controller is een neuraal netwerk dat 'leert' uit ervaring.
Het neurale netwerk bepaalt een doeltraject, dat de tweede controller gebruikt om koppels te berekenen voor elk van de twaalf gewrichten van de robot. Deze low-level controller vertrouwt op een reeks beknopte fysieke vergelijkingen die de beweging van de robot beschrijven. Door deze hiërarchie, inclusief het gebruik van deze low-level controller, kunnen de onderzoekers het gedrag van de robot beperken, zodat hij zich beter gedraagt. Voor deze controller gebruiken ze goed gespecificeerde modellen waaraan ze beperkingen kunnen opleggen, wat meestal niet mogelijk is in een op leren gebaseerd netwerk.
De onderzoekers gebruikten de trial-and-error-methode die bekend staat als reinforcement training om de controller op hoog niveau te trainen. Ze voerden simulaties uit van de robot die over honderden verschillende discontinue terreinen liep en 'beloonden' hem voor succesvolle overtochten. Na verloop van tijd leerde het algoritme welke acties de beloning maximaliseerden.
Daarna bouwden de onderzoekers een fysiek open terrein met houten planken en stelden hun controleschema op de proef met behulp van de mini-cheetah. Dit platform is modulair en is grotendeels gemaakt van onderdelen die je online kunt bestellen.
Het inschatten van de staat van de robot bleek in sommige gevallen een uitdaging. Anders dan bij simulatie komen sensoren in de echte wereld ruis tegen die de uitkomst kan beïnvloeden. Voor sommige experimenten met nauwkeurige voetplaatsing gebruikten de onderzoekers een motion capture-systeem om de ware positie van de robot te meten. Hun systeem presteerde beter dan anderen die slechts één controller gebruiken, en de mini-cheetah doorkruiste met succes 90 procent van het terrein.
Nieuw is dat het systeem de gang van de robot aanpast. Als een mens zou proberen over een heel brede kloof te springen, zou hij kunnen beginnen met heel snel te rennen om snelheid op te bouwen. Vervolgens zou hij beide voeten bij elkaar kunnen zetten om een echt krachtige sprong over de kloof te maken. Op dezelfde manier kan onze robot de timing en duur van zijn voetcontacten aanpassen om het terrein beter te doorkruisen.
Hoewel de onderzoekers konden aantonen dat hun controleschema werkt in een laboratorium, hebben ze nog een lange weg te gaan voordat ze het systeem in de echte wereld kunnen inzetten. In de toekomst hopen ze een krachtigere computer op de robot te monteren, zodat deze al zijn berekeningen aan boord kan doen. Ze willen ook de toestandsinschatting van de robot verbeteren om de noodzaak voor het motion capture systeem te elimineren.
Daarnaast willen ze de controller op laag niveau verbeteren, zodat deze het volledige bewegingsbereik van de robot kan benutten. Tot slot willen ze de controller op hoog niveau verbeteren, zodat deze goed werkt in verschillende lichtomstandigheden.
Foto: MIT