Robots leren snel beslissingen te nemen

Een nieuwe snelle leermethode draagt bij aan meer kennis over andere hemellichamen.

Marsrovers hebben teams van menselijke experts op aarde die hen vertellen wat ze moeten doen. Maar robots op missies naar manen in een baan rond Saturnus of Jupiter zijn te ver weg om tijdig commando's van de aarde te ontvangen. Onderzoekers aan de University of Illinois in Urbana-Champaign ontwikkelden een nieuwe, op leren gebaseerde methode. Hiermee kunnen robots op buitenaardse lichamen zelf beslissingen nemen over waar en hoe ze terreinmonsters kunnen opscheppen.

Leren scheppen

In plaats van te simuleren hoe elk mogelijk type steen of korrelig materiaal moet worden opgeschept, hebben de onderzoekers een nieuwe manier gecreëerd voor autonome landers om te leren snel te leren scheppen op een nieuw materiaal dat het tegenkomt. De robot leert ook hoe hij zich moet aanpassen aan veranderende landschappen en hun eigenschappen, zoals de topologie en de samenstelling van de materialen.

Met behulp van de nieuwe methode kan een robot met weinig pogingen leren hoe hij een nieuw materiaal moet opscheppen. Als hij verschillende slechte pogingen doet, leert hij dat het niet in dat gebied moet scheppen en zal hij het ergens anders proberen.

Training

Het voorgestelde Gaussiaanse procesmodel wordt met diepe meta-learning getraind op een offline database met gecontroleerde implementatiehiaten. De trainingsset splitst zich herhaaldelijk op in gemiddelde training en kernel-training. Het model leert kernelparameters om de residuen van de gemiddelde modellen te minimaliseren. Bij de implementatie gebruikt de beslisser het getrainde model en past het aan de online verkregen gegevens aan.

Een van de uitdagingen voor dit onderzoek is het gebrek aan kennis over oceaanwerelden zoals Europa. Voordat de mens recente rovers naar Mars stuurde, gaven orbiters behoorlijk goede informatie over de terreinkenmerken. Maar het beste beeld dat we van Europa (een van de manen van Jupiter) hebben, heeft een resolutie van 256 tot 340 m per pixel. Dat is niet voldoende om kenmerken vast te stellen. We weten dat het oppervlak van Europa ijs is, maar het kunnen grote ijsblokken zijn of veel fijner, zoals sneeuw. We weten ook niet wat er onder het ijs zit.

Bij sommige proeven verborg het team materiaal onder een laag van iets anders. De robot ziet alleen het bovenste materiaal en denkt dat het misschien goed is om op te scheppen. Als het daadwerkelijk de onderste laag opschept en raakt, leert het dat het niet uit te scheppen is en gaat het naar een ander gebied.

Batterijen

De gebruikte robot is gemodelleerd naar de arm van een lander met sensoren om schepgegevens te verzamelen over een verscheidenheid aan materialen, van zandkorrels van 1 millimeter tot stenen van 8 centimeter. Ook werden verschillende volumematerialen zoals versnipperd karton en verpakkingschips getest. De resulterende database in de simulatie bevat 100 kennispunten voor elk van de 67 verschillende terreinen, of in totaal 6.700 records. Het model dat het team heeft gemaakt, zal worden ingezet bij het Ocean World Lander Autonomy Testbed van NASA's Jet Propulsion Laboratory.

NASA wil liever op batterijen werkende rovers naar Europa sturen dan op kernenergie. Behalve om missiespecifieke overwegingen is het van cruciaal belang om het risico van besmetting van werelden met potentieel gevaarlijke materialen te minimaliseren. Kernvoedingen hebben een levensduur van maanden, batterijen hebben een levensduur van ongeveer twintig dagen. Onderzoekers kunnen het zich niet veroorloven om een paar uur per dag te wijden aan het heen en weer sturen van berichten. Dit is nog een reden waarom de autonomie van de robot om zelf beslissingen te nemen van vitaal belang is.

Waarde

De waarde van dit onderzoek ligt in het aanpassingsvermogen en de overdraagbaarheid van kennis of methoden van de aarde naar een buitenaards lichaam. Onderzoekers zullen niet over veel informatie beschikken voordat de lander op het hemellichaam aankomt. Door de korte levensduur van de batterij is er niet veel tijd voor het leerproces. De lander kan slechts een paar dagen blijven bestaan en dooft dan uit, dus autonoom leren en beslissingen nemen is buitengewoon voordelig.

Door deze nieuwe methode van leren kan de robot vision en weinig online ervaring te gebruiken om hoogwaardige schepacties uit te voeren op onbekend terrein. Dit werkt aanzienlijk beter dan niet-adaptieve methoden en andere state-of-the-art meta-leermethoden. De onderzoekers hebben de data van granulaire media open source gemaakt op Github. Ze hebben ook code geschreven om eenvoudig toegang te krijgen tot de dataset, zodat anderen deze in hun applicaties kunnen gebruiken.

De wetenschappelijke publicatie vindt u hier.

Foto: Grainger College of Engineering, University of Illinois, Urbana-Champaign