Een nieuw framework voor kunstmatige intelligentie verbetert de manier waarop robots taken interpreteren en uitvoeren.
Onderzoekers van Shanghai University hebben een nieuw framework voor kunstmatige intelligentie ontwikkeld dat de manier waarop robots taken interpreteren en uitvoeren, verandert. Het framework 'Correction and Planning with Memory Integration' (CPMI) maakt gebruik van grote taalmodellen (LLM's) om de efficiëntie en effectiviteit te verbeteren van robots die complexe, op instructies gebaseerde taken uitvoeren.
Traditioneel hebben robots expliciete programmering en uitgebreide data nodig om te navigeren en te interacteren met hun omgeving. Regelmatig worstelden ze met onverwachte uitdagingen of veranderingen in hun taken. Het onderzoekteam in Shanghai heeft een dynamische nieuwe aanpak geïntroduceerd die geheugen- en planningsmogelijkheden integreert binnen LLM's. Hierdoor kunnen robots zich in real-time aanpassen en leren van hun ervaringen.
Het CPMI-framework markeert een significante afwijking van conventionele methoden. Het gebruikt LLM's niet alleen als hulpmiddelen voor het verwerken van taal, maar ook als centrale besluitvormingselementen in robotische taken. Door dit innovatieve gebruik van AI kunnen robots complexe instructies opsplitsen in uitvoerbare stappen. Ze kunnen hun acties effectiever plannen en hun koers corrigeren als reactie op obstakels of fouten.
Een van de meest opvallende kenmerken van het CPMI-framework is de geheugenmodule. Deze geeft robots de mogelijkheid om eerdere taken te onthouden en ervan te leren. Deze mogelijkheid bootst het menselijk geheugen en de menselijke ervaring na. Hierdoor kunnen robots in de loop van de tijd efficiënter presteren en zich snel aanpassen aan nieuwe situaties.
Het onderzoeksteam testte het framework met behulp van de Alfred simulatieomgeving, waar het bestaande modellen overtrof in 'few shot' scenario's. Dit zijn situaties waarin robots beperkte voorbeelden hebben om van te leren. Het CPMI-framework behaalde niet alleen hogere slagingspercentages, maar liet ook significante verbeteringen zien in taakefficiëntie en aanpassingsvermogen.
Door geheugen en planning te integreren in één AI-gestuurd framework, konden robots van elke interactie leren en hun besluitvormingsprocessen continu verbeteren. Dit verbetert niet alleen hun prestaties, maar vermindert ook de behoefte aan uitgebreide voorprogrammering en dataverzameling.
De potentiële toepassingen voor het CPMI-framework zijn groot. Dit varieert van huishoudelijke robots die beter kunnen helpen bij huishoudelijke taken tot industriële robots in complexe productieprocessen. Naarmate LLM's zich blijven ontwikkelen, wordt verwacht dat de mogelijkheden van met CPMI uitgeruste robots zullen toenemen, wat zal leiden tot meer autonome en intelligente machines.
Het ontwikkelteam is optimistisch over de toekomst van robottechnologie en wil zijn framework blijven verfijnen. De volgende stappen omvatten het verbeteren van de geheugenmogelijkheden van het CPMI-framework en het testen ervan in meer diverse en uitdagende omgevingen. De onderzoekers geloven dat de technologie het potentieel heeft om niet alleen robotica te transformeren, maar elk gebied dat afhankelijk is van complexe, real-time besluitvorming.
De wetenschappelijke publicatie vindt u hier.
Ill.: Yuan Zhang, School of Future Technology, Shanghai University