Onderzoekers van EPFL en TU Delft hebben het taalmodel Chat-GPT3 gebruikt om een robotgrijper te ontwikkelen voor het oogsten van tomaten.
Neurale netwerken die bekend staan als grote taalmodellen (zoals ChatGPT) kunnen grote hoeveelheden tekstgegevens verwerken en deze informatie gebruiken om vragen te beantwoorden. Ze hebben het potentieel om de manier waarop we schrijven, leren, veranderen en zelfs kunst maken, te veranderen. Onderzoekers aan de École Polytechnique Fédérale de Lausanne (EPFL) hebben de technologie toegepast op een nieuw terrein: robotontwerp. Volgens hen is het de eerste demonstratie van het potentieel van de kunstmatige intelligentietool voor samenwerking met mensen bij het ontwerpen van robots.
In een case study gebruikten onderzoekers van EPFL en de TU Delft ChatGPT om een werkende robot te ontwerpen in de vorm van een tomatenoogstmachine. De studie biedt een raamwerk voor mensen en grote taalmodellen om apparaten samen te ontwerpen. Op basis van hun ervaring beschrijven de onderzoekers de kansen en risico's van het toepassen van hulpmiddelen voor kunstmatige intelligentie (AI) op robotica. Volgens hen kunnen ze de manier waarop we robots ontwerpen veranderen en tegelijkertijd het proces verrijken en vereenvoudigen.
Hoewel ChatGPT een taalmodel is en de codegeneratie op tekst is gebaseerd, bood het model aanzienlijke inzichten en intuïtie voor fysiek ontwerp en toonde het een groot potentieel als klankbord om menselijke creativiteit te stimuleren.
In een eerste fase voerden de onderzoekers en het taalmodel een 'ideation'-discussie om het doel, de ontwerpparameters en de specificaties van hun robot te definiëren. Een tweede fase was gewijd aan het realiseren van de robot in de echte wereld, waarbij de door ChatGPT gegenereerde code werd verfijnd. Vervolgens werd het apparaat gebouwd en het functioneren ervan werd getest.
Voor de eerste fase begonnen de onderzoekers op een hoog conceptueel niveau een gesprek met het taalmodel over toekomstige uitdagingen voor de mensheid. Vervolgens identificeerden ze gerobotiseerde oogsten als een oplossing voor de uitdaging van de wereldwijde voedselvoorziening. Vervolgens maakten ze gebruik van de toegang van het taalmodel tot wereldwijde gegevens uit academische publicaties, technische handleidingen, boeken en media. Doel was het 'meest waarschijnlijke' antwoord te geven op vragen als 'welke functies moet een robotoogstmachine hebben?'
Zodra een basisrobotformaat was geïdentificeerd (een door een motor aangedreven grijper voor het vastpakken van rijpe tomaten), konden de onderzoekers meer specifieke vragen stellen. Voorbeelden zijn 'welke vorm moet de grijper hebben?'. Ook vroegen de onderzoekers ChatGPT om technische suggesties te doen, inclusief materialen en computercode voor het besturen van het apparaat.
De berekeningen zijn grotendeels gebruikt om ingenieurs te helpen bij technische implementatie. Maar voor het eerst kan een AI-systeem nieuwe systemen bedenken, waardoor cognitieve taken op hoog niveau worden geautomatiseerd. Dit kan een verschuiving van menselijke rollen naar meer technische rollen met zich meebrengen.
Naast het toekennen van de rol van 'uitvinder' aan Chat-GPT, schetsten de onderzoekers andere mogelijke samenwerkingsvormen tussen mens en taalmodel. Bij 'gezamenlijke verkenning' wordt bijvoorbeeld AI gebruikt om de expertise van onderzoekers te vergroten door brede kennis bij te dragen buiten hun eigen vakgebied. AI kan ook fungeren als 'trechter' die helpt bij het verfijnen van het ontwerpproces en het leveren van technische input, waarbij de mens de creatieve controle behoudt.
Aangezien er aan elke samenwerkingsmodus logische en ethische risico's zijn verbonden, waarschuwen de onderzoekers dat de rol van grote taalmodellen in de toekomst zorgvuldig moet worden geëvalueerd. Het gebruik ervan roept bijvoorbeeld vragen op over vooringenomenheid, plagiaat en intellectueel eigendom, omdat het onduidelijk is of een door een LLM gegenereerd ontwerp als nieuw kan worden beschouwd.
In dit onderzoek identificeerde ChatGPT tomaten als het 'meest waardevolle' gewas voor een robotoogstmachine. Het taalmodel kan echter een voorkeur hebben voor gewassen die meer in de literatuur worden behandeld en niet aan gewassen waar echt behoefte aan is. Wanneer beslissingen worden genomen buiten de kennis van de ingenieur, kan dit leiden tot aanzienlijke ethische, technische of feitelijke fouten.
Ondanks deze waarschuwingen concluderen de onderzoekers op basis van hun ervaring, dat grote taalmodellen een potentieel hebben om een kracht ten goede te zijn, mits goed beheerd. De robotica-gemeenschap moet identificeren hoe deze krachtige tools kunnen worden gebruikt om de vooruitgang van robots te versnellen op een ethische, duurzame en sociaal versterkende manier.
De wetenschappelijke publicatie vindt u hier.
Foto: Create Lab/EPFL