Hoe voed je een driejarige robot op?

Amerikaanse onderzoekers ontwikkelen een leerrobot die meerdere vaardigheden onder de knie kan krijgen.

Mensen zijn sociale wezens en leren al op jonge leeftijd van elkaar. Baby's observeren hun ouders, broers en zussen of verzorgers scherp. Ze kijken, imiteren en herhalen wat ze zien om vaardigheden en gedrag te leren. De manier waarop baby's leren en hun omgeving verkennen, inspireerde onderzoekers van Carnegie Mellon University in Pittsburgh en Meta AI tot het ontwikkelen van een nieuwe manier.

Ze leren robots hoe ze tegelijkertijd meerdere vaardigheden kunnen leren en deze kunnen gebruiken om ongeziene, alledaagse taken uit te voeren. De onderzoekers wilden een gerobotiseerde AI-agent ontwikkelen met manipulatiemogelijkheden die vergelijkbaar zijn met die van een driejarig kind.

RobotAgent

Het team heeft RoboAgent aangekondigd, een kunstmatige intelligentie agent. Deze gebruikt passieve observaties en actief leren waarmee een manipulatievaardigheden kan verwerven die vergelijkbaar zijn met die van een peuter. Volgens de onderzoekers is RoboAgent een mijlpaal in de richting van algemene robotagenten die efficiënte leerlingen zijn. Ze zullen effectief zijn in nieuwe situaties en hun gedrag in de loop van de tijd kunnen uitbreiden.

De huidige robots zijn gespecialiseerd en getraind voor afzonderlijke individuele taken. De onderzoekers wilden we een enkele kunstmatige intelligentie agent maken die een breed scala aan vaardigheden in onbekende scenario's kan vertonen. RoboAgent leert als menselijke baby's, gebruikmakend van een combinatie van overvloedige passieve observaties en beperkt actief spel.

Vaardigheden

RoboAgent kan nu twaalf manipulatievaardigheden in verschillende scènes voltooien. Dit onderzoek wijst in de richting van een robotachtig leerplatform dat kan worden aangepast aan veranderende omgevingen. In tegenstelling tot eerder onderzoek demonstreerde het team zijn werk in echte omgevingen, niet in simulatie. En het team deed dit met veel minder data dan eerdere projecten.

De agent van het team leert door een combinatie van eigen ervaringen en passieve observaties in internetdata. Zoals een ouder hun kind zou begeleiden, boden onderzoekers de robot op afstand taken aan om het nuttige eigen ervaringen te voeden. De effectiviteit en efficiëntie van deze aanpak komen voort uit een nieuwe architectuur waarmee de agenten zelfs met beperkte ervaringen kunnen redeneren. RoboAgent reageert op gespecificeerde tekst- en visuele doelen door beslissingen te voorspellen en samen te voegen in termen van kleine stukjes beweging, in plaats van veelgebruikte acties per tijdstap.

Leren

Robots leren vooral van hun eigen ervaringen, niet van wat passief om hen heen gebeurt. Deze inherente blindheid voor wat er in hun omgeving gebeurt, beperkt zowel de diversiteit aan ervaringen waaraan robots worden blootgesteld als hun vermogen om zich aan nieuwe situaties aan te passen. Om deze beperkingen te overwinnen, leert RoboAgent van video's op internet. Dit is vergelijkbaar met hoe baby's kennis en gedrag verwerven door passief hun omgeving te observeren.

RoboAgent maakt gebruik van de informatie in video's om eerder te leren hoe mensen omgaan met objecten en verschillende vaardigheden gebruiken om taken met succes uit te voeren. Bovendien kunnen agenten door het observeren van vergelijkbare vaardigheden in meerdere scenario's leren wat wel en niet nodig is om een taak te voltooien. Ze maken gebruik van deze lessen wanneer het wordt gepresenteerd met onbekende taken of ongeziene omgevingen.

Data

Een agent die dit soort dingen kan leren, brengt ons dichter bij een algemene robot. Deze kan een verscheidenheid aan taken in verschillende ongeziene omgevingen uitvoeren en voortdurend evolueren naarmate hij meer ervaringen opdoet. RoboAgent kan een robot snel trainen met behulp van beperkte data binnen het domein, terwijl de robot voornamelijk vertrouwt op overvloedig beschikbare gratis data van internet om een verscheidenheid aan taken te leren. Dit zou robots nuttiger kunnen maken in ongestructureerde omgevingen zoals huizen, ziekenhuizen en andere openbare ruimtes.

Het team maakt gebruik van zijn getrainde modellen, codebase, hardware stuurprogramma's en met name de volledige dataset die voor dit onderzoek is verzameld. RoboSet is de grootste openbaar beschikbare dataset over robotica op basis van hardware. Het team hoopt dat anderen deze gebruiken, aanpassen en doorgeven, wat in de loop van de tijd kan leiden tot een werkelijk fundamentele algemene robotagent.

Foto: Carnegie Mellon University