OpenAI introduceert AI-agent “Operator” voor dagelijkse taken

OpenAI heeft onlangs “Operator” gelanceerd, een AI-agent die webgebaseerde taken voor gebruikers kan uitvoeren. Deze nieuwe tool is ontworpen om door webpagina’s te bladeren, met ze te interacteren door te typen, te scrollen en op knoppen te klikken.

Functies en mogelijkheden

Operator is in staat om verschillende repetitieve taken uit te voeren:

  • Formulieren invullen
  • Boodschappen bestellen
  • Hotelreserveringen maken

Volgens OpenAI vergroot het gebruik van dezelfde interfaces en tools die mensen dagelijks gebruiken, niet alleen de reikwijdte van AI-toepassingen maar helpt het ook tijd te besparen en opent het nieuwe zakelijke mogelijkheden.

Technologie achter operator

De agent wordt aangedreven door een nieuw model, de Computer-Using Agent (CUA), dat:

  • GPT-4o’s visuele capaciteiten combineert met geavanceerd redeneren via reinforcement learning.
  • Via screenshots informatie waarneemt en menselijke acties nabootst met behulp van muis en toetsenbord.

CUA is getraind om te vragen om bevestiging voordat het belangrijke acties onderneemt, zoals het verzenden van e-mails of het boeken van hotels, wat een extra laag van veiligheid en controle biedt.

Huidige status en toekomstplannen

  • Onderzoeksversie: Operator is momenteel in een voorlopige onderzoeksversie beschikbaar, bedoeld om te worden verbeterd door gebruikersfeedback.
  • Beschikbaarheid: Alleen toegankelijk voor ChatGPT Pro-abonnees in de VS, voor $200 per maand, via een speciale bron.
  • Verbeterpunten: De agent is nog niet perfect en zal de gebruiker vragen om over te nemen als er problemen optreden.

Context in de AI-markt

Het is vermeldenswaard dat Anthropic, een andere AI-startup, in oktober 2024 een geüpdatete versie van hun Claude 3.5 Sonnet-model uitbracht, dat vergelijkbare interactieve functies met computers biedt, zoals cursorbeweging, knoppen aanklikken en tekst invoeren.

De introductie van Operator door OpenAI markeert een stap voorwaarts in de ontwikkeling van AI-agenten die dagelijkse taken kunnen automatiseren, wat potentiële impact kan hebben op hoe we interacteren met digitale omgevingen.