Spoločnosť OpenAI predstavila nový nástroj Operator, ktorý je poháňaný modelom Computer-Using Agent (CUA). Ide o prelomovú technológiu, ktorá kombinuje vizuálne schopnosti modelu GPT-4o s pokročilým logickým uvažovaním pomocou učenia. CUA dokáže pracovať s grafickými užívateľskými rozhraniami (GUI) rovnako ako človek – interaguje s tlačidlami, menu či textovými poliami bez potreby špecifických API.
CUA funguje na princípe spracovania obrazových dát z obrazovky počítača, čím dokáže porozumieť aktuálnemu stavu, a následne používa virtuálnu myš a klávesnicu na vykonávanie úloh. Vďaka tomu zvláda viacstupňové procesy, dokáže sa prispôsobiť nečakaným zmenám a korigovať chyby počas vykonávania úloh. Táto univerzálnosť otvára dvere pre nové možnosti jej aplikácie v digitálnom svete.
Operator: Výkonnosť modelu CUA
Model dosahuje vynikajúce výsledky v benchmarkoch pre používanie počítačov a prehliadačov. Na testovacej platforme OSWorld dosiahol úspešnosť 38,1 %, čo je výrazné zlepšenie oproti predchádzajúcim modelom (ktoré dosahovali maximálne 22 %). Pri webových úlohách získal 58,1 % úspešnosti na WebArena a 87 % na WebVoyager, čo ukazuje jeho schopnosti zvládať rozmanité digitálne prostredie.

Ako to funguje?
Agent pracuje v opakujúcom sa cykle pozostávajúcom z troch hlavných krokov:
- Vnímanie: Spracúva snímky obrazovky, aby pochopil aktuálny stav systému
- Uvažovanie: Používa metódu reťazových myšlienok na plánovanie ďalších krokov, a to na základe aktuálnych a predchádzajúcich akcií
- Akcia: Vykonáva úlohy ako klikanie, posúvanie či písanie, pričom pri citlivých akciách, ako zadávanie hesiel, vyžaduje potvrdenie používateľa

- Prelomový bioplast, ktorý degraduje rýchlejšie než papier
- Obojsmerné nabíjanie elektromobilov výrazne ušetrí financie veľkým mestám
- AI už o pár rokov zautomatizuje až 30 % pracovných hodín

Operator je dostupný momentálne na vyskúšanie pre Pro používateľov v USA na stránke operator.chatgpt.com. OpenAI kladie dôraz na bezpečnosť, pričom model získava spätnú väzbu na zlepšenie ochrany a funkcionality. Nový model CUA tak približuje integráciu funkcií umelej inteligencie do každodenného sveta.
Zdroj: OpenAI