OpenAI wprowadza Codex dla Chrome, przenosząc agentów AI bezpośrednio do przeglądarki

AI Models10.May.2026 03:554 min read

OpenAI wprowadziło rozszerzenie Codex dla Google Chrome, które umożliwia agentowi AI działanie bezpośrednio w zalogowanych sesjach przeglądarki użytkownika, rozszerzając automatyzację z izolowanych środowisk na rzeczywiste przepływy pracy w sieci na systemach macOS i Windows.

OpenAI wprowadza Codex dla Chrome, przenosząc agentów AI bezpośrednio do przeglądarki

OpenAI uruchomiło nowe rozszerzenie Chrome dla Codex, co stanowi istotny krok w ewolucji agentów AI — od asystentów opartych na czacie do narzędzi zdolnych do działania bezpośrednio w przeglądarkach użytkowników. Rozszerzenie, dostępne na macOS i Windows, umożliwia Codex interakcję z aktywnymi, zalogowanymi stronami internetowymi — rozszerzając jego możliwości poza środowiska sandboxowe i dedykowane integracje, na których wcześniej polegał.

Od automatyzacji w sandboxie do dostępu do rzeczywistej sieci

Do tej pory Codex wykonywał zadania głównie za pośrednictwem wbudowanej przeglądarki sandbox oraz rosnącej biblioteki dedykowanych integracji z usługami takimi jak GitHub, Slack, Figma i Notion. Choć rozwiązanie to było skuteczne w wielu przepływach pracy, miało ograniczenia w sytuacjach wymagających dostępu do uwierzytelnionej sesji użytkownika.

Nowe rozszerzenie Chrome eliminuje tę lukę. Za zgodą użytkownika Codex może działać bezpośrednio w Chrome, wykonując czynności na zalogowanych platformach takich jak LinkedIn, Salesforce i Gmail. Ta zmiana pozwala agentowi AI obsługiwać procesy zależne od rzeczywistych danych uwierzytelniających użytkownika oraz dynamicznych treści internetowych.

W przypadku stron publicznych lub niewymagających logowania użytkownicy mogą nadal korzystać z wbudowanej przeglądarki Codex, która izoluje zadania związane z lokalnym rozwojem i podglądem plików od ich osobistych profili Chrome.

Trójwarstwowy system narzędzi

OpenAI informuje, że Codex dynamicznie wybiera teraz między trzema warstwami wykonawczymi w zależności od zadania:

  • Dedykowane integracje — gdy dostępne są oficjalne lub wyspecjalizowane wtyczki.
  • Sterowanie przeglądarką Chrome — w przypadku zadań wymagających aktywnego, zalogowanego środowiska.
  • Wbudowana przeglądarka sandbox — do interakcji z publiczną siecią lub operacji na hoście lokalnym.

Użytkownicy mogą jawnie wywołać narzędzie przeglądarki za pomocą prostego polecenia (np. @Chrome), ale Codex może także automatycznie określić, które narzędzie najlepiej nadaje się do danego zadania.

Wydajność: lepsze wyniki w złożonych procesach

Wstępne testy sugerują, że Codex dla Chrome przynosi mieszane, lecz obiecujące rezultaty. W stosunkowo prostych zadaniach — takich jak organizowanie kart przeglądarki — agent czasami ma trudności z precyzyjnym rozpoznawaniem elementów. Jednak jego wydajność wyraźnie poprawia się wraz ze wzrostem złożoności i liczby etapów procesu.

W ocenach obejmujących uporządkowane pozyskiwanie informacji, porównania produktów wielu marek, generowanie pomysłów na treści oraz automatyczne tworzenie raportów Codex wykazał lepszą koordynację między etapami i wyższy wskaźnik ukończenia zadań. Wzorzec ten sugeruje, że choć precyzyjna kontrola interfejsu nadal wymaga udoskonalenia, system dobrze radzi sobie z orkiestracją większych, proceduralnych zadań.

Działanie równoległe i świadomość kontekstu

Rozszerzenie obsługuje kilka zaawansowanych funkcji, w tym testowanie aplikacji webowych, zbieranie kontekstu z otwartych kart oraz korzystanie z Chrome Developer Tools równolegle, podczas gdy użytkownicy kontynuują inną pracę. Codex działa w dedykowanych grupach kart, aby nie zakłócać aktywnych sesji przeglądania.

Prywatność, uprawnienia i ograniczenia regionalne

Ponieważ rozszerzenie wykonuje złożone działania w przeglądarce, wymaga szerokich uprawnień w Chrome. OpenAI wdrożyło mechanizmy potwierdzania na poziomie witryny, aby ograniczyć ryzyko bezpieczeństwa i zapewnić użytkownikom bardziej szczegółową kontrolę.

Według firmy dane przeglądania są przechowywane tylko wtedy, gdy użytkownicy wyraźnie dodadzą aktywność przeglądarki do kontekstu czatu. Jeśli funkcja pamięci jest wyłączona, każde zadanie przeglądarkowe pozostaje odizolowane od poprzednich sesji.

Rozszerzenie jest obecnie niedostępne w Unii Europejskiej i Wielkiej Brytanii. OpenAI nie podało szczegółów dotyczących ewentualnego rozszerzenia dostępu regionalnego.

Krok w stronę agentów AI na poziomie systemowym

Premiera podkreśla szerszą zmianę w branży: systemy AI wychodzą poza interfejsy konwersacyjne i wchodzą w bezpośrednią interakcję ze środowiskami oprogramowania. Integrując Codex z Chrome, OpenAI pozycjonuje agenta jako półautonomicznego cyfrowego operatora zdolnego do poruszania się po rzeczywistych procesach internetowych.

Na ten moment Codex dla Chrome należy postrzegać raczej jako nadzorowanego asystenta niż w pełni autonomicznego agenta, szczególnie w wrażliwych lub wymagających wysokiego poziomu bezpieczeństwa kontekstach. Jednak wraz ze wzrostem niezawodności kontroli na poziomie przeglądarki wykonywanie zadań przez AI w codziennych narzędziach może zmienić sposób, w jaki użytkownicy wchodzą w interakcję z siecią.