niedziela, 5 lipca 2026

Nowości

Agenty przeglądarkowe stają się osobną kategorią

Agenty AIPatryk Raba1 lipca 2026

Czat, który tylko odpowiada, to już wczorajszy standard.

Spis treści
  1. Wyścig gigantów
  2. Przyziemne zastosowania
  3. Granice zaufania
  4. Realia polskiego użytkownika

Czat, który jedynie odpowiada, to już wczorajszy standard. Agent przeglądarkowy sam otwiera stronę, klika przyciski, wypełnia formularze i przechodzi przez koszyk, wykonując zadanie zamiast opisywać, jak je wykonać. Z rozmówcy, który tłumaczy krok po kroku, zmienia się w wykonawcę, który po prostu robi. Ta pozornie drobna różnica przesuwa całą kategorię narzędzi w nowe miejsce.

Mechanika jest prostsza, niż się wydaje, i właśnie dlatego robi wrażenie. Agent patrzy na stronę mniej więcej tak jak człowiek: analizuje zrzut ekranu albo strukturę witryny, decyduje, gdzie kliknąć, wykonuje ruch i sprawdza, co się zmieniło. Powtarza tę pętlę aż do celu. Zamiast korzystać z gotowego interfejsu programistycznego, obsługuje zwykłą przeglądarkę, więc radzi sobie także tam, gdzie żaden serwis nie udostępnił łącza dla maszyn.

Wyścig gigantów

O tę kategorię biją się najwięksi. OpenAI pokazało agenta obsługującego przeglądarkę, Anthropic dało modelowi zdolność sterowania całym komputerem, Perplexity wypuściło własną przeglądarkę z wbudowanym asystentem, a Google rozwija swojego agenta do zadań w sieci. Każdy działa nieco inaczej i inaczej rozkłada akcenty między wygodę a kontrolę, ale cel jest wspólny: przejąć od użytkownika nudne, powtarzalne klikanie.

Twardych liczb dostarczają benchmarki. Testy takie jak WebVoyager czy WebArena mierzą, jak często agent poprawnie domyka realne zadanie na żywej stronie, i choć najlepsze modele przeskoczyły w nich w ostatnim roku o kilkadziesiąt punktów procentowych, wciąż potykają się o część zadań, które człowiek załatwia bez namysłu. Do tego dochodzi koszt: dłuższe sesje z wieloma krokami zużywają sporo mocy, więc dostawcy wpuszczają agentów zwykle w droższych planach albo z limitem działań.

Przyziemne zastosowania

Zastosowania są za to bardzo przyziemne. Porównanie cen ubezpieczenia w kilku serwisach, umówienie wizyty, wyciągnięcie danych z dziesięciu podstron do jednej tabeli, zebranie ofert noclegów na wybrany termin, wszystko to agent robi w tle, gdy użytkownik zajmuje się czymś innym. Największą oszczędność daje przy zadaniach powtarzalnych, rozłożonych na wiele kroków i rozsianych po różnych stronach, czyli dokładnie tam, gdzie człowiek najszybciej się nudzi i najłatwiej myli.

Granice zaufania

Rynek studzi jednak własny entuzjazm. Efektowne pokazy potrafią przesłonić fakt, że agent wciąż bywa zawodny: gubi się na nietypowym układzie strony, utyka na oknie zgody na pliki cookie, nie radzi sobie z zabezpieczeniem CAPTCHA pomyślanym właśnie po to, żeby odróżnić człowieka od maszyny. W praktyce najlepiej sprawdza się jako pomocnik do konkretnych, powtarzalnych przepływów, a nie uniwersalny zastępca, który ogarnie dowolne zlecenie z marszu.

Najpoważniejsze pytanie dotyczy zaufania. Agent, który ma dostęp do konta, skrzynki i karty płatniczej, przy jednym niejasnym poleceniu potrafi kliknąć o krok za daleko. Dochodzi do tego całkiem nowa klasa zagrożeń: spreparowana strona może ukryć w treści instrukcję, którą agent weźmie za polecenie użytkownika i na przykład wyśle dane albo zatwierdzi zakup. Dostawcy odpowiadają na to potwierdzeniami przy płatnościach i twardymi granicami uprawnień, ale ciężar czujności wciąż w dużej części spoczywa na człowieku.

Realia polskiego użytkownika

Polski użytkownik szybko natrafi na lokalne bariery. Formularze urzędowe, logowanie przez profil zaufany, bankowość z dodatkowym potwierdzeniem w aplikacji, to wszystko elementy zaprojektowane tak, by ostatni krok wykonał świadomie człowiek, a nie automat. To akurat zdrowe ograniczenie. Realny zysk polski czytelnik znajdzie prędzej w żmudnym researchu, porównywaniu ofert i zbieraniu danych z wielu stron niż w oddawaniu agentowi finalnego kliknięcia przy przelewie.

Agenty przeglądarkowe okrzepły na tyle, że przestały być ciekawostką dołączaną do czatu, a stały się osobną kategorią z własnymi narzędziami, cennikami i benchmarkami. Wygoda będzie rosła, ale razem z nią rośnie lista rzeczy, które trzeba agentowi jasno zabronić. Rozsądny model korzystania jest dziś taki jak wobec nowego, zdolnego stażysty: dać mu powtarzalną robotę, ograniczyć dostęp do tego, co wrażliwe, i sprawdzać efekt, zanim zrobi coś nieodwracalnego.

Udostępnij: