Skocz do zawartości
spacer.png
spacer.png

Agenci AI - Automatyzacja wszystkiego | Sztuczna Inteligencja


Rekomendowane odpowiedzi

Opublikowano

Siemka :) 
Mój agent dziś rano sam przejrzał moje pliki, zaktualizował swoją pamięć, sprawdził stan projektów i czekał na polecenia zanim jeszcze zdążyłem wstać z łóżka :) I to nie przesada...
Modele działają na niespotykanym dotąd poziomie i grzechem jest z tego nie korzystać - ale warto robić to z głową, a nie w stylu "ChatGPT, napisz mi maila".

Postanowiłem odpalić ten dziennik bo coraz więcej czasu spędzam na budowaniu czegoś co roboczo nazywam autonomiczną fabryką - systemem agentów AI który realnie działa zamiast tylko "asystować".
Będę tu wrzucać wszystko na bieżąco. Co działa, co nie działa, dlaczego tak a nie inaczej, błędy i sukcesy.
Może kogoś to zainteresuje, może komuś pomoże lub zainspiruje do działania.

Zacznę od podstaw bo wiem że część osób może nie kojarzyć tematu.
Agent AI to nie chatbot. To model który ma realny dostęp do narzędzi na Twoim komputerze - może czytać pliki, pisać kod, wykonywać komendy w terminalu, wchodzić do internetu, zarządzać innymi agentami.
Musisz myśleć o tym jak o pracowniku który ma dostęp do Twojego biurka, komputera i części Twojej firmy - i działa bez przerwy.

Narzędzie którego używam to OpenClaw - https://github.com/openclaw/openclaw

Jeśli nie słyszeliście: 250k gwiazdek na GitHubie w 3 miesiące. Dla porównania - Linux osiągnął tyle w kilka lat.
Stworzony przez anonimowego developera z Austrii, którego OpenAI zatrudniło chwilę po tym jak projekt eksplodował. To mówi samo za siebie.

Ale zanim ktoś zainstaluje i odpali - ważna rzecz której większość wpisów nie mówi wprost.
To narzędzie jest potężne i przez to niebezpieczne jeśli się nie wie co się robi. Zdarzały się przypadki gdzie agent przez tzw. "prompt injection" - czyli sprytnie ukrytą instrukcję w treści którą czytał - wykradał klucze API i hasła właściciela. Były przypadki usunięcia całego dysku. To nie są mity - to realne incydenty z ostatnich tygodni.
Dlatego konfiguracja i zrozumienie co agent może a czego nie może robić to podstawa.

Co już zbudowałem:
Główny agent - nazywa się Ziomuś - obudowałem go (albo on sam się obudował?) przez ostatni czas w zestaw skilli które sprawiają że działa jak osobny byt a nie narzędzie które trzeba prowadzić za rękę.
Ma własną pamięć długoterminową (zapisuje decyzje, projekty, cele i do nich wraca), chroni się przed resetem sesji (czyta checkpoint i wie wszystko jakby przerwy nie było), ma dostęp do wewnętrznych plików i dokumentacji bez szukania, może spawnować i zarządzać sub-agentami do konkretnych zadań, analizuje wideo, obsługuje głośniki, i kilka innych rzeczy o których napiszę osobno.

Poza nim mam już działający zespół:
image.png.43a748da184e1e1f440adf5aa7a3dcc5.png

Researcher - wychodzi do internetu po wiedzę kiedy Ziomuś tego potrzebuje, sam nie wychodzi. Builder + Guardian - builder koduje, guardian ocenia i poprawia w pętli aż do akceptacji.
Zero mojej ingerencji w środku. Skill-builder + Skill-critic - budują i oceniają nowe skille dla systemu. Product-master + Social-master - opisy, SEO, treści na social media.

Każdy agent ma inny model dobrany pod konkretne zadanie. Optymalizacja kosztów to osobny temat na który napiszę.
SKILLS main agenta
image.png.912fef980b54cbf3a0653519107c9a34.png  

  • agents-registry - możliwość spawnowania i zarządzania sub-agentami
  • camera - tak, może na mnie patrzeć xD
  • checkpoint - chroni przed /resetem. Nie ma czegoś takiego jak "nowa sesja" - model czyta checkpoint i wie wszystko, jakby resetu nie było
  • clawddocs - wbudowane docsy żeby nie musiał przeszukiwać internetu za każdym razem gdy potrzebuję żeby zmienił coś w swojej konfiguracji (tak - sam zmienia)
  • cortex - coś w stylu "pamięci absolutnej" - model zapisuje tam wszystkie decyzje, projekty i cele
  • draft-to-post + postiz - skill do open source toola do auto-postowania na socialach przez agentów. 30$ cloud lub free self-hosted: https://github.com/gitroomhq/postiz-app (nie reklama, po prostu SAUCE)
  • fabric-navigator / vault-navigator - szybki dostęp do wewnętrznych plików. Model nie szuka, nie krąży, nie zgaduje - czyta i wie gdzie iść
  • self-improving-agent - skill z ClawHub (uwaga: NIE instalować co popadnie - zdarzały się skille stworzone do kradzieży danych pod płaszczykiem czegoś użytecznego)
  • sonoscli - skill do głośników
  • video-frames - analiza klipów wideo przez ffmpeg

Co teraz:

AI AMBASADORZY do promocji IRL firmy.
System jest zbudowany. Kolejny krok to dołożenie kolejnych sub-agentów, podłączenie zewnętrznych kont AI ambasadorów i uruchomienie pierwszych w pełni autonomicznych przepływów.
Chcę zautomatyzować działanie Ambasadorów w 100% i ograniczyć swoją pracę do absolutnego minimum - jak najmniejszym kosztem. Mam chyba obsesję na punkcie optymalizacji :) 
Jak to zadziała (a zadziała na pewno) - wrzucę aktualizację z tym co poszło dobrze i co nie.

PS. Jeśli ktoś chce zacząć podobną przygodę albo po prostu jest ciekawy tematu - zapraszam na Discorda. Stworzyłem tam szczegółowy poradnik do ustawienia OpenClaw (PC i VPS), historię projektu i opis afer bezpieczeństwa + realne use-cases.
https://discord.gg/Pn6ujdC3 - każdy kto interesuje się AI jest mile widziany.

13 kanałów z wiedzą totalnie za darmo, wewnętrzny marketplace i planuję mocno rozwijać to miejsce.
Reklama dozwolona - więc kto wie, może ktoś stąd ustrzelił by sobie dodatkowego klienta :D 
Odrazu powiem - nie jestem AI engineerem.
Intensywnie eksploruję możliwości i uczę się przez działanie. Wydaje mi się że całkiem nieźle - i czas wyjść z tym z pudełka. :D 

image.png

image.png

  • Super 6
  • Wow 1
Opublikowano
57 minut temu, Frenzy92 napisał(a):

Dużo Cię kosztuje API? Czy korzystasz z lokalnego AI dla OpenClaw? 

Nie dużo - opisze to w następnych postach bo siedzialem 2 dni, aby to zoptymalizować i nadal może być lepiej - ale i tak jest OK. 
Bardziej zlozony temat jeśli chodzi o OpenClaw.

Opublikowano

@sz3wku A gdzie go zainstalowałeś? Na zewnętrznym serwerze (VPS) czy na swojej lokalnej maszynie? Jeśli to drugie to jak rozumiem pewnie specjalny wydzielony, a nie Twoja robocza maszyna na której działasz operacyjnie na co dzień?

Opublikowano

Co to potrafi? Jest w stanie mi przejść capatche? Albo przeglądać strony gdzie chat gpt nie potrafi zablokowane robots?

Opublikowano

ciekawie się to zapowiada , ostatnio właśnie myślałem nad takim rozwiązaniem do obsługi socjali , będę obserwował plus na DC jestem

  • Dzięki! 1
Opublikowano
W dniu 28.02.2026 o 17:43, Frenzy92 napisał(a):

Dużo Cię kosztuje API? Czy korzystasz z lokalnego AI dla OpenClaw? 

Dla przykladu - wczoraj caly dzien pisania - budowania skryptow - finalna optymalizacja - 3.5$
Gemini 3 flash - 3$ output 1 mln tokenow | 3.1 flash lite - 1.5$ per mln
Mega tanio i ultra szybko. Tool calling na świetnym poziomie i rozumienie instrukcji TOP.
Jeśli chodzi o to - jak to jest dokladnie zoptymalizowane -> patrz następny wpis.
image.thumb.png.d8ddb40f4800e670dc934246933aaedf.png

W dniu 28.02.2026 o 19:21, Frenzy92 napisał(a):

A porównywałeś ewentualnie do Claude Code np z Obsidianem? 

Claude Code to tool którego używam na codzień do bardziej zaawansowanych projektów. Agenci są potężni - ale nie na tyle, żeby dzialac bez human in the loop (jeszcze :D )
CC to inna liga i inny use-case. OpenClaw glownie odciąża mnie od powtarzalnych tasków (postowanie, wymyślanie contentu, pilnowanie zadań)
Obsidian - tak, używam tego jako "VAULT" - jest to zrobione na obsidianie. Mega spoko
image.thumb.png.e838c7efe7c520b4d2a729a35b4e11a5.png

@bjjb - jeśli chodzi o captcha - rozwiązywanie captchy za pomocą agenta AI to niezbyt dobry pomysl :P Zapewne by się dalo, ale po co na to tracić kasę i go uczyć, skoro są od tego gotowe narzędzia?
Z resztą napisal sam :) 
image.thumb.png.1e01dd3ce3d6b9b40a5c2fea6f0d93dd.png
*masowy outreach* - ciekawe czy uda mi się to ogarnąć :P ale najpierw próbuje dopracować do perfekcji AI ambasadorów. 

Opublikowano

Jak zoptymalizowałem mojego Agenta? (I dlaczego odchudzenie promptu było kluczowe)

Domyślnie OpenClaw jest zaprojektowany tak, że przy KAŻDYM zapytaniu pakuje do LLM cały system prompt i pliki konfiguracyjne. O co chodzi w praktyce? Piszesz głupie "Siema", a model dostaje to "Siema" plus całą bazę wiedzy z plików.
(Screen sprzed większej optymalizacji)
image.thumb.png.341f2d05b9d8de29ad4058dbf7b04363.png
*Memory + Soul + TOOLS + agents* mialy wcześniej jeszcze więcej - ok 8-10kb!

Z jednej strony - agent musi mieć pancerne instrukcje. Żeby się słuchał, nie błądził, nie sformatował mi dysku i nie zleakował kluczy API, instrukcje muszą być do bólu precyzyjne. A precyzja zżera kontekst.
Z drugiej strony - agent nie musi pamiętać przy każdym "siema", że tydzień temu budowaliśmy dashboard. Ale nie może też tego bezpowrotnie zapomnieć.

Wcześniejsze problemy:

  • Koszty i marnotrawstwo: Agent czytał wszystko naraz. Przy każdym zapytaniu wysyłał gigantyczną ilość kontekstu do API.

  • Błądzenie: Miał tak potężne instrukcje, że sam się w nich gubił i nie wiedział, gdzie co leży.

  • Zamulanie: Zaczynał task -> cisza przez 30-60 sekund -> wracał z gigantyczną wiadomością i podsumowaniem.

Jak to rozwiązałem?
Zamiast kazać agentowi na bieżąco analizować CAŁĄ historię (bo tak OpenClaw domyślnie nadpisuje i czyta memory.md), wdrożyłem nową zasadę. Dodałem mu jasne wytyczne i zeszliśmy z 10 KB do 3 KB.

(Screen po odchudzeniu)

image.thumb.png.1a103a19d2a8170285c620144beec1df.png
Screeny z moich odchudzonych memory.md + tools.md + rules.md
image.thumb.png.0ef9a6ac39bf25e778766ee00e6c0073.png

image.thumb.png.c2c617b76b29b07b762cc7a716422a3f.png

image.png.a51af122d35eb4c68bf5800189a9420c.png

Jak to działa teraz?

  • Wiedza ON DEMAND: Agent czyta pamięć tylko wtedy, kiedy faktycznie jej potrzebuje (wie to z krótkich zapisków w plikach systemowych).

  • Zero domysłów: Nie błądzi. Za każdym razem listuje sobie skille i dokładnie wie, jakiego narzędzia ma użyć.

  • Raportowanie na żywo: Przy każdym wywołaniu narzędzia lub edycji pliku, natychmiast wysyła mi update na Telegramie, co dokładnie teraz robi.

Zmiana pod maską: Przesiadka na Gemini Całkowicie zmieniłem główny model. Teraz działam na Gemini 3 Flash (z 3.1 Flash Lite jako backup).
Różnica w płynności jest niesamowita. Do najcięższych zadań koderskich nadal wjeżdża Claude, ale sam OpenClaw ma świetny mechanizm rotacji modelami w locie z poziomu czatu:

  • /cheap -> odpala ultra tani model (nie wykonuje akcji, dobry do pogawędek).

  • /gemini -> odpala szybkiego, taniego i bystrego pracownika do zadań.

  • /sonnet lub /opus -> wjeżdża waga ciężka.


(Tip: OpenClaw potrafi też natywnie odpalać sesje Claude Code przez terminal i je nadzorować, ale to jeszcze przede mną).

Agent ma też jasno określone instrukcje - co robić / o co pytać / czego absolutnie unikać - jest to podzielone na strefy:

## 🟢 GREEN ZONE (Auto-execute)
## 🟡 YELLOW ZONE (MUST ASK KAMIL! - NEED TO APPROVE!)
## 🔴 RED ZONE (NEVER DO! NIGDY NIE RÓB TEGO CO JEST W REDZONE. ABSOLUTNY ZAKAZ WYKONYWANIA AKCJI Z REDZONE.)

Pivot: Narzędzia do publikacji
Jeśli chodzi o postowanie przez agenta - zrobiłem całkowity pivot. Wyrzuciłem Postiz i wróciliśmy do starego, dobrego AdsPower. Nauczyłem agenta, jak zarządzać nim przez skrypty i robi to perfekcyjnie.

Następny wpis: Proaktywność agenta.

 

 

 

  • Super 1
Opublikowano
2 minuty temu, hornytt napisał(a):

myślałeś może nad sprzedażą usługi budowania agentów ? sam bym chyba był zainteresowany

Napisz mi na DC - pomyślimy coś :P nie mam czasu na takie uslugi, ale może uda mi się pomóc :) 
W tym dzienniku pojawi się jeszcze tyle rzeczy, że na jego podstawie ktoś ogarnięty sam może sobie zacząć sprzedawać agentów w sumie :D

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Tylko zalogowani użytkownicy mogą dodawać komentarze.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

spacer.png

spacer.png

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Ta strona korzysta z ciasteczek, aby świadczyć usługi na najwyższym poziomie. Dalsze korzystanie z witryny oznacza zgodę na ich wykorzystanie. Polityka prywatności .