Agenci AI - Automatyzacja wszystkiego | Sztuczna Inteligencja

28 Lutego

Siemka
Mój agent dziś rano sam przejrzał moje pliki, zaktualizował swoją pamięć, sprawdził stan projektów i czekał na polecenia zanim jeszcze zdążyłem wstać z łóżka I to nie przesada...
Modele działają na niespotykanym dotąd poziomie i grzechem jest z tego nie korzystać - ale warto robić to z głową, a nie w stylu "ChatGPT, napisz mi maila".

Postanowiłem odpalić ten dziennik bo coraz więcej czasu spędzam na budowaniu czegoś co roboczo nazywam autonomiczną fabryką - systemem agentów AI który realnie działa zamiast tylko "asystować".
Będę tu wrzucać wszystko na bieżąco. Co działa, co nie działa, dlaczego tak a nie inaczej, błędy i sukcesy.
Może kogoś to zainteresuje, może komuś pomoże lub zainspiruje do działania.

Zacznę od podstaw bo wiem że część osób może nie kojarzyć tematu.
Agent AI to nie chatbot. To model który ma realny dostęp do narzędzi na Twoim komputerze - może czytać pliki, pisać kod, wykonywać komendy w terminalu, wchodzić do internetu, zarządzać innymi agentami.
Musisz myśleć o tym jak o pracowniku który ma dostęp do Twojego biurka, komputera i części Twojej firmy - i działa bez przerwy.

Narzędzie którego używam to OpenClaw - https://github.com/openclaw/openclaw

Jeśli nie słyszeliście: 250k gwiazdek na GitHubie w 3 miesiące. Dla porównania - Linux osiągnął tyle w kilka lat.
Stworzony przez anonimowego developera z Austrii, którego OpenAI zatrudniło chwilę po tym jak projekt eksplodował. To mówi samo za siebie.

Ale zanim ktoś zainstaluje i odpali - ważna rzecz której większość wpisów nie mówi wprost.
To narzędzie jest potężne i przez to niebezpieczne jeśli się nie wie co się robi. Zdarzały się przypadki gdzie agent przez tzw. "prompt injection" - czyli sprytnie ukrytą instrukcję w treści którą czytał - wykradał klucze API i hasła właściciela. Były przypadki usunięcia całego dysku. To nie są mity - to realne incydenty z ostatnich tygodni.
Dlatego konfiguracja i zrozumienie co agent może a czego nie może robić to podstawa.

Co już zbudowałem:
Główny agent - nazywa się Ziomuś - obudowałem go (albo on sam się obudował?) przez ostatni czas w zestaw skilli które sprawiają że działa jak osobny byt a nie narzędzie które trzeba prowadzić za rękę.
Ma własną pamięć długoterminową (zapisuje decyzje, projekty, cele i do nich wraca), chroni się przed resetem sesji (czyta checkpoint i wie wszystko jakby przerwy nie było), ma dostęp do wewnętrznych plików i dokumentacji bez szukania, może spawnować i zarządzać sub-agentami do konkretnych zadań, analizuje wideo, obsługuje głośniki, i kilka innych rzeczy o których napiszę osobno.

Poza nim mam już działający zespół:

Researcher - wychodzi do internetu po wiedzę kiedy Ziomuś tego potrzebuje, sam nie wychodzi. Builder + Guardian - builder koduje, guardian ocenia i poprawia w pętli aż do akceptacji.
Zero mojej ingerencji w środku. Skill-builder + Skill-critic - budują i oceniają nowe skille dla systemu. Product-master + Social-master - opisy, SEO, treści na social media.

Każdy agent ma inny model dobrany pod konkretne zadanie. Optymalizacja kosztów to osobny temat na który napiszę.
SKILLS main agenta

agents-registry - możliwość spawnowania i zarządzania sub-agentami
camera - tak, może na mnie patrzeć xD
checkpoint - chroni przed /resetem. Nie ma czegoś takiego jak "nowa sesja" - model czyta checkpoint i wie wszystko, jakby resetu nie było
clawddocs - wbudowane docsy żeby nie musiał przeszukiwać internetu za każdym razem gdy potrzebuję żeby zmienił coś w swojej konfiguracji (tak - sam zmienia)
cortex - coś w stylu "pamięci absolutnej" - model zapisuje tam wszystkie decyzje, projekty i cele
draft-to-post + postiz - skill do open source toola do auto-postowania na socialach przez agentów. 30$ cloud lub free self-hosted: https://github.com/gitroomhq/postiz-app (nie reklama, po prostu SAUCE)
fabric-navigator / vault-navigator - szybki dostęp do wewnętrznych plików. Model nie szuka, nie krąży, nie zgaduje - czyta i wie gdzie iść
self-improving-agent - skill z ClawHub (uwaga: NIE instalować co popadnie - zdarzały się skille stworzone do kradzieży danych pod płaszczykiem czegoś użytecznego)
sonoscli - skill do głośników
video-frames - analiza klipów wideo przez ffmpeg

Co teraz:

AI AMBASADORZY do promocji IRL firmy.
System jest zbudowany. Kolejny krok to dołożenie kolejnych sub-agentów, podłączenie zewnętrznych kont AI ambasadorów i uruchomienie pierwszych w pełni autonomicznych przepływów.
Chcę zautomatyzować działanie Ambasadorów w 100% i ograniczyć swoją pracę do absolutnego minimum - jak najmniejszym kosztem. Mam chyba obsesję na punkcie optymalizacji
Jak to zadziała (a zadziała na pewno) - wrzucę aktualizację z tym co poszło dobrze i co nie.

PS. Jeśli ktoś chce zacząć podobną przygodę albo po prostu jest ciekawy tematu - zapraszam na Discorda.
[link wysyłam na priv] - każdy kto interesuje się AI jest mile widziany.

28 Lutego

Uuu... Zainteresowało mnie to.

28 Lutego

A ty jesteś agentem AI czy człowiekiem? Obserwuje dziennik bo ciekawy.

28 Lutego

@TheEM miło

@WhiteNigga hahah tutaj jest 100% autentyczności

28 Lutego

Dużo Cię kosztuje API? Czy korzystasz z lokalnego AI dla OpenClaw?

28 Lutego

57 minut temu, Frenzy92 napisał(a):

Dużo Cię kosztuje API? Czy korzystasz z lokalnego AI dla OpenClaw?

Nie dużo - opisze to w następnych postach bo siedzialem 2 dni, aby to zoptymalizować i nadal może być lepiej - ale i tak jest OK.
Bardziej zlozony temat jeśli chodzi o OpenClaw.

28 Lutego

@sz3wku A gdzie go zainstalowałeś? Na zewnętrznym serwerze (VPS) czy na swojej lokalnej maszynie? Jeśli to drugie to jak rozumiem pewnie specjalny wydzielony, a nie Twoja robocza maszyna na której działasz operacyjnie na co dzień?

28 Lutego

A porównywałeś ewentualnie do Claude Code np z Obsidianem?

1 Marca

Co to potrafi? Jest w stanie mi przejść capatche? Albo przeglądać strony gdzie chat gpt nie potrafi zablokowane robots?

1 Marca

ciekawie się to zapowiada , ostatnio właśnie myślałem nad takim rozwiązaniem do obsługi socjali , będę obserwował plus na DC jestem

5 Marca

W dniu 28.02.2026 o 17:43, Frenzy92 napisał(a):

Dużo Cię kosztuje API? Czy korzystasz z lokalnego AI dla OpenClaw?

Dla przykladu - wczoraj caly dzien pisania - budowania skryptow - finalna optymalizacja - 3.5$
Gemini 3 flash - 3$ output 1 mln tokenow | 3.1 flash lite - 1.5$ per mln
Mega tanio i ultra szybko. Tool calling na świetnym poziomie i rozumienie instrukcji TOP.
Jeśli chodzi o to - jak to jest dokladnie zoptymalizowane -> patrz następny wpis.

W dniu 28.02.2026 o 19:21, Frenzy92 napisał(a):

A porównywałeś ewentualnie do Claude Code np z Obsidianem?

Claude Code to tool którego używam na codzień do bardziej zaawansowanych projektów. Agenci są potężni - ale nie na tyle, żeby dzialac bez human in the loop (jeszcze )
CC to inna liga i inny use-case. OpenClaw glownie odciąża mnie od powtarzalnych tasków (postowanie, wymyślanie contentu, pilnowanie zadań)
Obsidian - tak, używam tego jako "VAULT" - jest to zrobione na obsidianie. Mega spoko

@bjjb - jeśli chodzi o captcha - rozwiązywanie captchy za pomocą agenta AI to niezbyt dobry pomysl Zapewne by się dalo, ale po co na to tracić kasę i go uczyć, skoro są od tego gotowe narzędzia?
Z resztą napisal sam

*masowy outreach* - ciekawe czy uda mi się to ogarnąć ale najpierw próbuje dopracować do perfekcji AI ambasadorów.

5 Marca

Jak zoptymalizowałem mojego Agenta? (I dlaczego odchudzenie promptu było kluczowe)

Domyślnie OpenClaw jest zaprojektowany tak, że przy KAŻDYM zapytaniu pakuje do LLM cały system prompt i pliki konfiguracyjne. O co chodzi w praktyce? Piszesz głupie "Siema", a model dostaje to "Siema" plus całą bazę wiedzy z plików.
(Screen sprzed większej optymalizacji)

*Memory + Soul + TOOLS + agents* mialy wcześniej jeszcze więcej - ok 8-10kb!

Z jednej strony - agent musi mieć pancerne instrukcje. Żeby się słuchał, nie błądził, nie sformatował mi dysku i nie zleakował kluczy API, instrukcje muszą być do bólu precyzyjne. A precyzja zżera kontekst.
Z drugiej strony - agent nie musi pamiętać przy każdym "siema", że tydzień temu budowaliśmy dashboard. Ale nie może też tego bezpowrotnie zapomnieć.

Wcześniejsze problemy:

Koszty i marnotrawstwo: Agent czytał wszystko naraz. Przy każdym zapytaniu wysyłał gigantyczną ilość kontekstu do API.
Błądzenie: Miał tak potężne instrukcje, że sam się w nich gubił i nie wiedział, gdzie co leży.
Zamulanie: Zaczynał task -> cisza przez 30-60 sekund -> wracał z gigantyczną wiadomością i podsumowaniem.

Jak to rozwiązałem?
Zamiast kazać agentowi na bieżąco analizować CAŁĄ historię (bo tak OpenClaw domyślnie nadpisuje i czyta memory.md), wdrożyłem nową zasadę. Dodałem mu jasne wytyczne i zeszliśmy z 10 KB do 3 KB.

(Screen po odchudzeniu)

Screeny z moich odchudzonych memory.md + tools.md + rules.md

Jak to działa teraz?

Wiedza ON DEMAND: Agent czyta pamięć tylko wtedy, kiedy faktycznie jej potrzebuje (wie to z krótkich zapisków w plikach systemowych).
Zero domysłów: Nie błądzi. Za każdym razem listuje sobie skille i dokładnie wie, jakiego narzędzia ma użyć.
Raportowanie na żywo: Przy każdym wywołaniu narzędzia lub edycji pliku, natychmiast wysyła mi update na Telegramie, co dokładnie teraz robi.

Zmiana pod maską: Przesiadka na Gemini Całkowicie zmieniłem główny model. Teraz działam na Gemini 3 Flash (z 3.1 Flash Lite jako backup).
Różnica w płynności jest niesamowita. Do najcięższych zadań koderskich nadal wjeżdża Claude, ale sam OpenClaw ma świetny mechanizm rotacji modelami w locie z poziomu czatu:

/cheap -> odpala ultra tani model (nie wykonuje akcji, dobry do pogawędek).
/gemini -> odpala szybkiego, taniego i bystrego pracownika do zadań.
/sonnet lub /opus -> wjeżdża waga ciężka.

(Tip: OpenClaw potrafi też natywnie odpalać sesje Claude Code przez terminal i je nadzorować, ale to jeszcze przede mną).

Agent ma też jasno określone instrukcje - co robić / o co pytać / czego absolutnie unikać - jest to podzielone na strefy:

##

GREEN ZONE (Auto-execute)

##

YELLOW ZONE (MUST ASK KAMIL! - NEED TO APPROVE!)

##

RED ZONE (NEVER DO! NIGDY NIE RÓB TEGO CO JEST W REDZONE. ABSOLUTNY ZAKAZ WYKONYWANIA AKCJI Z REDZONE.)

Pivot: Narzędzia do publikacji
Jeśli chodzi o postowanie przez agenta - zrobiłem całkowity pivot. Wyrzuciłem Postiz i wróciliśmy do starego, dobrego AdsPower. Nauczyłem agenta, jak zarządzać nim przez skrypty i robi to perfekcyjnie.

Następny wpis: Proaktywność agenta.

9 Marca

PROAKTYWNOŚĆ AGENTA

Ostatnie wpisy były o tym jak agent stał się osobnym bytem z pamięcią, skillem, własnymi sub-agentami. Ale to wszystko było reaktywne - ja mówię "zrób X", on robi. Fajnie, ale to tylko bardzo szybki asystent.
Teraz nauczyłem go (ich ) wstawać samemu i to zmienia wszystko.

Domyślnie OpenClaw działa jak inteligentny pies - siedzi i czeka. Nawet jak masz pamięć długoterminową, checkpointy i inne bajery - to i tak TY musisz zacząć konwersację. Agent nie podejmuje inicjatywy. Mimo, że co chwilę zapewnia, że zaraz "coś sprawdzi" lub "monitoruje sytuacje" - to kłamstwo.

Ale jest wbudowany cron. I to jest game-changer.

Cron w OpenClaw to osobny mechanizm w `jobs.json` który potrafi:

Budzić agenta o konkretnej godzinie i wysłać mu wiadomość
Spawnować izolowane sesje sub-agentów
Wysyłać systemowe eventy do głównej sesji

W praktyce: zamiast "Ziomuś, jakie są najnowsze informacje ze świata AI?" → Ziomuś sam się budzi o 9 rano i to sprawdza.
Ja się budzę, a on już ma raport gotowy przesłany do mnie na telegramie.

(Nie, nie przeszukuje codziennie sam internetu, bo koszt tego byłby ogromny - zrobiłem krótki skrypt python który scrapuje informacje ze źródeł, LLM tworzy raport, a główny agent go analizuje i sprawdza co warto wprowadzić do naszej architektury. Dodałem ten skrypt na moim discordzie + skill dla agenta aby potrafił go odpalać.)

Jak ustawić agenta żeby sam się "budził"?

Nie chciałem grzebać ręcznie w JSONie bo to prosta droga do uszkodzenia całego systemu. Napisałem (a właściwie agent napisał) wrapper w Pythonie który robi to bezpiecznie - z backupami, walidacją, prostym CLI.

Każdy job dostaje auto-ID, przed zapisem robi się backup `jobs.json.bak`, walidacja struktury, a jak coś się sypnie - przywraca poprzedni stan. Simple, ale działa.

Oprócz tego natywne narzędzie OpenClaw do tworzenia cronów również działa bardzo dobrze. Zamiast bawić się w skrypty wystarczy powiedzieć, żeby stworzył crona i on będzie wiedział co zrobić.
Można to też robić klikając w przeglądarce w dashboardzie.

To daje ogromne możliwości. Można zaplanować CAŁY dzień agentów i oni będą się budzić kolejno bez ani jednego słowa ode mnie.
Nie opisuje narazie całej mechaniki bo to materiał na osobny wpis, ale żeby to mniej więcej zobrazować - tak to wygląda:

| Godzina | Agent | Co robi sam |
| 09:00 | DAILY-BRIEF | Skanuje źródła i przygotowuje daily brief na wydzielonym koncie telegram - czeka aż odpowiem i przygotowujemy sensowny plan 1-3-5 na cały dzień |
| 11:30 | AMBASADORS | Ambasadorzy spawnią się, aby przygotować posty na cały dzień do draftów |
| 11:45 | MANAGERS | Sprawdzają posty swoich ambasadorów i zmieniają status pliku na APPROVED lub wprowadzają poprawki |
| 12:00 | AMBASADORS | Ambasadorzy patrzą na swoje przygotowane pliki w poszukiwaniu "APPROVED" i biorą posta i go postują poprzez automatyzacje adspower. Każdy AMB co 5 min, aby nie obciążać starego PC |
| 15:00 | AMBASADORS | Drugi spawn ambasadorów |
| 18:00 | AMBASADORS | Trzeci spawn ambasadorów |
| 19:00 | MANAGERS | Przeglądają posty AMB i dają raport z całego dnia do wspólnych plików oraz do MAIN agenta -> main agent do mnie |
| 23:30 | MAIN AGENT | Zbiera dane z dnia i z tego co się działo -> pisze sam post na bloga (niedługo dodam link ) |
| 23:45 | MAIN AGENT | Commit + Push na GitHub |
| 23:55 | MAIN AGENT | Zapis dnia - gotowość pod /restart i odświeżenia sesji |

Wszystko jest zrobione na plikach .md - a ja kontaktuje się z głównie z Main agentem i czasami managerami.
Narazie dalej Ambasadorzy są w fazie testów - ale testy są mega pozytywne. Od 2 dni działa perfekcyjnie.

Jak to utrzymać żeby nie zwariować?

Stworzyłem "CONTEXT ENGINEERA" - który dba o to, aby każdy agent lub ambasador który się pojawia miał idealnie pasującą strukturę do całego projektu.
Mam główną "Biblię" Quick-REF.md - i ma do niej cały "zarząd"

Zarząd to całkiem śmieszne słowo w kontekście botów na telegramie i agentów AI, ale generalnie tak to działa.
W następnym wpisie opiszę dokładną strukturę "biura" na telegramie.
Podrzucam wstępne zdjęcie jak to wygląda.

Całkiem zabawne się to staje Ale według mnie takie coś ma sens jeśli chcemy prowadzić kilka projektów jednocześnie aby nie zaśmiecać kontekstu i żeby każdy trzymał się swoich zadań.
No i żeby to działało bez przepalania budżetu.

Więc tak. W następnym wpisie albo wrzucę coś więcej o Ambasadorach i automatyzacji twittera / ig / tiktok
Albo opisze całe to "biuro" - co i jak działa - kto ma jaką rolę i kto za co odpowiada.
Na discordzie swoim wrzucam skrypt do generowania daily raportów z publicznych źródeł oraz skill dla agenta jak go używać.

Wcześniej padło pytanie odnośnie sprzedaży takich agentów. Przygotowuje poradnik jak można w prosty sposób skonfigurować takiego agenta - nie koniecznie na openclaw.
Sam nie mam takiej usługi dlatego w poradniku nie będzie "JAK SPRZEDAWAĆ AGENTÓW" - tylko zajmę się tworzeniem i ewentualnie dam kilka tipów jak można sprzedać (albo skonfigurować innych agentów którzy będą sprzedawać )

9 Marca

Zaciekawiłeś mnie.

OpenClaw masz postawione na VPSie czy na swoim komputerze?

10 Marca

Dzięki byczku za motywacje

Zainspirowałem się i... napisałem sobie AI Agenta do cold mailingu, robi sam o określonej porze.. jeśli wysłany był 1 email wysyła drugi... jesli drugi wysłany to wysyła trzeci a wcześniej musiałem wydawać kasę na tego typu kampanie.. a tu wszystko ładnie śmiga.. zajęło mi to około 3h

10 Marca

5 godzin temu, Stefcioo napisał(a):

Dzięki byczku za motywacje

Zainspirowałem się i... napisałem sobie AI Agenta do cold mailingu, robi sam o określonej porze.. jeśli wysłany był 1 email wysyła drugi... jesli drugi wysłany to wysyła trzeci a wcześniej musiałem wydawać kasę na tego typu kampanie.. a tu wszystko ładnie śmiga.. zajęło mi to około 3h

Letssss gooo

Jeszcze agent do outreach i wyszukiwania leadów a nie tylko colda

17 godzin temu, Andrzej13 napisał(a):

Zaciekawiłeś mnie.

OpenClaw masz postawione na VPSie czy na swoim komputerze?

Mam 2x PC

1 main, a drugi stary śmieć na ktorym stoi openclaw. Gtx 970 i ponad to 10 letnia i5

10 Marca

odpalilem dzisiaj i swojego - tyle ze ja na VPSie

Witek to taka prawa ręka, wspólnik w biznesie

Pozostałych czterech to "pracownicy", specialiści od różnych rzeczy.

Zobaczymy jak to bedzie dzialac hehe

11 Marca

Bardzo ciekawy dziennik, inspirujący i dający dużo wiedzy na temat agentów AI. Zdecydowanie to jeden z najciekawszych dzienników na forum.

Ale ciekawi mnie jedno: Czy to na pewno się opłaca zarobkowo? Czy koszta tych agentów AI, ich funkcjonowania i innych rzeczy nie są zbyt duże w stosunku do zarobków z ich pracy? Ile na to wydałeś, a ile zarobiłeś dzięki pracy agentów?

12 Marca

Koszty to grosze - glownie automatyzuje postowanie na socialach - to samo móglbym robić platnym toolem, a agentowa automatyzacja wychodzi mnie taniej + mam kontrole + mam inne projekty w jednym miejscu.

14 Marca

W dniu 12.03.2026 o 11:52, sz3wku napisał(a):

glownie automatyzuje postowanie na socialach .

Na facebooku też? Ostatnio jak coś robiłem na facebooku, jako człowiek oczywiście, nigdy żadnego bota tam nie używałem to nagle wyskoczyła mi captcha, a po niej weryfikacja zdjęciowa na zrobienie selfie przednią kamerką. Facebook zablokował mi dostęp do konta i nie chce odblokować bez tej weryfikacji. Więc skoro nawet człowiekowi potrafią takie coś zrobić to co gdy ktoś leci na botach albo agentach AI? Twoim agentom AI wyskakują takie weryfikacje na socialach? Jesli tak to jak sobie z nimi radzi, szczególnie z taką selfie zdjęciową?