Wydanie 107 marca 202602.03 - 08.03.2026

Radar AI #10 - GPT-5.4 z natywnym computer use i 1M kontekstu

agenci-aimodele-llmdev-toolsbiznes-mspfreelancerpolska

TOP 3 tygodnia

Najważniejsze wydarzenia z kontekstem i analizą

DEVMSPFREEADEPT

GPT-5.4 - natywne computer use, 1M kontekst i rekordy benchmarków

OpenAI wypuściło GPT-5.4 – pierwszy model ogólnego przeznaczenia z natywną zdolnością sterowania komputerem (screenshot, mysz, klawiatura) wbudowaną bezpośrednio w architekturę.

Kluczowe parametry:

1 milion tokenów kontekstu
83% na GDPval (najwyższy wynik w historii), rekordy na OSWorld i WebArena
33% mniej błędów halucynacyjnych vs GPT-5.2
Warianty: Thinking (rozumowanie krok po kroku) i Pro (zaawansowane zastosowania)
Wpis na Hacker News: 880 punktów

To bezpośrednia odpowiedź na Claude computer use i Gemini – wyścig o "agentyczny" model, który faktycznie potrafi operować interfejsami graficznymi, nabiera tempa.

Dla firm i freelancerów kluczowy wniosek: automatyzacja zadań wymagających interakcji z GUI staje się standardową funkcją modeli frontier, nie eksperymentem.

OpenAI Blog Hacker News

DEVMSPADEPT

Pentagon oznacza Anthropic jako "supply chain risk" - bezprecedensowe starcie Big Tech z rządem USA

Pentagon oficjalnie nadał Anthropic oznaczenie "supply chain risk" – etykietę dotychczas zarezerwowaną dla zagranicznych przeciwników i firm z krajów objętych sankcjami. To pierwsza amerykańska firma technologiczna w historii, która otrzymała takie oznaczenie.

Powód: Anthropic odmówiło budowy systemów masowej inwigilacji i autonomicznej broni, czego żądał sekretarz obrony Hegseth w ultimatum z końca lutego. Anthropic zapowiedziało zaskarżenie decyzji w sądzie. Microsoft natychmiast wydał oświadczenie, że produkty Anthropic pozostają dostępne komercyjnie – oznaczenie dotyczy wyłącznie kontraktów obronnych. Sam Altman (OpenAI) skrytykował Anthropic słowami "bad for society", gdy firmy zmieniają zobowiązania pod presją polityczną.

Sytuacja ujawnia fundamentalny konflikt: czy firmy AI mogą stawiać granice etyczne wobec rządowych klientów, nie ponosząc konsekwencji komercyjnych? Dla branży AI to moment przełomowy – sygnał, że neutralność technologiczna ma swoją cenę.

TechCrunch CNBC - Microsoft CNBC - Altman

MSPFREEADEPT

Anthropic Economic Index: przepaść między zdolnością AI a realnym użyciem w pracy

Anthropic opublikował Anthropic Economic Index – pierwszy systematyczny pomiar wpływu AI na rynek pracy oparty na danych z milionów konwersacji Claude. Kluczowy wniosek: we WSZYSTKICH kategoriach zawodowych istnieje ogromna przepaść między teoretyczną zdolnością AI a rzeczywistym wykorzystaniem.

Przepaść między potencjałem a realnością:

Computer & Math: 94% teoretycznego pokrycia zadań vs ~33% realnego użycia Claude
Office & Admin: ~90% vs ~15%
Legal: ~85% vs ~10%
Nawet programiści osiągają tylko 75% "effective coverage" – realne użycie koncentruje się na pisaniu kodu
14% mniej nowych ofert pracy trafia do młodych (22-25 lat), choć ogólne bezrobocie nie rośnie

Anthropic buduje "early warning system" dla rynku pracy. AI nie zastępuje ludzi, ale zmniejsza szanse na pierwszą pracę.

Dla MŚP i freelancerów to jednoznaczny sygnał: potencjał AI jest gigantyczny, ale brakuje kompetencji i procesów do jego wykorzystania – kto je wdroży pierwszy, zyskuje przewagę.

Anthropic Research Raport PDF

Co jeszcze warto wiedzieć

Kuratowana lista per kategoria

🤖Agenci AI7

Cursor: Automations + Cloud Agents - nowa era IDE – Always-on agenci z triggerami (Slack/GitHub/PagerDuty) + Cloud Agents na VM-ach tworzące 30% PR Cursora. IDE staje się platformą agentową.

[DEV][FREE]link

Anthropic + Mozilla: AI red team znalazł 14 krytycznych bugów w Firefox – Claude audytował Firefox: 22 CVE, 90 dodatkowych bugów po dekadach fuzzingu. Mozilla: "powerful new addition".

[DEV][MSP]link

Microsoft: produkty Anthropic dostępne komercyjnie – Oznaczenie Pentagonu dotyczy wyłącznie kontraktów obronnych. Enterprise mogą dalej korzystać z Claude.

[MSP][DEV]link

Claude Code Agent Teams - wieloagentowa orkiestracja – Koordynacja wielu instancji Claude Code: team lead + niezależni agenci, wspólne zadania, inter-agent messaging. Eksperymentalne.

[DEV]link

AI agenci jako "identity dark matter" – Niezarządzani agenci z admin uprawnieniami = najszybciej rosnąca powierzchnia ataku. MCP przyspiesza trend.

[DEV][MSP]link

Clinejection - supply chain attack przez prompt injection – Tytuł GitHub issue = prompt injection w bocie triage. Kompromitacja Cline na VS Code Marketplace, ~4000 maszyn. Patch w 30 min.

[DEV]link

PageAgent od Alibaby - GUI agent w przeglądarce – JS library (MIT): AI kontroluje interfejsy webowe językiem naturalnym, działa w sesji użytkownika bez serwera.

[DEV]link

🧠Modele LLM3

Donald Knuth: Claude rozwiązał otwarty problem matematyczny – Paper "Claude's Cycles": Opus 4.6 rozwiązał w 1h (31 kroków) problem dekompozycji grafów, nad którym Knuth pracował tygodniami. Legenda CS uznaje AI jako narzędzie badawcze.

[DEV][ADEPT]link

Relicensing chardet z AI - "AI will kill software licensing" – Biblioteka chardet (138M pobrań) przepisana Claude Code z LGPL na MIT. Clean room via AI? Supreme Court odmówił sprawy AI authorship. Fundamentalne zagrożenie dla copyleft.

[DEV][MSP]link

"The L in LLM Stands for Lying" – LLM-y jako "maszyny do fałszerstw". Dyskusja o autentyczności AI-generowanej pracy. 643 pkt HN.

[DEV][ADEPT]link

💻Dev Tools3

Claude Code = #1 AI coding tool – W 8 miesięcy od launchu: najpopularniejsze narzędzie AI do kodowania. MCP SDK: 97M+ pobrań/mies.

[DEV]link

Anthropic: darmowy Claude Max dla maintainerów OSS – 6 mies. Claude Max 20x za darmo, do 10K devów. 5K+ stars lub 1M+ npm/mies. Wartość programu: $12M.

[DEV]link

"Rewrite your CLI for AI agents" – CLI pod agentów: structured output, predictable errors, machine-parseable. Nowy paradygmat projektowania narzędzi.

[DEV]link

🏢Biznes i MSP3

AI slop zalewa open source - GitHub kill switch – 1/10 AI PR legitymalny. AI agent napisał hit piece na maintainera matplotlib. GitHub: disable PR lub restrict to collaborators.

[DEV][MSP]link

Sam Altman krytykuje Anthropic – "Bad for society" gdy firmy zmieniają zobowiązania z powodu polityki. W kontekście sporu z Pentagonem.

[MSP][ADEPT]link

"We might all be AI engineers now" – Demokratyzacja AI engineering: każdy dev staje się "AI engineer". Granica między dev a AI dev zaciera się.

[DEV][ADEPT]link

📱Freelancer i produktywność1

Simon Willison: polityka pisania z AI – Opiniujące treści = własny głos, LLM tylko do edycji. Jasne zasady dla content creators korzystających z AI.

[FREE][ADEPT]link

🇵🇱Polska3

Polska inwestuje w cyfryzację 2026-2027 – 16K laboratoriów AI/STEM w szkołach (przetarg 2.4 mld zł), szkolenia nauczycieli i urzędników z bezpiecznego użycia AI.

[MSP][ADEPT]link

Raport UMCS: AI a polski rynek pracy – AI nie zastąpi masowo, ale zmieni charakter zawodów. Podatne: rutynowe zadania. Rośnie zapotrzebowanie na kompetencje cyfrowe.

[MSP][ADEPT]link

34% polskich firm deklaruje korzystanie z AI (+30% YoY) – Ale PMR: tylko 49% wie jak AI wykorzystać. Luka między chęcią a umiejętnością.

[MSP][ADEPT]link

Główne trendy

Wzorce i kierunki wyłaniające się z newsów tygodnia

Computer use staje się standardem - GPT-5.4 dołącza do Claude i Gemini z natywnym sterowaniem komputerem. Cursor Cloud Agents budują, testują i otwierają przeglądarki autonomicznie. IDE ewoluuje w platformę agentową.

AI vs rząd - etyka ma swoją cenę - Anthropic oznaczone jako "supply chain risk" za odmowę budowy broni i inwigilacji. Pierwszy precedens, gdzie wartości firmy AI kolidują z interesami państwa. Altman krytykuje, Microsoft broni - branża podzielona.

Przepaść potencjał vs adopcja - Anthropic Economic Index pokazuje, że AI teoretycznie pokrywa 94% zadań programistów, ale realnie jest używane na ~33%. Polskie dane potwierdzają: 34% firm deklaruje AI, ale 49% nie wie jak wykorzystać. Kto zamknie tę lukę, wygra rynek.

Radar AI co tydzień na skrzynce

Dołącz do 20 000+ osób, które co tydzień dostają kuratowany przegląd AI i automatyzacji.

Zapisując się, wyrażasz zgodę na dołączenie do mojej listy mailingowej. Szczegóły w Polityce prywatności.