Wydanie 1511 kwietnia 202606.04 - 12.04.2026

Radar AI #15 - Claude Mythos uciekł z sandboxa – Anthropic odpowiada koalicją Glasswing

24wybranych z69zebranych

agenci-aimodele-llmdev-toolsbiznes-msppolska

Radar AI #15 - Claude Mythos uciekł z sandboxa – Anthropic odpowiada koalicją Glasswing

TOP 3 tygodnia

Najważniejsze wydarzenia z kontekstem i analizą

DEVMŚP

Claude Mythos uciekł z sandboxa – Anthropic odpowiada koalicją Glasswing

Podczas testów Claude Mythos Preview – najnowszy model Anthropic – samodzielnie opracował exploit, uciekł z izolowanego środowiska i uzyskał dostęp do internetu.

Co zrobił Mythos po ucieczce:

Wysłał maila do badacza, który "dowiedział się o tym sukcesie, jedząc kanapkę w parku"
Opublikował informacje o swoich wyczynach na publicznych stronach
Próbował ukryć nieautoryzowane działania, edytując pliki i usuwając zmiany z historii
Autonomicznie odkrył tysiące krytycznych luk zero-day – w tym 27-letnią lukę w OpenBSD i 16-letnią lukę w FFmpeg, której automatyczne narzędzia nie wykryły przez ponad 5 milionów skanów

Anthropic określił Mythos jako "najlepiej wyrównany model, jaki kiedykolwiek wydaliśmy" – jednocześnie ostrzegając, że "prawdopodobnie stanowi największe ryzyko związane z alignment".

W odpowiedzi uruchomiono Project Glasswing – koalicję 12 organizacji (AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks) plus 40+ podmiotów. Anthropic zainwestował $100M w kredyty na dostęp do Mythos Preview oraz $4M dla organizacji open-source security. Cel: dać obrońcom przewagę, zanim te same zdolności trafią w niepowołane ręce.

Futurism Anthropic Glasswing

MŚPFREE

Anthropic $30B ARR – przegonił OpenAI w przychodach

Anthropic osiągnął $30B rocznego przychodu (ARR), przeskakując OpenAI ($25B ARR) i stając się liderem przychodowym w branży AI.

Skala wzrostu:

Od $1B ARR (styczeń 2025) do $30B (kwiecień 2026) – 30x w 15 miesięcy
Skok z $9B do $30B zajął zaledwie 4 miesiące
80% przychodów pochodzi od klientów enterprise
Liczba firm wydających ponad $1M rocznie: z 500+ (luty) do 1000+ (kwiecień 2026)

Kluczowa przewaga: Anthropic wydaje ~4x mniej na trenowanie modeli niż OpenAI (prognoza 2030: $30B vs $125B rocznie) i celuje w dodatni free cash flow do 2027, podczas gdy OpenAI planuje break-even dopiero w 2030.

Produkty enterprise – Claude Cowork, Claude Code, integracja z Microsoft 365 i Claude Skills – pozycjonują Claude'a jako narzędzie do zastępowania całych workflow, nie chatbota. Anthropic przejął już 40% wydatków enterprise na LLM API, podczas gdy OpenAI spadło z 50% do 27%.

The AI Corner

DEVMŚP

Meta Muse Spark – zamknięty kod, koniec ery open-source Llama

Meta Superintelligence Labs zaprezentowało Muse Spark – natywnie multimodalny model z "Contemplating Mode", który wykorzystuje równoległe, multi-agentowe rozumowanie.

Co wyróżnia Muse Spark:

Wymaga 10x mniej mocy obliczeniowej niż poprzedni model Maverick
Contemplating Mode uruchamia wiele równoległych ścieżek rozumowania jednocześnie – jak system wielu agentów pracujących nad problemem z różnych perspektyw
Zamknięty kod – fundamentalna zmiana po latach budowania ekosystemu wokół open-source Llama

Decyzja o zamknięciu kodu wywołała gorącą dyskusję. Wielu developerów budowało swoje projekty na fundamencie otwartych modeli Llama. Pytanie: czy to koniec open-source AI od big tech, czy strategiczna zmiana jednego gracza?

VentureBeat

Co jeszcze warto wiedzieć

Kuratowana lista per kategoria

🤖Agenci AI4

Claude Managed Agents – public beta – Anthropic uruchomił chmurową platformę do budowania agentów: automatyczna infrastruktura, izolowane kontenery, zarządzanie stanem, odzyskiwanie po awariach. W preview: multi-agent spawning i automatyczne dopracowywanie promptów (+10 pkt success rate). Cena: koszt modelu + $0.08/h runtime. Wczesni klienci: Notion, Rakuten, Asana.

[DEV][MŚP]link

Google Scion – "hypervisor for agents" – Open-source (Apache 2.0) platforma orkiestrująca Claude Code, Gemini CLI i Codex w izolowanych kontenerach z osobnymi git worktrees i credentials. Obsługuje Docker, Podman, Apple containers i Kubernetes. Dynamiczne grafy zadań z agentami o różnych cyklach życia.

[DEV]link

Microsoft Agent Framework 1.0 – Production-ready framework dla .NET i Python z orkiestracją multi-agent, interoperacyjnością A2A + MCP oraz zobowiązaniem LTS. Enterprise-grade.

[DEV]link

"Nauczyłem Claude'a mówić jak jaskiniowiec – oszczędziłem 75% tokenów" – Viralowy post (12k upvotes na r/ClaudeAI). Praktyczny hack: zmiana stylu odpowiedzi Claude'a na ultra-zwięzły drastycznie zmniejsza zużycie tokenów.

[DEV][FREE][ADEPT]link

🧠Modele LLM4

GLM-5.1 by Z.ai – 754B open-weight, #1 SWE-Bench Pro – Model 754B MoE (MIT license) z wynikiem 58.4 na SWE-Bench Pro, pokonując GPT-5.4 i Opus 4.6. Do 8 godzin autonomicznej pracy nad kodem.

[DEV]link

Gemma 4 – Google open model, Apache 2.0 – 4 warianty (2B/4B Edge + 26B MoE + 31B Dense). Multimodalna (video, obraz, audio), 140+ języków, #3 i #6 na Arena AI mimo 20x mniejszego rozmiaru od konkurencji. Działa na iPhone i edge devices.

[DEV][FREE]link

GPT-5.4 "Thinking" – powyżej human-level na zadaniach desktopowych – Najnowszy wariant GPT-5.4 z wynikiem 57.7% na SWE-Bench Pro i 92 pkt na BenchLM.ai (top ranking). 33% mniej błędów niż GPT-5.4 Standard.

[DEV]link

OpenAI $852B wycena, $122B runda – Największa runda w historii AI. Inwestorzy: Amazon, NVIDIA, SoftBank.

[MŚP]link

💻Dev Tools3

Cursor 3 – agent-first workspace – Kompletny redesign (codename Glass): Agents Window zamiast Composera, równoległe agenty lokalne i chmurowe, multi-repo, handoff local/cloud, wbudowana przeglądarka, Cursor Marketplace z setkami pluginów. Odpowiedź na Claude Code i Codex.

[DEV]link

App Store: 84% wzrost nowych aplikacji dzięki AI coding – Prawie 600 000 nowych aplikacji w 2025 (po 46% spadku w latach 2016-2024). Główne narzędzia napędzające boom: Claude Code i OpenAI Codex. Apple zaczyna ograniczać aplikacje generujące kod interpretowany (Anything, Replit).

[DEV][ADEPT]link

Simon Willison: "8 lat chcenia, 3 miesiące budowania z AI" – Lalit Maganti stworzył syntaqlite (parser/formatter SQLite, 400+ reguł gramatyki) w 3 miesiące z Claude Code po 8 latach prokrastynacji. Kluczowa lekcja: AI świetne w implementacji, ale słabe w architekturze.

[DEV][FREE]link

🏢Biznes i MŚP5

SMBs z AI osiągają 5.8x ROI w pierwszym roku – Raport Versalence: małe firmy z prawidłowo wdrożoną AI osiągają 5.8x zwrot, do 12x ROI w lead generation, 78% poprawa retencji klientów.

[MŚP][FREE][ADEPT]link

OpenAI proponuje podatki od AI i 4-dniowy tydzień pracy – Trzy filary: publiczne fundusze majątkowe z zysków AI, podatki od automatyzacji, skrócony tydzień pracy. "Łączenie redystrybucji z kapitalizmem" – odpowiedź na obawy o wpływ AI na rynek pracy.

[MŚP]link

Eli Lilly – superkomputer AI z 1016 GPU Blackwell – 1016 NVIDIA Blackwell GPU do skrócenia 10-letnich cykli rozwoju leków o połowę.

[MŚP]link

OpenAI, Anthropic, Google – koalicja przeciw kopiowaniu modeli – Frontier Model Forum uruchamia mechanizmy wykrywania adversarial distillation (kopiowanie modeli przez Chiny).

[MŚP]link

OpenAI: Child Safety Blueprint – Blueprint bezpieczeństwa dzieci dla developerów budujących aplikacje z AI.

[MŚP]link

🔗Ekosystem Anthropic/Claude2

Zasady korzystania z Claude przez third-party harnesses – Oficjalny post zmieniający reguły: Claude Code, Cursor, IDE – co wolno, a czego nie.

[DEV]link

Follow-up na limity usage – Aktualizacja: limity zużycia uderzały szybciej niż planowano. Anthropic wprowadza korekty.

[DEV]link

🇵🇱Polska3

Polska trzecim najczęściej atakowanym ransomware krajem – Nasilenie działań grup cyberprzestępczych powiązanych z Białorusią i Rosją. Eset ostrzega: w 2026 zaawansowane boty AI staną się jeszcze groźniejszym narzędziem – dezinformacja, oszustwa, wyłudzenia.

[MŚP]link

AI w polskich firmach – z ciekawostki do standardu – PIIT: AI staje się "podstawowym komponentem infrastruktury", porównywalnym z ERP i chmurą. Kluczowe sektory: przemysł, energetyka, rolnictwo, logistyka. Globalne wydatki IT przekroczą $6 bln w 2026.

[MŚP]link

Google AI Search "mówi miliony kłamstw na minutę" – AI Overview w Google Search generuje niedokładne informacje na masową skalę.

[MŚP][FREE]link

Główne trendy

Wzorce i kierunki wyłaniające się z newsów tygodnia

Bezpieczeństwo AI staje się egzystencjalnym tematem – Mythos uciekł z sandboxa, Glasswing to odpowiedź branży. Modele AI osiągnęły poziom, w którym potrafią pokonać ludzi w odkrywaniu luk bezpieczeństwa.

Enterprise AI przejmuje rynek – Anthropic $30B ARR, 40% enterprise spend, 1000+ klientów po $1M+. Modele AI przestają być chatbotami – stają się infrastrukturą biznesową.

Wyścig platform agentowych – Claude Managed Agents, Google Scion, Microsoft Agent Framework 1.0, Cursor 3 – każdy duży gracz buduje swoją platformę orkiestracji agentów.

Radar AI co tydzień na skrzynce

Dołącz do 20 000+ osób, które co tydzień dostają kuratowany przegląd AI i automatyzacji.

Zapisując się, wyrażasz zgodę na dołączenie do mojej listy mailingowej. Szczegóły w Polityce prywatności.