Wydanie 1725 kwietnia 202620.04 - 26.04.2026

Radar AI #17 - Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision

10wybranych z81zebranych

modele-llmdev-toolsagenci-aino-codepolskabiznes-msp

Radar AI #17 - Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision

TOP 3 tygodnia

Najważniejsze wydarzenia z kontekstem i analizą

DEVMŚPFREEADEPT

Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision

Anthropic wypuścił do GA Claude Opus 4.7 – najmocniejszy frontier model w swojej rodzinie – z zestawem wyników, które przesuwają granicę tego, co modele potrafią w pracy programistycznej i agentowej.

Kluczowe liczby i nowości:

SWE-bench Verified: 87,6%
GPQA Diamond: 94,2%
Okno kontekstu rozszerzone do 1 mln tokenów
3,3× wyższa rozdzielczość vision (skany faktur, tabele, dashboardy są wreszcie czytelne dla modelu)
Nowy poziom "xhigh effort" – tryb metodycznego, długiego rozumowania kosztem czasu i tokenów

Co to znaczy dla poszczególnych person:

DEV: model, na którym realnie opłaca się prowadzić długie sesje Claude Code i autonomiczne agenty (1M kontekstu = cały monorepo w jednym run'ie)
MŚP: tańsze warianty Sonnet/Haiku będą podciągane do poziomu, na którym poprzedni Opus był rok temu – użyteczność w codziennej robocie skacze
FREE/ADEPT: Opus 4.7 dostępny w Claude.ai (Pro/Max), API i u większości providerów, ale cena za token wciąż wymaga rozsądnego routingu zadań

W praktyce: jeśli prowadzisz cokolwiek dłuższego z AI (code review, research, multi-step agent), to jest model, który w tym tygodniu warto przetestować.

Anthropic announcement Simon Willison – system prompt diff

DEVMŚPADEPT

Google: 75% nowego kodu w firmie generowane przez AI

Na Cloud Next 2026 Google podał liczbę, która powinna trafić do każdej prezentacji o adopcji AI: 75% nowego kodu w firmie jest generowane przez AI (z obowiązkowym human review).

Dynamika zmiany:

Jesień 2025: 50% kodu generowanego przez AI
Wiosna 2026: 75% – wzrost o 25 punktów procentowych w ~6 miesięcy
To nie PR-owa przesada – Google potwierdza przesunięcie ciężaru z "AI asystuje programiście" na "programista weryfikuje AI"

Implikacje dla person:

DEV: umiejętność krytycznego review kodu AI (czytanie diff-a, rozumienie intencji, wyłapywanie subtelnych błędów) staje się ważniejsza od umiejętności pisania od zera
MŚP: argument do rozmowy z zespołem IT/agencją – jeśli największa firma tech świata tak pracuje, oczekiwania wobec tempa i kosztu projektów się zmieniają
ADEPT: jasny kierunek rozwoju kariery – nauka współpracy z Claude Code / Cursor / Copilot to dziś ta sama kompetencja, co znajomość IDE 10 lat temu

Liczba 75% to jednocześnie sufit i dolna granica – za 6 miesięcy zobaczymy pewnie 85%+, więc inwestycja w ten skill ma sens.

Business Insider Claude Code 46% most loved – dev survey

MŚP

PARP: 1,3 mld zł dotacji na AI dla polskich MŚP w 2026

PARP ogłosił, że w 2026 AI staje się priorytetem agencji – dedykowany budżet ~1,3 mld zł pójdzie na wdrożenia sztucznej inteligencji w polskich MŚP. To największa pojedyncza pula na AI skierowana bezpośrednio do małych i średnich firm w Polsce – kontekstowo odpowiedź na alarmujące wskaźniki adopcji, które od lat plasują Polskę na końcu rankingów UE.

Co dotacja może pokryć:

Audyt procesów
Wdrożenie rozwiązań AI
Szkolenia zespołu
Integracje z istniejącymi systemami IT

Dla właścicieli MŚP to prosta implikacja: 2026 to moment, żeby przestać traktować AI jako "ciekawostkę" i zacząć przygotowywać konkretne wnioski. W praktyce oznacza to też konkurencyjną przewagę – firmy, które wejdą w pierwsze rundy konkursów, zbudują kompetencje i procesy 6-12 miesięcy przed resztą rynku.

Warto już teraz zrobić wewnętrzny mini-audyt:

Które procesy realnie bolą
Które dane są dostępne
Gdzie ROI będzie mierzalny

Wnioski PARP wymagają konkretów, nie mglistych "wdrożymy AI". Zestawiając to z raportem EY (51% polskich firm już raportuje korzyści z AI) – benchmarki i case study do wniosków istnieją.

Innowacje.ai – PARP 2026 Raport EY – polski rynek AI

Co jeszcze warto wiedzieć

Kuratowana lista per kategoria

🇵🇱Polska2

Raport EY: Jak polskie firmy wdrażają AI 2026 – 10% liderów, 40% pragmatyków, 51% firm raportuje realne korzyści z AI. Największe wyzwanie wskazane przez badanych: integracja z istniejącym IT (54% wskazań).

[MŚP][ADEPT]link

Polska 3. najczęściej atakowane ransomware (H2 2025) – Cyberzagrożenia rosną, boty AI coraz groźniejsze w rękach cyberprzestępców. Temat do rozmowy o bezpieczeństwie w kontekście wdrożeń AI.

[MŚP]link

💻Dev Tools2

Claude Code usunięty z Pro ($20/m) – Anthropic testuje usunięcie Claude Code z planu Pro na ~2% nowych prosumer signups. Istniejący użytkownicy Pro/Max niedotknięci, ale pricing chaos wywołał lawinę komentarzy.

[DEV][ADEPT][FREE]link

Claude Code 46% most loved w dev survey – Claude Code zdominował preferencje programistów: 46% vs Cursor 19%, Copilot 9%. Średnio dev używa 2,3 narzędzi AI dziennie – rynek nie konsoliduje się wokół jednego.

[DEV]link

🤖Agenci AI1

Anthropic Managed Agents (Advisor strategy) – Konfigurowalne managed agents z Opus jako opcjonalny "advisor tier" nadzorujący tańsze modele. Wzorzec routingu zadań wart skopiowania do własnych agentowych setupów.

[DEV][MŚP]link

🧠Modele LLM1

Claude Mythos Preview – Anthropic pokazał w programie red team nowy general-purpose model szczególnie mocny w computer security. Sygnał kierunku: wyspecjalizowane warianty pod domeny (security, life sciences) zamiast jednego giganta do wszystkiego.

[DEV]link

🔧No-code / Automatyzacja1

n8n: How to evaluate AI agents performance – Oficjalny guide n8n o testowaniu agentów: offline vs online, kluczowe metryki, deterministic checks + LLM-as-judge. Must-read dla każdego, kto wdraża agenty w n8n.

[DEV][MŚP][ADEPT]link

Główne trendy

Wzorce i kierunki wyłaniające się z newsów tygodnia

Claude Opus 4.7 przesuwa sufit – Anthropic dostarcza model, który realnie zmienia ekonomię długich agentowych workflowów (1M kontekstu + xhigh effort + lepszy vision).

Kod jest już w 75% AI-generated – Google potwierdza skalę zmiany; rynek pracy DEV przestaje być o pisaniu kodu, a staje się o jego review, architekturze i delegacji do agentów.

Polska ma moment wejścia – PARP 1,3 mld zł + raport EY z 51% firm raportujących korzyści = rok, w którym opłaca się przestać czekać i złożyć pierwszy konkretny wniosek lub zrobić pierwszy audyt.

Pricing confusion w AI coding tools – Claude Code z Pro, GitHub Copilot tightened limits, SpaceX-Cursor za $60B. Rynek dev tools wchodzi w fazę, gdzie "płacisz za tokeny, nie za subskrypcję" staje się normą.

Radar AI co tydzień na skrzynce

Dołącz do 20 000+ osób, które co tydzień dostają kuratowany przegląd AI i automatyzacji.

Zapisując się, wyrażasz zgodę na dołączenie do mojej listy mailingowej. Szczegóły w Polityce prywatności.