Radar AI
Wydanie 1725 kwietnia 202620.04 - 26.04.2026

Radar AI #17 - Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision

10wybranych z81zebranych

Udostępnij newsy

modele-llmdev-toolsagenci-aino-codepolskabiznes-msp
Radar AI #17 - Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision

TOP 3 tygodnia

Najważniejsze wydarzenia z kontekstem i analizą

1
DEVMŚPFREEADEPT

Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision

Anthropic wypuścił do GA Claude Opus 4.7 – najmocniejszy frontier model w swojej rodzinie – z zestawem wyników, które przesuwają granicę tego, co modele potrafią w pracy programistycznej i agentowej.

    Kluczowe liczby i nowości:

  • SWE-bench Verified: 87,6%
  • GPQA Diamond: 94,2%
  • Okno kontekstu rozszerzone do 1 mln tokenów
  • 3,3× wyższa rozdzielczość vision (skany faktur, tabele, dashboardy są wreszcie czytelne dla modelu)
  • Nowy poziom "xhigh effort" – tryb metodycznego, długiego rozumowania kosztem czasu i tokenów

    Co to znaczy dla poszczególnych person:

  • DEV: model, na którym realnie opłaca się prowadzić długie sesje Claude Code i autonomiczne agenty (1M kontekstu = cały monorepo w jednym run'ie)
  • MŚP: tańsze warianty Sonnet/Haiku będą podciągane do poziomu, na którym poprzedni Opus był rok temu – użyteczność w codziennej robocie skacze
  • FREE/ADEPT: Opus 4.7 dostępny w Claude.ai (Pro/Max), API i u większości providerów, ale cena za token wciąż wymaga rozsądnego routingu zadań

W praktyce: jeśli prowadzisz cokolwiek dłuższego z AI (code review, research, multi-step agent), to jest model, który w tym tygodniu warto przetestować.

2
DEVMŚPADEPT

Google: 75% nowego kodu w firmie generowane przez AI

Na Cloud Next 2026 Google podał liczbę, która powinna trafić do każdej prezentacji o adopcji AI: 75% nowego kodu w firmie jest generowane przez AI (z obowiązkowym human review).

    Dynamika zmiany:

  • Jesień 2025: 50% kodu generowanego przez AI
  • Wiosna 2026: 75% – wzrost o 25 punktów procentowych w ~6 miesięcy
  • To nie PR-owa przesada – Google potwierdza przesunięcie ciężaru z "AI asystuje programiście" na "programista weryfikuje AI"

    Implikacje dla person:

  • DEV: umiejętność krytycznego review kodu AI (czytanie diff-a, rozumienie intencji, wyłapywanie subtelnych błędów) staje się ważniejsza od umiejętności pisania od zera
  • MŚP: argument do rozmowy z zespołem IT/agencją – jeśli największa firma tech świata tak pracuje, oczekiwania wobec tempa i kosztu projektów się zmieniają
  • ADEPT: jasny kierunek rozwoju kariery – nauka współpracy z Claude Code / Cursor / Copilot to dziś ta sama kompetencja, co znajomość IDE 10 lat temu

Liczba 75% to jednocześnie sufit i dolna granica – za 6 miesięcy zobaczymy pewnie 85%+, więc inwestycja w ten skill ma sens.

3
MŚP

PARP: 1,3 mld zł dotacji na AI dla polskich MŚP w 2026

PARP ogłosił, że w 2026 AI staje się priorytetem agencji – dedykowany budżet ~1,3 mld zł pójdzie na wdrożenia sztucznej inteligencji w polskich MŚP. To największa pojedyncza pula na AI skierowana bezpośrednio do małych i średnich firm w Polsce – kontekstowo odpowiedź na alarmujące wskaźniki adopcji, które od lat plasują Polskę na końcu rankingów UE.

    Co dotacja może pokryć:

  • Audyt procesów
  • Wdrożenie rozwiązań AI
  • Szkolenia zespołu
  • Integracje z istniejącymi systemami IT

Dla właścicieli MŚP to prosta implikacja: 2026 to moment, żeby przestać traktować AI jako "ciekawostkę" i zacząć przygotowywać konkretne wnioski. W praktyce oznacza to też konkurencyjną przewagę – firmy, które wejdą w pierwsze rundy konkursów, zbudują kompetencje i procesy 6-12 miesięcy przed resztą rynku.

    Warto już teraz zrobić wewnętrzny mini-audyt:

  • Które procesy realnie bolą
  • Które dane są dostępne
  • Gdzie ROI będzie mierzalny

Wnioski PARP wymagają konkretów, nie mglistych "wdrożymy AI". Zestawiając to z raportem EY (51% polskich firm już raportuje korzyści z AI) – benchmarki i case study do wniosków istnieją.

Co jeszcze warto wiedzieć

Kuratowana lista per kategoria

🇵🇱Polska2

Raport EY: Jak polskie firmy wdrażają AI 202610% liderów, 40% pragmatyków, 51% firm raportuje realne korzyści z AI. Największe wyzwanie wskazane przez badanych: integracja z istniejącym IT (54% wskazań).

[MŚP][ADEPT]link

Polska 3. najczęściej atakowane ransomware (H2 2025)Cyberzagrożenia rosną, boty AI coraz groźniejsze w rękach cyberprzestępców. Temat do rozmowy o bezpieczeństwie w kontekście wdrożeń AI.

[MŚP]link

💻Dev Tools2

Claude Code usunięty z Pro ($20/m)Anthropic testuje usunięcie Claude Code z planu Pro na ~2% nowych prosumer signups. Istniejący użytkownicy Pro/Max niedotknięci, ale pricing chaos wywołał lawinę komentarzy.

[DEV][ADEPT][FREE]link

Claude Code 46% most loved w dev surveyClaude Code zdominował preferencje programistów: 46% vs Cursor 19%, Copilot 9%. Średnio dev używa 2,3 narzędzi AI dziennie – rynek nie konsoliduje się wokół jednego.

[DEV]link

🤖Agenci AI1

Anthropic Managed Agents (Advisor strategy)Konfigurowalne managed agents z Opus jako opcjonalny "advisor tier" nadzorujący tańsze modele. Wzorzec routingu zadań wart skopiowania do własnych agentowych setupów.

[DEV][MŚP]link

🧠Modele LLM1

Claude Mythos PreviewAnthropic pokazał w programie red team nowy general-purpose model szczególnie mocny w computer security. Sygnał kierunku: wyspecjalizowane warianty pod domeny (security, life sciences) zamiast jednego giganta do wszystkiego.

[DEV]link

🔧No-code / Automatyzacja1

n8n: How to evaluate AI agents performanceOficjalny guide n8n o testowaniu agentów: offline vs online, kluczowe metryki, deterministic checks + LLM-as-judge. Must-read dla każdego, kto wdraża agenty w n8n.

[DEV][MŚP][ADEPT]link

Główne trendy

Wzorce i kierunki wyłaniające się z newsów tygodnia

1

Claude Opus 4.7 przesuwa sufit – Anthropic dostarcza model, który realnie zmienia ekonomię długich agentowych workflowów (1M kontekstu + xhigh effort + lepszy vision).

2

Kod jest już w 75% AI-generated – Google potwierdza skalę zmiany; rynek pracy DEV przestaje być o pisaniu kodu, a staje się o jego review, architekturze i delegacji do agentów.

3

Polska ma moment wejścia – PARP 1,3 mld zł + raport EY z 51% firm raportujących korzyści = rok, w którym opłaca się przestać czekać i złożyć pierwszy konkretny wniosek lub zrobić pierwszy audyt.

4

Pricing confusion w AI coding tools – Claude Code z Pro, GitHub Copilot tightened limits, SpaceX-Cursor za $60B. Rynek dev tools wchodzi w fazę, gdzie "płacisz za tokeny, nie za subskrypcję" staje się normą.

Radar AI co tydzień na skrzynce

Dołącz do 20 000+ osób, które co tydzień dostają kuratowany przegląd AI i automatyzacji.

Zapisując się, wyrażasz zgodę na dołączenie do mojej listy mailingowej. Szczegóły w Polityce prywatności.