Claude Opus 4.7 GA – nowy benchmark coding, agentów i vision
Anthropic wypuścił do GA Claude Opus 4.7 – najmocniejszy frontier model w swojej rodzinie – z zestawem wyników, które przesuwają granicę tego, co modele potrafią w pracy programistycznej i agentowej.
- SWE-bench Verified: 87,6%
- GPQA Diamond: 94,2%
- Okno kontekstu rozszerzone do 1 mln tokenów
- 3,3× wyższa rozdzielczość vision (skany faktur, tabele, dashboardy są wreszcie czytelne dla modelu)
- Nowy poziom "xhigh effort" – tryb metodycznego, długiego rozumowania kosztem czasu i tokenów
Kluczowe liczby i nowości:
- DEV: model, na którym realnie opłaca się prowadzić długie sesje Claude Code i autonomiczne agenty (1M kontekstu = cały monorepo w jednym run'ie)
- MŚP: tańsze warianty Sonnet/Haiku będą podciągane do poziomu, na którym poprzedni Opus był rok temu – użyteczność w codziennej robocie skacze
- FREE/ADEPT: Opus 4.7 dostępny w Claude.ai (Pro/Max), API i u większości providerów, ale cena za token wciąż wymaga rozsądnego routingu zadań
Co to znaczy dla poszczególnych person:
W praktyce: jeśli prowadzisz cokolwiek dłuższego z AI (code review, research, multi-step agent), to jest model, który w tym tygodniu warto przetestować.

