W cieniu GPT-5 Anthropic zaprezentował parę dni temu Claude Opus 4.1 – udoskonaloną wersję swojego flagowego modelu, stworzoną z myślą o jeszcze lepszym radzeniu sobie z zadaniami agentowymi, programowaniem w realnych warunkach i rozumowaniem. I choć twórcy zapowiadają, że prawdziwa „petarda” w rozwoju modeli dopiero nadejdzie w kolejnych tygodniach, już teraz mamy kilka powodów do uwagi.
Opus 4.1 jest dostępny dla płatnych użytkowników Claude’a oraz w narzędziu Claude Code. Model trafił też do API, Amazon Bedrock oraz Google Cloud Vertex AI. Ceny? Bez zmian w stosunku do Opus 4 – co w świecie AI można porównać do rzadkiego zjawiska: aktualizacji bez podnoszenia abonamentu.
Co nowego w kodowaniu?
Na benchmarku SWE-bench Verified, Opus 4.1 osiągnął wynik 74,5% – to poprawa, którą doceni każdy programista, szczególnie ten walczący na co dzień z wieloplikiem spaghetti code. GitHub odnotował wzrost wydajności we wszystkich obszarach w porównaniu z Opus 4, a w refaktoryzacji kodu rozproszonego po wielu plikach – wręcz skok jakości. Rakuten Group chwali precyzję modelu, który potrafi wskazać dokładnie to, co trzeba poprawić, bez dorzucania zbędnych modyfikacji i – co istotne – bez generowania nowych błędów. Windsurf natomiast zauważa „jedno odchylenie standardowe” przewagi nad poprzednią wersją, porównując ten postęp do skoku z Sonnet 3.7 na Sonnet 4.

Dlaczego warto się przesiąść?
Anthropic nie kryje, że zaleca migrację z Opus 4 do Opus 4.1 we wszystkich zastosowaniach. Deweloperzy mogą po prostu wskazać w API model claude-opus-4-1-20250805
. Dokumentacja, karta systemowa i cennik są dostępne online – choć jeśli wierzyć branżowym anegdotom, większość i tak od razu rzuci się na testowanie w praktyce.
Można więc powiedzieć, że Opus 4.1 to taki „update w starym stylu” – bez zbędnych fajerwerków marketingowych, za to z realnymi usprawnieniami, które mają znaczenie. A jeśli rzeczywiście większe zmiany dopiero przed nami, to… warto zacząć ostrzyć klawiatury.