Claude Opus 4.6: briljant strateg, frustrerad Excel-kollega

Anthropic släppte Claude Opus 4.6 i onsdags och jag har ägnat hela helgen åt att köra den hårt. Det korta omdömet: det beror helt på vad du använder den till.

I Excel-arbete har jag varit både imponerad och genuint frustrerad. Modellen kan göra avancerade saker, komplexa formler, VBA-makron, dataanalys. Men den har en tendens att göra väldigt långtgående antaganden om vad jag vill ha. Jag ber om en enkel pivottabell-beräkning och den bygger ut det till ett helt dashboard med grafer, villkorlig formatering och hjälpkolumner jag aldrig bad om.

Problemet är inte bara att det tar längre tid. Det bränner tokens. Många tokens. Sen behöver jag be den justera, vilket bränner ännu fler tokens. En uppgift som borde kosta kanske fem kronor i API-anrop landar på trettio-fyrtio för att modellen först överbyggde och sen fick backa. Det är Opus-problemet i ett nötskal: den är för ambitiös.

Men sen öppnar jag ett nytt projekt där jag behöver bolla en AI-strategi för vår affärsenhet. Och då händer det. Opus 4.6 är helt fantastisk på det djuplodande arbetet. Ta fram policies, resonera kring governance-ramverk, identifiera risker, strukturera beslutsunderlag. Uppgifter som kräver flera stegs resonemang och förmåga att hålla många bollar i luften samtidigt. Där levererar den på en nivå som ingen annan modell jag testat kommer i närheten av.

Jag hoppas att nästa version av Sonnet kan leverera bättre på de mer vardagliga uppgifterna utan att bränna lika mycket tokens. Sonnet 4.5 var redan bra på kodning och korta uppgifter. Om den kan ta ett steg till i Excel-kompetens utan att ärva Opus tendens att övertolka varje instruktion vore det perfekt.

Min slutsats: Opus 4.6 är inte en modell man använder till allt. Den är en specialist. Ge den komplexa strategifrågor, långa analyser och dokument som kräver djupt resonemang. Ge Sonnet det dagliga arbetet. Den uppdelningen sparar både pengar och frustration.