Hoppa till innehåll

Claude kan styra din dator nu (men du ska nog vänta)

2 min läsning
Av Filip Wannehag

Anthropic har haft en händelserik oktober. De släppte en uppgraderad version av Claude 3.5 Sonnet som är ännu bättre på kodning och analys, och de annonserade en funktion kallad “computer use” som låter Claude styra en dator genom att titta på skärmen och klicka runt.

Låt mig ta det viktigaste först: den uppgraderade Sonnet är riktigt bra. Kodgenereringen har tagit ett steg till och den är bättre på att följa komplexa instruktioner. Jag har använt den för mitt Python-projekt med rapportautomatisering och skillnaden mot den tidigare versionen märks. Speciellt när det handlar om att felsöka kod, den identifierar problem snabbare och föreslår bättre lösningar.

Computer use däremot är en helt annan sak. Konceptet är att Claude kan ta screenshots av din skärm, identifiera vad som visas, och sen styra mus och tangentbord för att utföra uppgifter. I teorin kan den alltså logga in i ditt affärssystem, navigera runt och hämta ut data åt dig.

I praktiken är det väldigt tidigt. Anthropic säger själva att det är i beta och att man inte ska ge den tillgång till känsliga system. Den räknar pixlar för att navigera, det är alltså inte som att den förstår vad som finns på skärmen på en djup nivå. Den gissar baserat på hur det ser ut.

Jag har inte testat det själv och tänker inte göra det med jobbdata. Men konceptet är intressant på sikt. Tänk dig att du kan säga “logga in i vårt fastighetssystem, hämta driftskostnaderna för Q3 och lägg dem i mitt Excel-ark”. Det är inte idag men det är riktningen.

GitHub annonserade också att Claude 3.5 Sonnet kommer bli tillgänglig i GitHub Copilot. Det är intressant för de av oss som skriver kod, om än inte professionellt. Att ha Claude som AI-assistent direkt i VS Code eller annan editor kan vara smidigt.

Det jag reflekterar mest över den här månaden är egentligen inte specifika verktyg utan tempot. Varje månad jag skriver de här uppdateringarna har det hänt något som ändrar vad som är möjligt. Det är svårt att planera långsiktigt när landskapet förändras så snabbt. Min strategi har blivit att hålla sig uppdaterad, experimentera brett, och inte investera för tungt i något enskilt verktyg.