OpenAI o1 och reasoning-modeller. Vad innebär det egentligen?
OpenAI släppte o1-preview den 12 september och det är något annorlunda. Till skillnad från GPT-4o som svarar direkt, tar o1 en paus och “tänker” genom problemet steg för steg innan den svarar. OpenAI kallar det en reasoning-modell.
I praktiken syns det som att modellen tar längre tid på sig, ibland 10-30 sekunder, och man kan se att den arbetar sig igenom problemet. Svaren på komplexa frågor är märkbart bättre, speciellt för matematik, logik och kodning.
Jag testade med ett par redovisningsproblem som kräver att man håller flera steg i huvudet samtidigt. En koncerneliminering med valutaeffekter och internvinst. o1 löste det korrekt, steg för steg, med tydlig logik. GPT-4o hade gett ett ungefärligt svar med ett par fel. Skillnaden var tydlig.
Men det finns nackdelar. o1 är långsammare och dyrare, och den saknar tillgång till verktyg som Code Interpreter och filuppladdning. Så man kan inte använda den för dataanalys på samma sätt som GPT-4o. Det är en avvägning: djupare resonemang kontra bredare funktionalitet.
Jag ser det som ett tecken på vart allt är på väg. Framtida modeller kommer antagligen kombinera snabb respons med djupare resonemang beroende på uppgiften. Det är inte svårt att föreställa sig en modell som automatiskt avgör om en fråga kräver snabbt svar eller djupanalys.
Samtidigt har Microsoft annonserat Copilot Wave 2 med förbättringar i hela M365-sviten. Bland annat ska Copilot i Excel bli bättre på att hantera formler och dataanalys, och det kommer en ny funktion som heter Copilot Pages för samarbete kring AI-genererat innehåll. De byter också till GPT-4o under huven. Jag har fortfarande inte tillgång till M365 Copilot men det känns som att det rör sig i rätt riktning.
En annan reflektion: jag har märkt att mina kollegor som faktiskt använder AI regelbundet blivit betydligt mer produktiva. Men de som inte börjat ännu har inte förändrat sitt arbetssätt alls. Gapet börjar bli tydligt och det oroar mig lite. Inte för att alla måste bli AI-experter men för att de som inte ens testar riskerar att hamna efter på ett sätt som blir svårt att ta igen.