Hoppa till innehåll

DeepSeek och AI-prisraset

2 min läsning
Av Filip Wannehag

Den här veckan har varit galen. DeepSeek, ett kinesiskt AI-labb, släppte sin R1-modell och den toppade App Store i USA på ett par dagar. Nvidias aktie rasade 18%. Folk på Twitter pratar om att hela AI-boomen kanske var övervärderad.

Jag tänker att det är värt att ta ett steg tillbaka och förstå vad som faktiskt hänt.

DeepSeek R1 är en reasoning-modell, liknande OpenAI:s o1, som presterar i paritet med de bästa västerländska modellerna på de flesta benchmarks. Det uppseendeväckande är inte att den är bra utan vad den kostade att träna. DeepSeek hävdar att de tränade sin V3-modell för ungefär 6 miljoner dollar. OpenAI spenderade uppskattningsvis 100 miljoner dollar på GPT-4. Och den är open source under MIT-licens, så vem som helst kan ladda ner den och köra den själv.

Vad betyder det för oss som använder AI i arbetet? Framförallt att priserna på AI-tjänster kommer fortsätta sjunka. Om det går att bygga toppmodeller till en tiondel av kostnaden kan inte OpenAI och Anthropic fortsätta ta premium-priser i längden. Det är bra för oss som användare.

Men det finns frågetecken. DeepSeek är ett kinesiskt bolag och data som skickas till deras tjänst lagras på servrar i Kina. Flera länder har redan flaggat för säkerhetsrisker. Jag skulle inte rekommendera att använda DeepSeek med känslig företagsdata. Men för personligt bruk och experimenterande? Absolut värt att testa.

Det jag reflekterar mest över är hur snabbt spelplanen förändrats. För ett år sedan var det OpenAI och i viss mån Anthropic som satte agendan. Nu finns det seriös konkurrens från Kina, Google pushar med Gemini, och open source-modeller börjar bli riktigt bra. Konkurrens driver ner priser och driver upp kvalitet. Det är bra för alla som använder de här verktygen.

Jag har börjat experimentera med att köra lokala modeller hemma via Ollama. Med DeepSeek och Llama kan man köra ganska kapabla modeller på sin egen hårdvara utan att skicka data till molnet. Det är inte lika bra som Claude eller GPT-4o men för vissa uppgifter räcker det, och för den som är orolig för datasäkerhet är det ett intressant alternativ. Mer om det i ett kommande inlägg.