Del 2 av 8

LLM-modeller: Vilken, när och varför?

Modellvalet påverkar svarskvalitet, svarstid och kostnad. Rätt modell för rätt uppgift är en kärnkompetens i AI-assisterad utveckling.

Lektion 1 — V1 dag 1 (fortsättning) Vi kartlägger modelllandskapet i GitHub Copilot-kontexten och tränar på att välja rätt modell för rätt uppgift — utan att bränna premium-requests i onödan.

Modelllandskapet i GitHub Copilot

GitHub Copilot ger tillgång till modeller från OpenAI, Anthropic och Google. De skiljer sig i förmåga, svarstid och resursförbrukning. Vilka modeller du kan välja beror på din Copilot-plan.

Modell	Familj	Tillgänglig i	Kontextfönster	Bäst för
FREE — ingår utan premiumkostnad (50 premium-req/mån total)
GPT-5 mini	OpenAI	Free, Pro, Pro+	—	Snabb chatt, förklaringar, standarduppgifter
GPT-4.1	OpenAI	Free, Pro, Pro+	—	Allmän kod, förklaringar
Claude Haiku 4.5	Anthropic	Free, Pro, Pro+	200 000 tokens	Snabba Claude-svar, extended thinking (low)
PRO — premium-requests (300/mån, $10/mån)
Claude Sonnet 4.6	Anthropic	Pro, Pro+	1 000 000 tokens	Lång kontext, code review, extended thinking (low/med/high)
GPT-5.4	OpenAI	Pro, Pro+	—	Komplex kodanalys, arkitekturresonemang
Gemini 3.1 Pro	Google	Pro, Pro+	—	Multi-modal, bred analys
PRO+ — premium-requests (1 500/mån, $39/mån)
Claude Opus 4.7	Anthropic	Pro+ only	1 000 000 tokens	Storskale code review, agentic coding, komplexa codebases
GPT-5.5	OpenAI	Pro+ only	—	Toppkapacitet, avancerad kodgenerering

Vad är "premium-requests"? GitHub Copilot räknar vissa modeller som "premium". Free: 50 premium-requests/mån totalt. Pro: 300/mån. Pro+: 1 500/mån. GPT-5 mini, GPT-4.1 och Claude Haiku 4.5 räknas inte som premium — de kan användas obegränsat. Claude Sonnet 4.6 och GPT-5.4 kostar ett måttligt antal requests per fråga. Claude Opus 4.7 och GPT-5.5 kostar mest per request och kräver Pro+.

Extended thinking — djupare analys på begäran

Flera Claude-modeller i Copilot stöder extended thinking — ett läge där modellen resonerar internt i flera steg innan den svarar. Det ersätter den gamla o-seriens reasoning-förmåga och ger djupare analys på komplexa problem utan att byta modell.

Low — snabbt, några extra resonemangssteg. Bra för felsökning och enklare kod-review. Finns i Claude Haiku 4.5 (Free).
Medium — balans mellan djup och svarstid. Bra för arkitekturanalys. Kräver Claude Sonnet 4.6 (Pro).
High — maximal analys, långsammare. Bra för komplexa designbeslut och ADR-skrivning. Kräver Claude Sonnet 4.6 (Pro).

När ska du använda extended thinking?

Komplex felsökning där du inte förstår varför koden beter sig fel
Arkitekturanalys: "Vilka problem uppstår om jag väljer mönster X?"
Djup förklaring av ett nytt mönster eller bibliotek
Bedömning av trade-offs mellan två tekniska alternativ

Beslutsträd — Rätt modell för uppgiften

Använd detta beslutsträd som tumregel i ditt dagliga arbete:

Vad ska du göra? │ ├─ Skriva ny kod / komplettera / boilerplate │ └─ GPT-5 mini (snabb, standard, inga premiumkostnader) │ ├─ Förklara ett koncept / research av ny teknik │ ├─ Enkelt ämne → GPT-5 mini eller Claude Haiku 4.5 │ └─ Komplext ämne med djup analys → Claude Sonnet 4.6 (extended thinking) │ ├─ Felsöka ett logikproblem / algoritm │ └─ Claude Sonnet 4.6 (extended thinking, medium) eller GPT-5.4 │ ├─ Code review av en hel fil eller modul │ ├─ Snabb granskning → Claude Sonnet 4.6 (lång kontext, 1M tokens) │ └─ Djup arkitekturgranskning → Claude Opus 4.7 (kräver Pro+) │ ├─ Arkitekturdesign och ADR-skrivning │ ├─ Utforskande → Claude Sonnet 4.6 (extended thinking, high) │ └─ Stor codebase, systemnivå → Claude Opus 4.7 (kräver Pro+) │ └─ Generera/uppdatera instruktionsfiler └─ Claude Sonnet 4.6 eller GPT-5.4

Kontextfönster — varför det spelar roll

Kontextfönstret är hur mycket text (kod + konversation + instruktioner) modellen kan "se" på en gång. Ju mer du skickar in, desto mer kontext har AI:n — men det tar också mer plats av fönstret.

Kontextfönster	Ungefärlig kapacitet	Praktisk betydelse
200 000 tokens	~150 000 ord / ~6 000 rader C#-kod	Flera filer, hela features, stora testsviter (Claude Haiku 4.5)
1 000 000 tokens	~750 000 ord / ~30 000 rader C#-kod	Hela codebases, många filer parallellt (Claude Sonnet 4.6, Opus 4.7)

Tokens ≠ tecken En token är ungefär 3–4 tecken på engelska, lite mer på svenska. C#-kod är kompakt — en typisk metod på 20 rader tar ca 150–200 tokens. Copilot Chat-instruktionsfiler laddas automatiskt och tar plats i fönstret — håll dem fokuserade.

Cascading model strategy — kostnadsoptimering

I ett team kan ni spara premium-requests genom att använda cascading model strategy: börja alltid med den enklaste modellen som kan lösa uppgiften och eskalera uppåt när resultatet inte räcker.

Steg 1: Prova med GPT-5 mini (inkluderat, snabbt, inga premiumkostnader)
Steg 2: Räcker inte svaret? Byt till Claude Haiku 4.5 (inkluderat, stöder extended thinking low)
Steg 3: Kräver uppgiften djup analys? Byt till Claude Sonnet 4.6 (Pro, extended thinking low/med/high)
Steg 4: Storskale-granskning, komplex codebase? Välj Claude Opus 4.7 (kräver Pro+)

Praktisk regel Använd Claude Opus 4.7 som ett verktyg, inte som standard. Reservera det för uppgifter där du vet att svarskvaliteten gör skillnad: arkitekturgranskningar, generering av instruktionsfiler och komplexa debug-sessioner på stora codebases.

Modellval i Visual Studio vs. VS Code

Copilot finns i båda miljöerna men modellvalet exponeras olika:

VS Code: Du väljer modell explicit i Copilot Chat-rutan via en dropdown. Full tillgång till alla modeller kopplade till din prenumeration.
Visual Studio 2026: Modellvalet sker via Copilot Chat-fönstret. Tillgång till samma modellurval men gränssnittet är mer integrerat i IDE:t.
Inline suggestions (kod-komplettering) använder alltid en optimerad standardmodell oavsett vad du valt i chatten.

Referenser

Elektroniska resurser

Använda Claude i GitHub Copilot

Officiell guide till hur Anthropic Claude-modeller fungerar i Copilot, inklusive skillnader mot OpenAI-modellerna.

docs.github.com/en/copilot/using-claude-sonnet

Docs

Claude-modeller — Anthropic dokumentation

Officiell översikt över Claude Haiku 4.5, Sonnet 4.6 och Opus 4.7 med kontextfönster, prissättning och extended thinking-stöd.

docs.anthropic.com/en/docs/about-claude/models/overview

Docs

Claude Opus — Anthropic

Anthropics förklaring av Opus-modellens kapaciteter, inklusive prestandabenchmarks och lämpliga användningsfall.

anthropic.com/claude/opus

Docs

Böcker

AI-Assisted Programming — Tom Taulli

Täcker modellval och strategier för att använda olika AI-verktyg i professionell mjukvaruutveckling.

oreilly.com/library/view/ai-assisted-programming

Bok

Övningar

Lös övningarna självständigt. Det finns inget facit — lärandet sker i processen.

Jämför modellsvar
Välj ett C#-arkitekturproblem du känner väl (t.ex. "Hur strukturerar jag ett Repository-lager med enhetstestbarhet i åtanke?"). Ställ exakt samma fråga i Copilot Chat med (a) GPT-5 mini och (b) Claude Sonnet 4.6 (extended thinking, medium). Dokumentera: skillnad i svarlängd, djup, konkrethet och svarstid. Vilken föredr du för denna typ av fråga?
Kontextfönster i praktiken
Öppna en stor C#-fil (minst 200 rader) i VS Code. Bifoga hela filen i Copilot Chat med #file-referens och be om en sammanfattning av klassernas ansvar. Gör sedan om med en mindre fil och jämför svarskvaliteten. Reflektera: märker du skillnad när kontextfönstret fylls upp?
Cascading i ett scenario
Du har en svårförklarlig bugg: en async-metod returnerar felaktiga data i specifika race condition-scenarier. Tillämpa cascading model strategy — börja med GPT-5 mini och eskalera om svaret inte löser problemet. Dokumentera vid vilket steg du fick ett användbart svar och varför du escalerade.

Soloprojektor

Projekt 1 — Modellstrategi för ditt projekt Ta projektet från del 01. Skapa en MODEL-STRATEGY.md där du för varje typ av AI-interaktion i projektet definierar: vilken modell du väljer, varför, och vilket fallback du har. Inkludera minst fem scenarion (t.ex. ny feature, felsökning, code review, research, dokumentation).

Projekt 2 — Research med Claude Sonnet 4.6 (fördjupning) Välj ett .NET-bibliotek eller mönster du inte jobbat med (t.ex. Polly v8, Keyed Services i .NET 8 DI, eller System.Threading.Channels). Gör en komplett research-session med Claude Sonnet 4.6 (extended thinking, high) i Copilot Chat. Dokumentera resultatet som en kort ADR (Architecture Decision Record) och inkludera ett fungerande C#-minimalt kodexempel.

← Föregående: Introduktion Nästa: Prompt Engineering →