Modellvalet påverkar svarskvalitet, svarstid och kostnad. Rätt modell för rätt uppgift är en kärnkompetens i AI-assisterad utveckling.
Lektion 1 — V1 dag 1 (fortsättning)
Vi kartlägger modelllandskapet i GitHub Copilot-kontexten och tränar på att välja rätt modell för rätt uppgift — utan att bränna premium-requests i onödan.
Modelllandskapet i GitHub Copilot
GitHub Copilot ger tillgång till modeller från OpenAI, Anthropic och Google. De skiljer sig i förmåga, svarstid och resursförbrukning. Vilka modeller du kan välja beror på din Copilot-plan.
Modell
Familj
Tillgänglig i
Kontextfönster
Bäst för
FREE — ingår utan premiumkostnad (50 premium-req/mån total)
GPT-5 mini
OpenAI
Free, Pro, Pro+
—
Snabb chatt, förklaringar, standarduppgifter
GPT-4.1
OpenAI
Free, Pro, Pro+
—
Allmän kod, förklaringar
Claude Haiku 4.5
Anthropic
Free, Pro, Pro+
200 000 tokens
Snabba Claude-svar, extended thinking (low)
PRO — premium-requests (300/mån, $10/mån)
Claude Sonnet 4.6
Anthropic
Pro, Pro+
1 000 000 tokens
Lång kontext, code review, extended thinking (low/med/high)
Vad är "premium-requests"?
GitHub Copilot räknar vissa modeller som "premium". Free: 50 premium-requests/mån totalt. Pro: 300/mån. Pro+: 1 500/mån. GPT-5 mini, GPT-4.1 och Claude Haiku 4.5 räknas inte som premium — de kan användas obegränsat. Claude Sonnet 4.6 och GPT-5.4 kostar ett måttligt antal requests per fråga. Claude Opus 4.7 och GPT-5.5 kostar mest per request och kräver Pro+.
Extended thinking — djupare analys på begäran
Flera Claude-modeller i Copilot stöder extended thinking — ett läge där modellen resonerar internt i flera steg innan den svarar. Det ersätter den gamla o-seriens reasoning-förmåga och ger djupare analys på komplexa problem utan att byta modell.
Low — snabbt, några extra resonemangssteg. Bra för felsökning och enklare kod-review. Finns i Claude Haiku 4.5 (Free).
Medium — balans mellan djup och svarstid. Bra för arkitekturanalys. Kräver Claude Sonnet 4.6 (Pro).
High — maximal analys, långsammare. Bra för komplexa designbeslut och ADR-skrivning. Kräver Claude Sonnet 4.6 (Pro).
När ska du använda extended thinking?
Komplex felsökning där du inte förstår varför koden beter sig fel
Arkitekturanalys: "Vilka problem uppstår om jag väljer mönster X?"
Djup förklaring av ett nytt mönster eller bibliotek
Bedömning av trade-offs mellan två tekniska alternativ
Beslutsträd — Rätt modell för uppgiften
Använd detta beslutsträd som tumregel i ditt dagliga arbete:
Vad ska du göra?
│
├─ Skriva ny kod / komplettera / boilerplate
│ └─ GPT-5 mini (snabb, standard, inga premiumkostnader)
│
├─ Förklara ett koncept / research av ny teknik
│ ├─ Enkelt ämne → GPT-5 mini eller Claude Haiku 4.5
│ └─ Komplext ämne med djup analys → Claude Sonnet 4.6 (extended thinking)
│
├─ Felsöka ett logikproblem / algoritm
│ └─ Claude Sonnet 4.6 (extended thinking, medium) eller GPT-5.4
│
├─ Code review av en hel fil eller modul
│ ├─ Snabb granskning → Claude Sonnet 4.6 (lång kontext, 1M tokens)
│ └─ Djup arkitekturgranskning → Claude Opus 4.7 (kräver Pro+)
│
├─ Arkitekturdesign och ADR-skrivning
│ ├─ Utforskande → Claude Sonnet 4.6 (extended thinking, high)
│ └─ Stor codebase, systemnivå → Claude Opus 4.7 (kräver Pro+)
│
└─ Generera/uppdatera instruktionsfiler
└─ Claude Sonnet 4.6 eller GPT-5.4
Kontextfönster — varför det spelar roll
Kontextfönstret är hur mycket text (kod + konversation + instruktioner) modellen kan "se" på en gång. Ju mer du skickar in, desto mer kontext har AI:n — men det tar också mer plats av fönstret.
Kontextfönster
Ungefärlig kapacitet
Praktisk betydelse
200 000 tokens
~150 000 ord / ~6 000 rader C#-kod
Flera filer, hela features, stora testsviter (Claude Haiku 4.5)
1 000 000 tokens
~750 000 ord / ~30 000 rader C#-kod
Hela codebases, många filer parallellt (Claude Sonnet 4.6, Opus 4.7)
Tokens ≠ tecken
En token är ungefär 3–4 tecken på engelska, lite mer på svenska. C#-kod är kompakt — en typisk metod på 20 rader tar ca 150–200 tokens. Copilot Chat-instruktionsfiler laddas automatiskt och tar plats i fönstret — håll dem fokuserade.
Cascading model strategy — kostnadsoptimering
I ett team kan ni spara premium-requests genom att använda cascading model strategy: börja alltid med den enklaste modellen som kan lösa uppgiften och eskalera uppåt när resultatet inte räcker.
Steg 1: Prova med GPT-5 mini (inkluderat, snabbt, inga premiumkostnader)
Steg 2: Räcker inte svaret? Byt till Claude Haiku 4.5 (inkluderat, stöder extended thinking low)
Steg 3: Kräver uppgiften djup analys? Byt till Claude Sonnet 4.6 (Pro, extended thinking low/med/high)
Steg 4: Storskale-granskning, komplex codebase? Välj Claude Opus 4.7 (kräver Pro+)
Praktisk regel
Använd Claude Opus 4.7 som ett verktyg, inte som standard. Reservera det för uppgifter där du vet att svarskvaliteten gör skillnad: arkitekturgranskningar, generering av instruktionsfiler och komplexa debug-sessioner på stora codebases.
Modellval i Visual Studio vs. VS Code
Copilot finns i båda miljöerna men modellvalet exponeras olika:
VS Code: Du väljer modell explicit i Copilot Chat-rutan via en dropdown. Full tillgång till alla modeller kopplade till din prenumeration.
Visual Studio 2026: Modellvalet sker via Copilot Chat-fönstret. Tillgång till samma modellurval men gränssnittet är mer integrerat i IDE:t.
Inline suggestions (kod-komplettering) använder alltid en optimerad standardmodell oavsett vad du valt i chatten.
Lös övningarna självständigt. Det finns inget facit — lärandet sker i processen.
Jämför modellsvar
Välj ett C#-arkitekturproblem du känner väl (t.ex. "Hur strukturerar jag ett Repository-lager med enhetstestbarhet i åtanke?"). Ställ exakt samma fråga i Copilot Chat med (a) GPT-5 mini och (b) Claude Sonnet 4.6 (extended thinking, medium). Dokumentera: skillnad i svarlängd, djup, konkrethet och svarstid. Vilken föredr du för denna typ av fråga?
Kontextfönster i praktiken
Öppna en stor C#-fil (minst 200 rader) i VS Code. Bifoga hela filen i Copilot Chat med #file-referens och be om en sammanfattning av klassernas ansvar. Gör sedan om med en mindre fil och jämför svarskvaliteten. Reflektera: märker du skillnad när kontextfönstret fylls upp?
Cascading i ett scenario
Du har en svårförklarlig bugg: en async-metod returnerar felaktiga data i specifika race condition-scenarier. Tillämpa cascading model strategy — börja med GPT-5 mini och eskalera om svaret inte löser problemet. Dokumentera vid vilket steg du fick ett användbart svar och varför du escalerade.
Soloprojektor
Projekt 1 — Modellstrategi för ditt projekt
Ta projektet från del 01. Skapa en MODEL-STRATEGY.md där du för varje typ av AI-interaktion i projektet definierar: vilken modell du väljer, varför, och vilket fallback du har. Inkludera minst fem scenarion (t.ex. ny feature, felsökning, code review, research, dokumentation).
Projekt 2 — Research med Claude Sonnet 4.6 (fördjupning)
Välj ett .NET-bibliotek eller mönster du inte jobbat med (t.ex. Polly v8, Keyed Services i .NET 8 DI, eller System.Threading.Channels). Gör en komplett research-session med Claude Sonnet 4.6 (extended thinking, high) i Copilot Chat. Dokumentera resultatet som en kort ADR (Architecture Decision Record) och inkludera ett fungerande C#-minimalt kodexempel.