Del 2 av 8

LLM-modeller: Vilken, när och varför?

Modellvalet påverkar svarskvalitet, svarstid och kostnad. Rätt modell för rätt uppgift är en kärnkompetens i AI-assisterad utveckling.

Lektion 1 — V1 dag 1 (fortsättning) Vi kartlägger modelllandskapet i GitHub Copilot-kontexten och tränar på att välja rätt modell för rätt uppgift — utan att bränna premium-requests i onödan.

Modelllandskapet i GitHub Copilot

GitHub Copilot ger tillgång till modeller från OpenAI, Anthropic och Google. De skiljer sig i förmåga, svarstid och resursförbrukning. Vilka modeller du kan välja beror på din Copilot-plan.

Modell Familj Tillgänglig i Kontextfönster Bäst för
FREE — ingår utan premiumkostnad (50 premium-req/mån total)
GPT-5 mini OpenAI Free, Pro, Pro+ Snabb chatt, förklaringar, standarduppgifter
GPT-4.1 OpenAI Free, Pro, Pro+ Allmän kod, förklaringar
Claude Haiku 4.5 Anthropic Free, Pro, Pro+ 200 000 tokens Snabba Claude-svar, extended thinking (low)
PRO — premium-requests (300/mån, $10/mån)
Claude Sonnet 4.6 Anthropic Pro, Pro+ 1 000 000 tokens Lång kontext, code review, extended thinking (low/med/high)
GPT-5.4 OpenAI Pro, Pro+ Komplex kodanalys, arkitekturresonemang
Gemini 3.1 Pro Google Pro, Pro+ Multi-modal, bred analys
PRO+ — premium-requests (1 500/mån, $39/mån)
Claude Opus 4.7 Anthropic Pro+ only 1 000 000 tokens Storskale code review, agentic coding, komplexa codebases
GPT-5.5 OpenAI Pro+ only Toppkapacitet, avancerad kodgenerering
Vad är "premium-requests"? GitHub Copilot räknar vissa modeller som "premium". Free: 50 premium-requests/mån totalt. Pro: 300/mån. Pro+: 1 500/mån. GPT-5 mini, GPT-4.1 och Claude Haiku 4.5 räknas inte som premium — de kan användas obegränsat. Claude Sonnet 4.6 och GPT-5.4 kostar ett måttligt antal requests per fråga. Claude Opus 4.7 och GPT-5.5 kostar mest per request och kräver Pro+.

Extended thinking — djupare analys på begäran

Flera Claude-modeller i Copilot stöder extended thinking — ett läge där modellen resonerar internt i flera steg innan den svarar. Det ersätter den gamla o-seriens reasoning-förmåga och ger djupare analys på komplexa problem utan att byta modell.

När ska du använda extended thinking?

Beslutsträd — Rätt modell för uppgiften

Använd detta beslutsträd som tumregel i ditt dagliga arbete:

Vad ska du göra? │ ├─ Skriva ny kod / komplettera / boilerplate │ └─ GPT-5 mini (snabb, standard, inga premiumkostnader) │ ├─ Förklara ett koncept / research av ny teknik │ ├─ Enkelt ämne → GPT-5 mini eller Claude Haiku 4.5 │ └─ Komplext ämne med djup analys → Claude Sonnet 4.6 (extended thinking) │ ├─ Felsöka ett logikproblem / algoritm │ └─ Claude Sonnet 4.6 (extended thinking, medium) eller GPT-5.4 │ ├─ Code review av en hel fil eller modul │ ├─ Snabb granskning → Claude Sonnet 4.6 (lång kontext, 1M tokens) │ └─ Djup arkitekturgranskning → Claude Opus 4.7 (kräver Pro+) │ ├─ Arkitekturdesign och ADR-skrivning │ ├─ Utforskande → Claude Sonnet 4.6 (extended thinking, high) │ └─ Stor codebase, systemnivå → Claude Opus 4.7 (kräver Pro+) │ └─ Generera/uppdatera instruktionsfiler └─ Claude Sonnet 4.6 eller GPT-5.4

Kontextfönster — varför det spelar roll

Kontextfönstret är hur mycket text (kod + konversation + instruktioner) modellen kan "se" på en gång. Ju mer du skickar in, desto mer kontext har AI:n — men det tar också mer plats av fönstret.

KontextfönsterUngefärlig kapacitetPraktisk betydelse
200 000 tokens ~150 000 ord / ~6 000 rader C#-kod Flera filer, hela features, stora testsviter (Claude Haiku 4.5)
1 000 000 tokens ~750 000 ord / ~30 000 rader C#-kod Hela codebases, många filer parallellt (Claude Sonnet 4.6, Opus 4.7)
Tokens ≠ tecken En token är ungefär 3–4 tecken på engelska, lite mer på svenska. C#-kod är kompakt — en typisk metod på 20 rader tar ca 150–200 tokens. Copilot Chat-instruktionsfiler laddas automatiskt och tar plats i fönstret — håll dem fokuserade.

Cascading model strategy — kostnadsoptimering

I ett team kan ni spara premium-requests genom att använda cascading model strategy: börja alltid med den enklaste modellen som kan lösa uppgiften och eskalera uppåt när resultatet inte räcker.

  1. Steg 1: Prova med GPT-5 mini (inkluderat, snabbt, inga premiumkostnader)
  2. Steg 2: Räcker inte svaret? Byt till Claude Haiku 4.5 (inkluderat, stöder extended thinking low)
  3. Steg 3: Kräver uppgiften djup analys? Byt till Claude Sonnet 4.6 (Pro, extended thinking low/med/high)
  4. Steg 4: Storskale-granskning, komplex codebase? Välj Claude Opus 4.7 (kräver Pro+)
Praktisk regel Använd Claude Opus 4.7 som ett verktyg, inte som standard. Reservera det för uppgifter där du vet att svarskvaliteten gör skillnad: arkitekturgranskningar, generering av instruktionsfiler och komplexa debug-sessioner på stora codebases.

Modellval i Visual Studio vs. VS Code

Copilot finns i båda miljöerna men modellvalet exponeras olika:

Referenser

Elektroniska resurser

Böcker

Övningar

Lös övningarna självständigt. Det finns inget facit — lärandet sker i processen.

  1. Jämför modellsvar
    Välj ett C#-arkitekturproblem du känner väl (t.ex. "Hur strukturerar jag ett Repository-lager med enhetstestbarhet i åtanke?"). Ställ exakt samma fråga i Copilot Chat med (a) GPT-5 mini och (b) Claude Sonnet 4.6 (extended thinking, medium). Dokumentera: skillnad i svarlängd, djup, konkrethet och svarstid. Vilken föredr du för denna typ av fråga?
  2. Kontextfönster i praktiken
    Öppna en stor C#-fil (minst 200 rader) i VS Code. Bifoga hela filen i Copilot Chat med #file-referens och be om en sammanfattning av klassernas ansvar. Gör sedan om med en mindre fil och jämför svarskvaliteten. Reflektera: märker du skillnad när kontextfönstret fylls upp?
  3. Cascading i ett scenario
    Du har en svårförklarlig bugg: en async-metod returnerar felaktiga data i specifika race condition-scenarier. Tillämpa cascading model strategy — börja med GPT-5 mini och eskalera om svaret inte löser problemet. Dokumentera vid vilket steg du fick ett användbart svar och varför du escalerade.

Soloprojektor

Projekt 1 — Modellstrategi för ditt projekt Ta projektet från del 01. Skapa en MODEL-STRATEGY.md där du för varje typ av AI-interaktion i projektet definierar: vilken modell du väljer, varför, och vilket fallback du har. Inkludera minst fem scenarion (t.ex. ny feature, felsökning, code review, research, dokumentation).
Projekt 2 — Research med Claude Sonnet 4.6 (fördjupning) Välj ett .NET-bibliotek eller mönster du inte jobbat med (t.ex. Polly v8, Keyed Services i .NET 8 DI, eller System.Threading.Channels). Gör en komplett research-session med Claude Sonnet 4.6 (extended thinking, high) i Copilot Chat. Dokumentera resultatet som en kort ADR (Architecture Decision Record) och inkludera ett fungerande C#-minimalt kodexempel.

← Föregående: Introduktion Nästa: Prompt Engineering →