Context window

Vad är ett context window?

Ett context window, på svenska kontextfönster, är den maximala mängd text en språkmodell kan beakta samtidigt när den genererar ett svar. Mängden mäts i tokens – de textfragment som modellen arbetar med internt – och omfattar både inmatning, dokument och modellens eget svar. Kontextfönstret fungerar som modellens arbetsminne: allt som ska påverka svaret måste rymmas inom det.

Betydelsen av context window

Kontextfönstrets storlek avgör i praktiken vilka uppgifter en AI-lösning klarar. En modell med litet kontextfönster kan inte sammanfatta en lång rapport, analysera ett helt avtal eller hålla en lång konversation utan att tappa tråden. För verksamheter som utvärderar AI-verktyg är kontextfönstret därför en central parameter – det styr både vad lösningen kan göra och vad den kostar i drift.

Så fungerar ett context window

När en stor språkmodell (LLM) tar emot en fråga händer följande:

Tokenisering: all text – systeminstruktioner, konversationshistorik, bifogade dokument och själva frågan – delas upp i tokens.
Fönstret fylls: alla tokens placeras i kontextfönstret tillsammans med utrymme för svaret.
Beräkning över hela kontexten: modellen väger samman alla tokens i fönstret när den beräknar nästa ord i svaret.
Trunkering vid överskridande: om innehållet inte ryms klipps något bort – ofta den äldsta delen av konversationen.

Stora kontextfönster ger dock inte automatiskt bättre svar – och kostnaden stiger med antalet tokens som bearbetas.

Användningsområden för context window

Vid dokumentanalys avgör kontextfönstret hur stora underlag som kan bearbetas i ett svep, och i AI-assistenter hur mycket historik och företagsdata som kan följa med varje fråga. I arkitekturval är det ofta avgörande: i stället för att trycka in hela kunskapsbanken i kontexten används ofta RAG (Retrieval Augmented Generation), där bara de mest relevanta utdragen läggs i fönstret – bättre precision till lägre kostnad.

Context window i din AI-strategi

Rätt balans mellan kontextstorlek, kostnad och svarskvalitet är en designfråga i varje AI-projekt. Advania hjälper verksamheter att utvärdera modeller, dimensionera lösningar och bygga arkitekturer – exempelvis RAG-baserade – där kontextfönstret används effektivt i stället för att bli en dold kostnadsdrivare.

Vanliga frågor och svar om context window

Vad är skillnaden mellan context window och modellens träningsdata?

Träningsdata är det material modellen en gång lärde sig av och som ligger inbakat i dess parametrar. Kontextfönstret är det tillfälliga arbetsminnet vid varje anrop – information där påverkar bara det aktuella svaret.

Hur stort är ett typiskt context window?

Det varierar kraftigt – från några tusen tokens i tidiga modeller till hundratusentals eller miljontals i de senaste. En token motsvarar ungefär trekvarts ord på engelska, något mindre på svenska.

Varför "glömmer" en chattbot vad jag skrev tidigare?

När konversationen växer förbi kontextfönstret klipps äldre delar bort – modellen har då inte längre tillgång till det som sades först.

Är ett större context window alltid bättre?

Nej. Större fönster ger högre kostnad och längre svarstider. Ofta är en mindre kontext med väl utvald information – till exempel via RAG – både billigare och träffsäkrare.

Viktiga punkter att ta med sig om context window

Arbetsminne: kontextfönstret är den text modellen kan beakta samtidigt – inget utanför det påverkar svaret.
Mäts i tokens: både inmatning och svar räknas mot samma gräns.
Kostnadsdrivare: större kontext kräver mer beräkningskraft och höjer priset per anrop.
Inte alltid bättre: mycket långa kontexter kan försämra precisionen.
RAG som komplement: att hämta rätt utdrag i stället för att skicka allt är ofta den smartaste användningen av fönstret.

AI & INNOVATION

Redo att skapa affärsnytta med AI – på ett tryggt sätt?

Utforska AI & Innovation