Self-hosted LLM
Vad är Self-hosted LLM?
Self-hosted LLM innebär att en organisation kör en stor språkmodell på sin egen infrastruktur istället för att använda en extern molntjänst som OpenAI eller Anthropic. Med framväxten av open source-modeller som LLaMA, Mistral och Falcon har det blivit allt mer praktiskt att drifta kraftfulla AI-modeller internt.
Varför self-hosta en LLM?
De främsta motiven är datasuveränitet (ingen data skickas till externa parter), anpassningsmöjligheter (fintuning på egen domändata), kostnadskontroll (inga per-token-avgifter vid hög volym), oberoende (inget leverantörsberoende) och regulatorisk efterlevnad (GDPR, AI Act, NIS2).
Tekniska förutsättningar
Att köra en LLM lokalt kräver GPU-kapacitet – moderna modeller på 7–70 miljarder parametrar behöver allt från ett enstaka GPU till ett kluster. Tekniker som kvantisering (reducering av modellens precision) gör det möjligt att köra modeller på mer modest hårdvara. Verktyg som vLLM, Ollama och TGI förenklar driftsättningen avsevärt.
Avvägningar
Self-hosting ger kontroll men kräver kompetens inom MLOps, modelloptimering och IT-drift. Modellerna behöver uppdateras, övervakas och underhållas. Organisationer bör noga utvärdera om fördelarna med self-hosting överväger de ökade driftkraven jämfört med att använda en hanterad AI-tjänst.
Vanliga frågor om Self-hosted LLM
Vad är en self-hosted LLM?
En self-hosted LLM är en stor språkmodell som en organisation kör på egen infrastruktur istället för att använda en extern molntjänst.
Vilka modeller kan man self-hosta?
Populära open source-alternativ inkluderar Meta LLaMA, Mistral, Falcon, Qwen och svenska GPT-SW3. Valet beror på användningsfall och hårdvara.
Vilken hårdvara krävs?
Det varierar med modellstorlek. En 7B-modell kan köras på en enstaka GPU (16-24 GB VRAM), medan 70B+ kräver flera GPU:er eller specialiserad hårdvara.
Är self-hosted LLM säkrare?
Från ett dataskyddsperspektiv ja – ingen data lämnar organisationen. Men säkerheten beror också på hur infrastrukturen skyddas och underhålls.
Vad är kvantisering?
Kvantisering reducerar modellens numeriska precision (t.ex. från 16-bit till 4-bit) vilket minskar minnesbehovet kraftigt med begränsad påverkan på kvaliteten.
-
A
- Accesspunkt
- Active Directory
- Affärssystem
- Agent Assist
- Agentic AI
- Artificial General Intelligence (AGI)
- AI
- AI Act / AI-förordningen
- AI-compliant
- AI Factory
- AI-first
- AI governance
- AI PC
- AI-proofed
- AI-ready
- AIaaS
- AIOps
- Algoritm
- Alignment
- API
- Attack Surface Management (ASM)
- Automation
- Autonomous agents
- AWS (Amazon Web Services)
- Azure API Management
- Azure Arc
- Azure Cosmos DB
- Azure Data Factory
- Azure DevOps
- Azure Event Grid
- Azure Event Hubs
- Azure Function Apps
- Azure Integration Services
- Azure Key Vault
- Azure Logic Apps
- Azure Service Bus
- Azure Storage Account
- B
-
C
- C3PAO
- CapEx vs OpEx
- CCaaS
- CEaaS
- Chatbot
- CI/CD
- Cirkulär IT
- CIS
- Claude Code
- CLI
- Click to Do
- CLOUD Act
- Cloud Native
- Cloud Security (Molnsäkerhet)
- CMMC
- CNAPP
- Colocation
- Computer vision
- Confidential Computing
- Containerisering
- Content Delivery Network (CDN)
- Copilot
- Copilot Studio
- CRC
- CRM
- CSIRT
- CSP (Cloud Solution Provider)
- CSRD
- CTEM
- Customer experience
- Cyber range
- Cyber resilience
- Cyberresiliensförordningen
- Cybersäkerhet
- Cybersäkerhetslagen
- Cybersäkerhetsakten
-
D
- DaaS
- DANE
- Data-fabric plattform
- Data Governance
- Data Lake
- Data Lakehouse
- Data Mesh
- Data sovereignty
- Dataanalys
- Databas
- Databricks
- Datacenter
- Datahantering (Data Management)
- Datamigrering
- Datasuveränitet
- Datavisualisering
- DDoS
- Deep learning
- Deepfake
- DevOps
- DevSecOps
- Digital Employee Experience (DEX)
- Digital Experience Platform (DXP)
- Digital leveranskedja
- Digital motståndskraft
- Digital Operational Resilience
- Digital suveränitet
- Digital tvilling
- Digital twin
- Digitalisering
- Disaster Recovery
- DKIM
- Data Loss Prevention (DLP)
- DMA
- DMARC
- DNSSEC
- Docker
- DORA
- Disaster Recovery as a Service (DRaaS)
- DRP
- E
- F
- G
- H
-
I
- IAM
- Identity Governance and Administration (IGA)
- Immutable backups
- Incident Response
- Inference
- Informationssäkerhet
- Infrastruktur-som-kod
- Integration
- Integration ERP
- Integrationsförvaltning
- Intrångsdetektionssystem (IDS)
- Intune
- IoT - Internet of Things
- ISO
- ISO 27001
- IT-drift
- IT-forensik
- IT-säkerhet
- IT-upphandling
- ITAD Services
- IT Asset Management (ITAM)
- ITIL
- J
- K
- L
-
M
- Malware
- Managed Print Services (MPS)
- Managed Service Provider (MSP)
- Maskininlärning
- Managed Detection and Response (MDR)
- MFA
- Microservices
- Microsoft 365
- Microsoft Defender
- Microsoft Entra ID
- Microsoft Fabric
- Microsoft Foundry
- Microsoft Pluton
- Microsoft Sentinel
- Microsoft Teams Rooms
- MLOps (Machine Learning Operations)
- Model Context Protocol (MCP)
- Model serving
- Molndrift
- Molnsäkerhet
- Monoberoende - Ändringar som hotar
- Mopria
- MTA-STS
- Multiagent Systems / Multiagentsystem
- Multicloud
- Multimodal
- N
- O
- P
- Q
- R
-
S
- SaaS
- Säkerhetsgranskning
- SASE
- SBTi
- Scope 1/2/3
- SDN
- Secure-Core PC
- Security Posture Management (CSPM/SSPM)
- Self-hosted LLM
- SEO
- Serverless Computing
- Servicedesk
- Shadow AI
- Sharepoint
- SIEM
- Single Sign-On (SSO)
- SIT-test
- Service Level Agreement (SLA)
- Small Language Models (SLM)
- SMTP AUTH
- SOAR
- SOC
- SOC 2
- Social Engineering
- Sovereign AI
- Sovereign Cloud
- Spear phishing
- SPF (Sender Policy Framework)
- Spoofing
- SRE (Site Reliability Engineering)
- Svanenmärkningen
- Synthetic data
- Systemintegration
- T
- U
- V
- W
- X
- Y
- Z
- Å
- Ä
- Ö