RAG (Retrieval-Augmented Generation)
Vad är RAG (Retrieval-Augmented Generation)?
RAG, eller Retrieval-Augmented Generation, är en teknik som ger en Generativ AI-modell tillgång till extern, uppdaterad information innan den genererar ett svar. Istället för att modellen bara litar på sitt inbyggda minne (som kan vara gammalt eller felaktigt), söker den först upp relevant fakta i en pålitlig källa – t.ex. ditt företags databas eller intranät – och använder den informationen för att svara.
Varför RAG är viktigt
RAG löser två av de största problemen med LLM:er: Hallucination och brist på aktuell kunskap. En standardmodell vet inte vad som hände i världen imorse eller vad som står i din interna personalhandbok. Med RAG kan du bygga en chatbot som svarar korrekt baserat på dina egna dokument, utan att du behöver träna om modellen.
Hur fungerar RAG i praktiken?
Processen sker i tre steg:
- Hämta (Retrieval): När användaren ställer en fråga, söker systemet i din datahantering (ofta via en vektordatabas och Embeddings) efter relevanta textstycken.
- Berika (Augmentation): De hittade textstyckena bakas in i en prompt tillsammans med användarens fråga.
- Generera (Generation): AI-modellen får instruktionen: "Använd följande fakta för att svara på användarens fråga".
Vanliga frågor om RAG
Är min data säker med RAG?
Ja, oftast säkrare än med publika modeller. Eftersom din data hämtas i realtid och skickas till modellen i en sluten miljö (t.ex. via privat molndrift), behöver din data aldrig bli en del av modellens publika träning.
Vad är skillnaden på RAG och Fine-tuning?
Fine-tuning lär modellen *hur* den ska prata eller tänka (beteende). RAG ger modellen *vad* den ska prata om (fakta). För kunskapsbanker är RAG oftast det bästa valet.
Viktiga punkter att ta med sig:
- RAG kopplar ihop AI med dina egna datakällor.
- Minskar drastiskt risken för hallucinationer.
- Ger AI:n tillgång till nutida och privat information.
-
A
- Accesspunkt
- Active Directory
- Affärssystem
- Agent Assist
- Agentic AI
- AI
- AIaaS
- API
- Automation
- AWS (Amazon Web Services)
- Azure API Management
- Azure Cosmos DB
- Azure Data Factory
- Azure DevOps
- Azure Event Grid
- Azure Event Hubs
- Azure Function Apps
- Azure Integration Services
- Azure Key Vault
- Azure Logic Apps
- Azure Service Bus
- Azure Storage Account
- B
-
C
- C3PAO
- CCaaS
- CEaaS
- Chatbot
- CI/CD
- CIS
- CLI
- Click to Do
- CLOUD Act
- Cloud Native
- Cloud Security (Molnsäkerhet)
- CMMC
- Containerisering
- Copilot
- CRC
- CRM
- CSIRT
- CSP (Cloud Solution Provider)
- CSRD
- Customer experience
- Cyber range
- Cyber resilience
- Cyberresiliensförordningen
- Cybersäkerhet
- Cybersäkerhetslagen
- Cybersäkerhetsakten
-
D
- DaaS
- DANE
- Data-fabric plattform
- Data Lake
- Dataanalys
- Databas
- Datacenter
- Datahantering (Data Management)
- Datamigrering
- Datasuveränitet
- Datavisualisering
- DDoS
- Deep learning
- DevOps
- DevSecOps
- Digital leveranskedja
- Digital tvilling
- Digitalisering
- Disaster Recovery
- Data Loss Prevention (DLP)
- DMA
- DNSSEC
- Docker
- DORA
- Disaster Recovery as a Service (DRaaS)
- DRP
- E
- F
- G
- H
-
I
- IAM
- Identity Governance and Administration (IGA)
- Immutable backups
- Inference
- Informationssäkerhet
- Infrastruktur-som-kod
- Integration
- Integration ERP
- Integrationsförvaltning
- Intrångsdetektionssystem (IDS)
- Intune
- IoT - Internet of Things
- ISO
- IT-drift
- IT-säkerhet
- IT-upphandling
- ITAD Services
- IT Asset Management (ITAM)
- ITIL
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- Å
- Ä
- Ö