Databricks
Vad är Databricks?
Databricks är en molnbaserad dataplattform som kombinerar dataingenjörskonst, dataanalys och maskininlärning i en enhetlig miljö. Plattformen bygger på konceptet Lakehouse – en arkitektur som förenar fördelarna med traditionella datalager (data warehouse) och datalakes i en gemensam plattform.
Databricks grundades 2013 av skaparna bakom Apache Spark och har vuxit till en av de mest använda dataplattformarna globalt. Plattformen är tillgänglig på alla tre stora molnleverantörer: Microsoft Azure (Azure Databricks), Amazon Web Services (AWS) och Google Cloud Platform (GCP).
Hur fungerar Databricks?
Databricks erbjuder en arbetsyta (workspace) där datateam kan samarbeta kring hela datalivscykeln:
Data engineering. Ingest, transformering och orchestrering av dataflöden med Delta Live Tables och Apache Spark. Stöd för batch- och realtidsbearbetning.
Data warehousing. SQL-baserade analyser direkt på Lakehouse-arkitekturen via Databricks SQL, utan att behöva flytta data till ett separat datalager.
Maskininlärning och AI. Inbyggt stöd för hela ML-livscykeln – från experiment och modellträning till deployment och övervakning – via MLflow och Mosaic AI.
Data governance. Unity Catalog ger centraliserad styrning av data, åtkomst och kvalitet över hela organisationen.
Databricks Lakehouse – arkitekturen i grunden
Lakehouse-arkitekturen är Databricks svar på utmaningen med att organisationer historiskt sett behövt underhålla separata system för dataingenjörsarbete (data lake) och affärsanalys (data warehouse). Genom att använda det öppna lagringsformatet Delta Lake kan Databricks erbjuda:
- Transaktionsstöd (ACID) direkt på datasjöns lagring.
- Schema enforcement och evolution för datakvalitet.
- Tidsresekapacitet för att komma åt historiska versioner av data.
- Prestanda i paritet med traditionella datalager för SQL-analyser.
Azure Databricks
För organisationer i Microsofts ekosystem är Azure Databricks den vanligaste integrationspunkten. Azure Databricks är en förstapartstjänst i Azure och integrerar med Azure Active Directory (Entra ID), Azure Data Factory, Azure Synapse, Power BI och Microsofts övriga datatjänster. Det innebär enhetlig fakturering, identitetshantering och nätverkskonfiguration.
Databricks för AI och GenAI
Databricks har investerat kraftigt i att bli en plattform för AI-utveckling. Med Mosaic AI kan organisationer träna, finjustera och servera stora språkmodeller (LLM:er) inom sin egen datainfrastruktur. Retrieval-Augmented Generation (RAG), vektorbaserad sökning och prompt engineering stöds nativt. Detta gör Databricks till ett alternativ för organisationer som vill bygga AI-lösningar på sin egen data – utan att skicka den till externa AI-tjänster.
Vem använder Databricks?
Databricks riktar sig till organisationer med mogna databehov – från medelstora företag till globala koncerner. Vanliga användare inkluderar dataingenjörer, dataanalytiker, data scientists och ML-ingenjörer. Plattformen är branschagnostisk men särskilt vanlig inom finans, detaljhandel, hälsovård, media och tillverkningsindustrin.
-
A
- Accesspunkt
- Active Directory
- Affärssystem
- Agent Assist
- Agentic AI
- AI
- AIaaS
- API
- Automation
- AWS (Amazon Web Services)
- Azure API Management
- Azure Cosmos DB
- Azure Data Factory
- Azure DevOps
- Azure Event Grid
- Azure Event Hubs
- Azure Function Apps
- Azure Integration Services
- Azure Key Vault
- Azure Logic Apps
- Azure Service Bus
- Azure Storage Account
- B
-
C
- C3PAO
- CCaaS
- CEaaS
- Chatbot
- CI/CD
- CIS
- Claude Code
- CLI
- Click to Do
- CLOUD Act
- Cloud Native
- Cloud Security (Molnsäkerhet)
- CMMC
- Containerisering
- Copilot
- CRC
- CRM
- CSIRT
- CSP (Cloud Solution Provider)
- CSRD
- Customer experience
- Cyber range
- Cyber resilience
- Cyberresiliensförordningen
- Cybersäkerhet
- Cybersäkerhetslagen
- Cybersäkerhetsakten
-
D
- DaaS
- DANE
- Data-fabric plattform
- Data Lake
- Dataanalys
- Databas
- Databricks
- Datacenter
- Datahantering (Data Management)
- Datamigrering
- Datasuveränitet
- Datavisualisering
- DDoS
- Deep learning
- DevOps
- DevSecOps
- Digital leveranskedja
- Digital tvilling
- Digitalisering
- Disaster Recovery
- Data Loss Prevention (DLP)
- DMA
- DNSSEC
- Docker
- DORA
- Disaster Recovery as a Service (DRaaS)
- DRP
- E
- F
- G
- H
-
I
- IAM
- Identity Governance and Administration (IGA)
- Immutable backups
- Inference
- Informationssäkerhet
- Infrastruktur-som-kod
- Integration
- Integration ERP
- Integrationsförvaltning
- Intrångsdetektionssystem (IDS)
- Intune
- IoT - Internet of Things
- ISO
- IT-drift
- IT-forensik
- IT-säkerhet
- IT-upphandling
- ITAD Services
- IT Asset Management (ITAM)
- ITIL
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- Å
- Ä
- Ö