Databricks
Vad är Databricks?
Databricks är en molnbaserad dataplattform som kombinerar dataingenjörskonst, dataanalys och maskininlärning i en enhetlig miljö. Plattformen bygger på konceptet Lakehouse – en arkitektur som förenar fördelarna med traditionella datalager (data warehouse) och datalakes i en gemensam plattform.
Databricks grundades 2013 av skaparna bakom Apache Spark och har vuxit till en av de mest använda dataplattformarna globalt. Plattformen är tillgänglig på alla tre stora molnleverantörer: Microsoft Azure (Azure Databricks), Amazon Web Services (AWS) och Google Cloud Platform (GCP).
Hur fungerar Databricks?
Databricks erbjuder en arbetsyta (workspace) där datateam kan samarbeta kring hela datalivscykeln:
Data engineering. Ingest, transformering och orchestrering av dataflöden med Delta Live Tables och Apache Spark. Stöd för batch- och realtidsbearbetning.
Data warehousing. SQL-baserade analyser direkt på Lakehouse-arkitekturen via Databricks SQL, utan att behöva flytta data till ett separat datalager.
Maskininlärning och AI. Inbyggt stöd för hela ML-livscykeln – från experiment och modellträning till deployment och övervakning – via MLflow och Mosaic AI.
Data governance. Unity Catalog ger centraliserad styrning av data, åtkomst och kvalitet över hela organisationen.
Databricks Lakehouse – arkitekturen i grunden
Lakehouse-arkitekturen är Databricks svar på utmaningen med att organisationer historiskt sett behövt underhålla separata system för dataingenjörsarbete (data lake) och affärsanalys (data warehouse). Genom att använda det öppna lagringsformatet Delta Lake kan Databricks erbjuda:
- Transaktionsstöd (ACID) direkt på datasjöns lagring.
- Schema enforcement och evolution för datakvalitet.
- Tidsresekapacitet för att komma åt historiska versioner av data.
- Prestanda i paritet med traditionella datalager för SQL-analyser.
Azure Databricks
För organisationer i Microsofts ekosystem är Azure Databricks den vanligaste integrationspunkten. Azure Databricks är en förstapartstjänst i Azure och integrerar med Azure Active Directory (Entra ID), Azure Data Factory, Azure Synapse, Power BI och Microsofts övriga datatjänster. Det innebär enhetlig fakturering, identitetshantering och nätverkskonfiguration.
Databricks för AI och GenAI
Databricks har investerat kraftigt i att bli en plattform för AI-utveckling. Med Mosaic AI kan organisationer träna, finjustera och servera stora språkmodeller (LLM:er) inom sin egen datainfrastruktur. Retrieval-Augmented Generation (RAG), vektorbaserad sökning och prompt engineering stöds nativt. Detta gör Databricks till ett alternativ för organisationer som vill bygga AI-lösningar på sin egen data – utan att skicka den till externa AI-tjänster.
Vem använder Databricks?
Databricks riktar sig till organisationer med mogna databehov – från medelstora företag till globala koncerner. Vanliga användare inkluderar dataingenjörer, dataanalytiker, data scientists och ML-ingenjörer. Plattformen är branschagnostisk men särskilt vanlig inom finans, detaljhandel, hälsovård, media och tillverkningsindustrin.
Fedelta tar fram analyser och rapporter på minuter i stället för veckor.
-
A
- Accesspunkt
- Active Directory
- Affärssystem
- Agent Assist
- Agentic AI
- Artificial General Intelligence (AGI)
- AI
- AI Act / AI-förordningen
- AI-compliant
- AI Factory
- AI-first
- AI governance
- AI PC
- AI-proofed
- AI-ready
- AIaaS
- AIOps
- Algoritm
- Alignment
- API
- Attack Surface Management (ASM)
- Automation
- Autonomous agents
- AWS (Amazon Web Services)
- Azure API Management
- Azure Arc
- Azure Cosmos DB
- Azure Data Factory
- Azure DevOps
- Azure Event Grid
- Azure Event Hubs
- Azure Function Apps
- Azure Integration Services
- Azure Key Vault
- Azure Logic Apps
- Azure Service Bus
- Azure Storage Account
- B
-
C
- C3PAO
- CapEx vs OpEx
- CCaaS
- CEaaS
- Chatbot
- CI/CD
- Cirkulär IT
- CIS
- Claude Code
- CLI
- Click to Do
- CLOUD Act
- Cloud Native
- Cloud Security (Molnsäkerhet)
- CMMC
- CNAPP
- Colocation
- Computer vision
- Confidential Computing
- Containerisering
- Content Delivery Network (CDN)
- Copilot
- Copilot Studio
- CRC
- CRM
- CSIRT
- CSP (Cloud Solution Provider)
- CSRD
- CTEM
- Customer experience
- Cyber range
- Cyber resilience
- Cyberresiliensförordningen
- Cybersäkerhet
- Cybersäkerhetslagen
- Cybersäkerhetsakten
-
D
- DaaS
- DANE
- Data-fabric plattform
- Data Governance
- Data Lake
- Data Lakehouse
- Data Mesh
- Data sovereignty
- Dataanalys
- Databas
- Databricks
- Datacenter
- Datahantering (Data Management)
- Datamigrering
- Datasuveränitet
- Datavisualisering
- DDoS
- Deep learning
- Deepfake
- DevOps
- DevSecOps
- Digital Employee Experience (DEX)
- Digital Experience Platform (DXP)
- Digital leveranskedja
- Digital motståndskraft
- Digital Operational Resilience
- Digital suveränitet
- Digital tvilling
- Digital twin
- Digitalisering
- Disaster Recovery
- DKIM
- Data Loss Prevention (DLP)
- DMA
- DMARC
- DNSSEC
- Docker
- DORA
- Disaster Recovery as a Service (DRaaS)
- DRP
- E
- F
- G
- H
-
I
- IAM
- Identity Governance and Administration (IGA)
- Immutable backups
- Incident Response
- Inference
- Informationssäkerhet
- Infrastruktur-som-kod
- Integration
- Integration ERP
- Integrationsförvaltning
- Intrångsdetektionssystem (IDS)
- Intune
- IoT - Internet of Things
- ISO
- ISO 27001
- IT-drift
- IT-forensik
- IT-säkerhet
- IT-upphandling
- ITAD Services
- IT Asset Management (ITAM)
- ITIL
- J
- K
- L
-
M
- Malware
- Managed Print Services (MPS)
- Managed Service Provider (MSP)
- Maskininlärning
- Managed Detection and Response (MDR)
- MFA
- Microservices
- Microsoft 365
- Microsoft Defender
- Microsoft Entra ID
- Microsoft Fabric
- Microsoft Foundry
- Microsoft Pluton
- Microsoft Sentinel
- Microsoft Teams Rooms
- MLOps (Machine Learning Operations)
- Model Context Protocol (MCP)
- Model serving
- Molndrift
- Molnsäkerhet
- Monoberoende - Ändringar som hotar
- Mopria
- MTA-STS
- Multiagent Systems / Multiagentsystem
- Multicloud
- Multimodal
- N
- O
- P
- Q
- R
-
S
- SaaS
- Säkerhetsgranskning
- SASE
- SBTi
- Scope 1/2/3
- SDN
- Secure-Core PC
- Security Posture Management (CSPM/SSPM)
- Self-hosted LLM
- SEO
- Serverless Computing
- Servicedesk
- Shadow AI
- Sharepoint
- SIEM
- Single Sign-On (SSO)
- SIT-test
- Service Level Agreement (SLA)
- Small Language Models (SLM)
- SMTP AUTH
- SOAR
- SOC
- SOC 2
- Social Engineering
- Sovereign AI
- Sovereign Cloud
- Spear phishing
- SPF (Sender Policy Framework)
- Spoofing
- SRE (Site Reliability Engineering)
- Svanenmärkningen
- Synthetic data
- Systemintegration
- T
- U
- V
- W
- X
- Y
- Z
- Å
- Ä
- Ö