DATA & ANALYS
ETL (Extract, Transform, Load)
Vad är ETL?
ETL står för Extract, Transform, Load – det vill säga att hämta data från källsystem, omvandla den till önskat format och ladda den i ett målsystem som ett datalager, en analysplattform eller en operativ databas. ETL är en grundpelare i datahantering och en förutsättning för tillförlitlig dataanalys och rapportering.
De tre stegen
- Extract: Data hämtas från källor som affärssystem, CRM, filer, API:er eller IoT-strömmar.
- Transform: Data tvättas, deduplicering körs, format harmoniseras och affärsregler tillämpas.
- Load: Den transformerade datan laddas in i målsystemet – batchvis eller i nära realtid.
ETL vs. ELT
Med moderna molnplattformar har en variant blivit populär: ELT (Extract, Load, Transform). I ELT laddas rådatan först in i ett data lake eller datalager, och transformationen sker därefter med beräkningskraften i målsystemet. ELT passar bra med kraftfulla molnlager som Databricks, Snowflake och Microsoft Fabric, medan klassisk ETL fortfarande är vanligt vid integration mot äldre system och i scenarier med strikta krav på datakvalitet före laddning.
Vanliga verktyg
I Microsoft-miljöer används ofta Azure Data Factory och Microsoft Fabric Data Pipelines. Databricks, dbt och Informatica är vanliga val i större organisationer. För enklare integrationer används Power Automate och Azure Logic Apps.