Transformer
Vad är en Transformer-modell?
En Transformer är en specifik typ av arkitektur för neurala nätverk som introducerades av Google 2017. Den revolutionerade området för naturlig språkbehandling (NLP) och är den direkta orsaken till att vi idag har kraftfulla Generativ AI-tjänster som ChatGPT (där 'T' står för Transformer).
Varför Transformer-modellen är viktig
Innan Transformern kom, läste AI-modeller text ord för ord i en sekvens (från vänster till höger). Det gjorde dem långsamma och glömska – de tappade ofta tråden i långa meningar. Transformern introducerade en mekanism som kallas "Self-Attention", vilket gör att modellen kan titta på hela meningen samtidigt och förstå hur ord i början relaterar till ord i slutet.
Hur fungerar en Transformer i praktiken?
Det unika med Transformern är dess förmåga att hantera kontext och parallellitet.
- Attention Mechanism: Modellen kan "uppmärksamma" olika delar av en text olika mycket. I meningen "Banken lånade ut pengar till företaget eftersom *den* trodde på idén", förstår Transformern att "*den*" syftar på banken, inte företaget.
- Parallellisering: Eftersom den inte behöver läsa ord för ord sekventiellt, kan den bearbeta enorma mängder data samtidigt. Detta möjliggjorde träning på Big Data-skala som tidigare var omöjlig.
Vanliga frågor om Transformer
Används Transformers bara för text?
Nej, även om de började med text (LLM), används arkitekturen nu även framgångsrikt för bilder (Vision Transformers), ljud och till och med för att förutsäga proteinstrukturer inom biologi.
Vad är GPT?
GPT står för "Generative Pre-trained Transformer". Det är alltså en Transformer-modell som är tränad för att generera text.
Viktiga punkter att ta med sig:
- Transformer är arkitekturen som möjliggjorde dagens super-AI.
- Använder "Attention" för att förstå sammanhang i data bättre än tidigare modeller.
- Tillåter snabbare träning på större datamängder.
-
A
- Accesspunkt
- Active Directory
- Affärssystem
- Agent Assist
- Agentic AI
- AI
- AIaaS
- API
- Automation
- AWS (Amazon Web Services)
- Azure API Management
- Azure Cosmos DB
- Azure Data Factory
- Azure DevOps
- Azure Event Grid
- Azure Event Hubs
- Azure Function Apps
- Azure Integration Services
- Azure Key Vault
- Azure Logic Apps
- Azure Service Bus
- Azure Storage Account
- B
-
C
- C3PAO
- CCaaS
- CEaaS
- Chatbot
- CI/CD
- CIS
- CLI
- Click to Do
- CLOUD Act
- Cloud Native
- Cloud Security (Molnsäkerhet)
- CMMC
- Containerisering
- Copilot
- CRC
- CRM
- CSIRT
- CSP (Cloud Solution Provider)
- CSRD
- Customer experience
- Cyber range
- Cyber resilience
- Cyberresiliensförordningen
- Cybersäkerhet
- Cybersäkerhetslagen
- Cybersäkerhetsakten
-
D
- DaaS
- DANE
- Data-fabric plattform
- Data Lake
- Dataanalys
- Databas
- Datacenter
- Datahantering (Data Management)
- Datamigrering
- Datasuveränitet
- Datavisualisering
- DDoS
- Deep learning
- DevOps
- DevSecOps
- Digital leveranskedja
- Digital tvilling
- Digitalisering
- Disaster Recovery
- Data Loss Prevention (DLP)
- DMA
- DNSSEC
- Docker
- DORA
- Disaster Recovery as a Service (DRaaS)
- DRP
- E
- F
- G
- H
-
I
- IAM
- Identity Governance and Administration (IGA)
- Immutable backups
- Inference
- Informationssäkerhet
- Infrastruktur-som-kod
- Integration
- Integration ERP
- Integrationsförvaltning
- Intrångsdetektionssystem (IDS)
- Intune
- IoT - Internet of Things
- ISO
- IT-drift
- IT-säkerhet
- IT-upphandling
- ITAD Services
- IT Asset Management (ITAM)
- ITIL
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- Å
- Ä
- Ö