Dictionary

Data mart

Een data mart is een kleinere, gerichte deelverzameling van je data warehouse, afgestemd op één afdeling of thema. Sales, finance of HR krijgt een eigen model met enkel de data die voor hen telt, in definities die zij begrijpen.

Wat is een data mart?

Een data mart is een kleinere, gerichte datalaag die de behoeften van één afdeling of thema dekt: sales, finance, HR, marketing. Feitelijk is het een deelverzameling van je data warehouse, maar dan afgestemd op één publiek met eigen vragen en eigen definities.

Je kan een data mart vergelijken met een afdelingskast naast het centrale bedrijfsarchief. In het centrale archief staat alles van de hele organisatie. In de kast van sales staan enkel de gegevens die sales nodig heeft, in de layout die sales begrijpt. Je zoekt er sneller en botst minder vaak op iets wat niet voor jou bedoeld is.

Data marts kwamen in de jaren 90 op toen enterprise data warehouses moeilijk te bouwen waren en afdelingen niet wilden wachten. Vandaag bestaat het concept nog volop, maar vaak in een andere vorm: een set views of tabellen op een lakehouse, een apart schema in een warehouse, of een dedicated Power BI-workspace per afdeling.

Wanneer gebruik je een data mart?

Typische situaties waar een data mart logisch is:

  • Sales-analyse voor een commerciële ploeg die enkel orders, klanten en producthiërarchie nodig heeft.

  • Finance rapportering waarin je juist niet wil dat andere afdelingen marge-details kunnen inzien.

  • HR-dashboards met gevoelige personeelsdata, gescheiden van de rest.

  • Marketing-funnels waar je web-, campagne- en CRM-data combineert in één model dat op campagnelogica is gemodelleerd.

Wat deze gevallen gemeen hebben: een publiek met eigen vragen, eigen definities en eigen toegangsregels. Alles in één groot warehouse stoppen werkt dan theoretisch, maar in de praktijk wordt het onoverzichtelijk en loop je achter de feiten aan bij elke permissievraag.

Dependent, independent en hybrid

De klassieke literatuur (AWS, IBM, Kimball) onderscheidt drie types, op basis van waar de data vandaan komt.

Dependent data mart
Haalt zijn data uit een bestaand data warehouse. Dat geeft consistentie: de definities van klant en omzet zijn identiek aan die in het warehouse. Je bouwt de mart als afgeleide laag met views of een lichte ETL-stap.

Independent data mart
Haalt zijn data rechtstreeks uit bronsystemen, zonder tussenlaag. Sneller op te zetten voor één afdeling, maar het risico is groot: elk departement bouwt zijn eigen logica. Na een paar jaar heb je vijf data marts met vijf verschillende antwoorden op de vraag "hoeveel actieve klanten hebben we?"

Hybrid data mart
Combineert beide: de kerngegevens komen uit het warehouse, afdelingsspecifieke data rechtstreeks uit een bron. Dat is in de praktijk vaak hoe marts groeien, zeker als het warehouse niet elke use case dekt.

Data mart, data warehouse of data lake?

Deze drie termen worden in gesprekken vaak door elkaar gehaald. Ze zijn complementair, geen concurrenten.

Een data warehouse is de enterprise-brede, gemodelleerde opslag voor analytics. Het bevat de gedeelde waarheid over klanten, orders en producten in een vorm die meerdere afdelingen tegelijk bedient.

Een data lake bewaart ruwe, ongestructureerde data uit alle bronnen, vaak als bestanden in object storage. Het is de grondstof, niet het eindproduct.

Een data mart is de afgeleverde maaltijd voor één tafel: kleiner, sneller, gericht. In een moderne lakehouse-stack is het vaak geen fysiek apart systeem meer, maar een logische laag in OneLake of een dedicated workspace. Minder infrastructuur, zelfde idee.

Valkuilen

Mart sprawl zonder governance
Data marts zonder centrale coördinatie leiden tot silo's: elk team bouwt zijn eigen logica, zijn eigen klantdefinitie, zijn eigen omzetberekening. Binnen een jaar staan er drie waarheden naast elkaar. De klassieke oplossing uit het Kimball-kamp is conformed dimensions: gedeelde dimensietabellen (klant, product, datum) die in elke mart identiek zijn.

Bouwen voor één dashboard
Een mart die ontworpen is voor één specifiek rapport breekt zodra het volgende rapport komt. Ontwerp rond een grain en een bedrijfsproces, niet rond de visual van de week.

Verouderde feature-verwarring
Microsoft lanceerde rond 2022 een Power BI Datamart-functie: een managed SQL-database plus dataset binnen een workspace. Die feature heeft terrein verloren aan Fabric-warehouses en -lakehouses, en de strategische focus ligt intussen elders. Als iemand "Power BI datamart" zegt, vraag door: bedoelt hij de feature of het algemene concept? Dat laatste leeft nog volop.

Laatst Bijgewerkt: April 23, 2026 Terug naar Woordenboek
Trefwoorden
data mart data warehouse lakehouse semantisch model star schema kimball conformed dimensions microsoft fabric power bi business intelligence