Over Materialize
De streaming SQL-database die je views bijhoudt terwijl de data verandert.
Materialize is begin 2019 opgericht door Arjun Narayan, Frank McSherry en Nikhil Benesch, met kantoren in New York en een verspreid engineeringteam. De engine bouwt voort op Timely Dataflow en Differential Dataflow, twee open-source frameworks die Frank McSherry is beginnen schrijven tijdens zijn tijd bij Microsoft Research op het Naiad-project. De bijdrage van Differential Dataflow: zodra een inputrecord wijzigt, berekent het systeem het minimum aan werk dat nodig is om elke view die ervan afhangt mee aan te passen, in plaats van de view van nul opnieuw te draaien.
In de praktijk wijs je Materialize naar upstream bronnen (Kafka, Redpanda, Postgres of MySQL via logical replication, SQL Server, MongoDB, webhooks van Stripe of Segment) en schrijf je SQL-views die die data joinen, aggregeren en in vorm gieten. De views blijven binnen de seconde mee veranderen naarmate writes upstream toekomen; je kan ze rechtstreeks bevragen over het Postgres wire protocol, downstream pushen naar Kafka of Apache Iceberg, of aan een data-app aanbieden. Onder de motorkap splitst het platform storage en compute: de control plane (`environmentd`) doet SQL-parsing en de catalogus, terwijl compute clusters (`clusterd`) Timely Dataflow draaien en hun inputs en outputs in S3 persisteren, zodat een cluster geschaald of vervangen kan worden zonder state te verliezen. Net die architectuur is wat een real-time fraudecheck, een dynamische prijsregel of een operationele alert vanuit een SQL-view laat lezen in plaats van vanuit een handgeschreven stream-processing-job.