Over Apache Superset
Open-source BI voor teams die een chart-laag willen op de SQL die ze toch al schrijven.
Apache Superset is in 2015 ontstaan als hackathon-project bij Airbnb door Maxime Beauchemin, toen nog onder de naam Caravel. Het project ging in 2017 naar de Apache Software Foundation als incubator-project en kreeg in 2021 de status van top-level Apache-project. Het draait onder Apache 2.0, host je zelf op je eigen infrastructuur, en koppelt aan 70+ SQL-databanken zoals Snowflake, BigQuery, Redshift, Postgres, MySQL, ClickHouse en DuckDB. De commerciële variant is Preset, het bedrijf van Beauchemin, dat een beheerde Cloud-editie aanbiedt en het merendeel van de commits naar het open-source-project terug levert.
De aantrekkingskracht in BE/NL is eenvoudig: een chart-bibliotheek, een SQL Lab-editor, dashboards en een virtual-dataset-model, zonder een Tableau- of Power BI-rekening per seat. Data-engineering-teams kiezen ervoor omdat het dataset-model gewoon SQL en YAML is, geen LookML of DAX, en omdat elke chart ook als bewaarde query kan vertrekken. De val, in de KMO-uitrollen die we zien, is dezelfde als bij elk BI-tool: gericht op drie operationele databanken in plaats van één gecureerd warehouse, vermenigvuldigen de SQL Lab-queries, stapelen de virtuele datasets zich op, en gaan de dashboards elkaar tegenspreken. Wij voeden Superset vanuit één warehouse, zodat het dataset-model klein blijft, de cache-hits landen waar het hoort, en de upgrade-flow beheersbaar blijft.