Over Amazon Redshift
Het datawarehouse van AWS, dicht tegen de rest van je AWS-data.
Amazon Redshift is gelanceerd in februari 2013, gebouwd op MPP-technologie die Amazon licentieerde van ParAccel en geënt op een vroege PostgreSQL-fork. Het draait in twee vormen: Provisioned, waarbij je RA3 nodes (compute) afmeet tegen managed storage op S3, en Serverless, waarbij je per Redshift Processing Unit (RPU) per seconde betaalt en AWS de compute voor je opschaalt. Beide delen dezelfde SQL-laag en dezelfde opslag.
Wat Redshift de logische keuze maakt voor AWS-first teams is wat er rond zit. Spectrum leest Parquet, ORC en JSON rechtstreeks uit S3, zonder eerst te laden. Zero-ETL-integraties duwen wijzigingen uit Aurora, RDS en DynamoDB naar het warehouse zonder aparte pipeline. Federated Query joint Postgres- of MySQL-tabellen live mee. Redshift ML roept SageMaker aan vanuit SQL. Als je applicatiedata, je event-logs en je data science al in AWS leven, stopt het warehouse een aparte bestemming te zijn en wordt het de leeslaag bovenop wat er toch al staat.