Tag: airflow

Quais as vantagens de usar o Apache Airflow para pipeline de dados?

O Apache Airflow é uma plataforma de orquestração de fluxo de trabalho de código aberto que permite criar, agendar e monitorar pipelines de dados de forma programática. Ele oferece muitas vantagens para o gerenciamento de fluxos de trabalho de dados em empresas, incluindo: Conclusão O Apache Airflow é uma plataforma poderosa para gerenciar pipelines de…
Leia mais

Luigi, Airflow, Pinball e Chronos: Comparando Sistemas de Gerenciamento de Fluxo de Trabalho

A construção de sistemas de grande escala que lidam com uma quantidade considerável de dados geralmente requer vários trabalhos de ETL e diferentes mecanismos de processamento. Em nosso caso, por exemplo, o processo ETL consiste em muitas transformações, como normalização, agregação, desduplicação e enriquecimento de milhões de registros de dados do carro. Esses tipos de…
Leia mais