Temos vasta experiência em tecnologias de Big Data, muitas das quais podem ser orquestradas por meio do Apache Airflow, e nossa vasta experiência em diversas indústrias possibilita o compartilhamento de Melhores Práticas, uma vez que já nos deparamos com vários problemas comuns. A Reply ajuda empresas à criar recursos personalizados no topo do Airflow para atender às suas necessidades e casos de uso.
Por exemplo, a Reply criou um Data Pipeline configurável e automatizado na Google Cloud Platform para um líder varejista no Reino Unido. Assim que os dados chegam no Data Lake (Cloud Storage), o Apache Airflow transfere os dados para uma área de teste e, em seguida, insere esses dados em uma tabela ODS (Operational Data Store) em BigQuery (Armazenamento de dados corporativos de baixo custo, com escala petabyte e gerenciado pelo Google). O Airflow, em seguida, orquestra as associações para criar uma nova tabela em um BigQuery Data Mart, que deve ser acessado por ferramentas de Visualização de Dados, como Tableau. Todo o pipeline foi automatizado, reduzindo a latência do pipeline (o tempo decorrido da chegada dos dados até a geração do relatório) de 1 semana para um único dia.