O Apache Airflow é uma plataforma de orquestração de fluxo de trabalho de código aberto que permite criar, agendar e monitorar pipelines de dados de forma programática. Ele oferece muitas vantagens para o gerenciamento de fluxos de trabalho de dados em empresas, incluindo: Conclusão O Apache Airflow é uma plataforma poderosa para gerenciar pipelines de…
Leia mais
Operational Data Storage (ODS), ou Armazenamento de Dados Operacionais, é uma abordagem que permite armazenar e gerenciar dados em tempo real, de forma integrada e acessível. O ODS é um tipo de armazenamento de dados que está sempre atualizado e pronto para ser utilizado por outras aplicações ou processos de negócios. Ele pode ser considerado…
Leia mais
O Windows Subsystem para Linux ou Windows WSL é uma ótima solução para os desenvolvedores trabalharem nativamente no Linux diretamente na área de trabalho da versão do Windows 10, mas onde ficam os arquivos e pastas? O que é o WSL? WSL ou C:\Windows\System32\wsl.exe é uma ferramenta do Windows que permite instalar uma distribuição Linux…
Leia mais
O Bravo é uma ferramenta gratuita e de código aberto que ajuda você a criar um modelo do Power BI usando uma interface de usuário simples. Estes são os recursos disponíveis no Bravo para Power BI 1.0: Analisar modelo: o Bravo pode analisar seu modelo e encontrar as colunas e tabelas que consomem mais processamento…
Leia mais
Em alguns cenários, precisamos atualizar os registros cujos proprietários estão inativos. Por exemplo, estamos migrando dados para o Salesforce usando o carregador de dados e, alguns proprietários de registros estão inativos. Para esses registros de proprietários inativos, receberemos o erro “A record owner cannot be Inactive (Um proprietário de registro não pode ser inativo)“. Precisamos…
Leia mais
Uma estratégia eficaz de gerenciamento de dados tem vários componentes, entre eles podemos destacar: Alinhamento com os objetivos de negócios. Entenda os objetivos de negócios para definir casos de uso de gerenciamento de dados. Definir o ciclo de vida dos dados. Determine como coletar, preparar, arquivar, analisar e distribuir os dados, sempre com a segurança…
Leia mais
Para aumentar a produtividade dos cientistas de dados e pesquisadores da Lyft, desenvolvemos um aplicativo de descoberta de dados baseado em um mecanismo de metadados. Com o codinome Amundsen (em homenagem ao explorador norueguês Roald Amundsen), melhoramos a produtividade de nossos usuários de dados fornecendo uma interface de pesquisa de dados semelhante a esta: O…
Leia mais
Basicamente, um catálogo de dados é um inventário organizado dos dados da sua empresa. É isso. O catálogo de dados fornece uma visão geral apenas no nível de metadados e, portanto, nenhum valor de dados real é exposto. Essa é a grande vantagem de um catálogo de dados: você pode deixar que todos vejam tudo…
Leia mais
Uma ODS – (operational data store) é um banco de dados central que fornece um snapshot dos dados mais recentes de vários sistemas transacionais para relatórios operacionais. Ele permite que as organizações combinem dados em seu formato original de várias fontes em um único destino para disponibilizá-los para relatórios de negócios. Uma ODS contém informações…
Leia mais
Tanto Python quanto PHP são linguagens de programação multiuso. No entanto, Python ganhou mais popularidade por causa do seu ecossistema de bibliotecas para projetos de ciência de dados e aprendizado de máquina. Por outro lado, o PHP é uma das linguagens mais utilizadas para desenvolvimento web. O que é Python? Python é uma linguagem de…
Leia mais
Comentários