O Apache Airflow é uma plataforma de orquestração de fluxo de trabalho de código aberto que permite criar, agendar e monitorar pipelines de dados de forma programática. Ele oferece muitas vantagens para o gerenciamento de fluxos de trabalho de dados em empresas, incluindo: Conclusão O Apache Airflow é uma plataforma poderosa para gerenciar pipelines de…
Leia mais
Operational Data Storage (ODS), ou Armazenamento de Dados Operacionais, é uma abordagem que permite armazenar e gerenciar dados em tempo real, de forma integrada e acessível. O ODS é um tipo de armazenamento de dados que está sempre atualizado e pronto para ser utilizado por outras aplicações ou processos de negócios. Ele pode ser considerado…
Leia mais
O Windows Subsystem para Linux ou Windows WSL é uma ótima solução para os desenvolvedores trabalharem nativamente no Linux diretamente na área de trabalho da versão do Windows 10, mas onde ficam os arquivos e pastas? O que é o WSL? WSL ou C:\Windows\System32\wsl.exe é uma ferramenta do Windows que permite instalar uma distribuição Linux…
Leia mais
O Bravo é uma ferramenta gratuita e de código aberto que ajuda você a criar um modelo do Power BI usando uma interface de usuário simples. Estes são os recursos disponíveis no Bravo para Power BI 1.0: Analisar modelo: o Bravo pode analisar seu modelo e encontrar as colunas e tabelas que consomem mais processamento…
Leia mais
Uma estratégia eficaz de gerenciamento de dados tem vários componentes, entre eles podemos destacar: Alinhamento com os objetivos de negócios. Entenda os objetivos de negócios para definir casos de uso de gerenciamento de dados. Definir o ciclo de vida dos dados. Determine como coletar, preparar, arquivar, analisar e distribuir os dados, sempre com a segurança…
Leia mais
Para aumentar a produtividade dos cientistas de dados e pesquisadores da Lyft, desenvolvemos um aplicativo de descoberta de dados baseado em um mecanismo de metadados. Com o codinome Amundsen (em homenagem ao explorador norueguês Roald Amundsen), melhoramos a produtividade de nossos usuários de dados fornecendo uma interface de pesquisa de dados semelhante a esta: O…
Leia mais
Basicamente, um catálogo de dados é um inventário organizado dos dados da sua empresa. É isso. O catálogo de dados fornece uma visão geral apenas no nível de metadados e, portanto, nenhum valor de dados real é exposto. Essa é a grande vantagem de um catálogo de dados: você pode deixar que todos vejam tudo…
Leia mais
Tanto Python quanto PHP são linguagens de programação multiuso. No entanto, Python ganhou mais popularidade por causa do seu ecossistema de bibliotecas para projetos de ciência de dados e aprendizado de máquina. Por outro lado, o PHP é uma das linguagens mais utilizadas para desenvolvimento web. O que é Python? Python é uma linguagem de…
Leia mais
As revoluções da tecnologia vêm em passos medidos, às vezes arrastados. A ciência do laboratório e o entusiasmo do marketing tendem a subestimar os gargalos ao progresso que devem ser superados com trabalho árduo e engenharia prática. O campo conhecido como “big data” oferece um estudo de caso contemporâneo. O bordão representa a abundância moderna…
Leia mais
Existem vários tipos de atividades em que as organizações verdadeiramente orientadas por dados se envolvem: Uma organização orientada por dados pode estar testando continuamente. Pode ser o fluxo de verificação de teste A / B em um site ou o teste de linhas de assunto de e-mail em uma campanha de marketing. O LinkedIn, por…
Leia mais
Comentários