Categoria: Analytics

Quais as vantagens de usar o Apache Airflow para pipeline de dados?

O Apache Airflow é uma plataforma de orquestração de fluxo de trabalho de código aberto que permite criar, agendar e monitorar pipelines de dados de forma programática. Ele oferece muitas vantagens para o gerenciamento de fluxos de trabalho de dados em empresas, incluindo: Conclusão O Apache Airflow é uma plataforma poderosa para gerenciar pipelines de…
Leia mais

Operational Data Storage: o que é e quais as vantagens?

Operational Data Storage (ODS), ou Armazenamento de Dados Operacionais, é uma abordagem que permite armazenar e gerenciar dados em tempo real, de forma integrada e acessível. O ODS é um tipo de armazenamento de dados que está sempre atualizado e pronto para ser utilizado por outras aplicações ou processos de negócios. Ele pode ser considerado…
Leia mais

WSL – Onde ficam as pastas e os arquivos?

O Windows Subsystem para Linux ou Windows WSL é uma ótima solução para os desenvolvedores trabalharem nativamente no Linux diretamente na área de trabalho da versão do Windows 10, mas onde ficam os arquivos e pastas? O que é o WSL? WSL ou C:\Windows\System32\wsl.exe é uma ferramenta do Windows que permite instalar uma distribuição Linux…
Leia mais

Como criar um modelo para Power BI com o Bravo.io?

O Bravo é uma ferramenta gratuita e de código aberto que ajuda você a criar um modelo do Power BI usando uma interface de usuário simples. Estes são os recursos disponíveis no Bravo para Power BI 1.0: Analisar modelo: o Bravo pode analisar seu modelo e encontrar as colunas e tabelas que consomem mais processamento…
Leia mais

Como montar uma estratégia eficaz de dados no Salesforce?

Uma estratégia eficaz de gerenciamento de dados tem vários componentes, entre eles podemos destacar: Alinhamento com os objetivos de negócios. Entenda os objetivos de negócios para definir casos de uso de gerenciamento de dados. Definir o ciclo de vida dos dados. Determine como coletar, preparar, arquivar, analisar e distribuir os dados, sempre com a segurança…
Leia mais

Conheça o Amundsen – Catálogo de dados da Lyft

Para aumentar a produtividade dos cientistas de dados e pesquisadores da Lyft, desenvolvemos um aplicativo de descoberta de dados baseado em um mecanismo de metadados. Com o codinome Amundsen (em homenagem ao explorador norueguês Roald Amundsen), melhoramos a produtividade de nossos usuários de dados fornecendo uma interface de pesquisa de dados semelhante a esta: O…
Leia mais

O que é um catálogo de dados?

Basicamente, um catálogo de dados é um inventário organizado dos dados da sua empresa. É isso. O catálogo de dados fornece uma visão geral apenas no nível de metadados e, portanto, nenhum valor de dados real é exposto. Essa é a grande vantagem de um catálogo de dados: você pode deixar que todos vejam tudo…
Leia mais

PHP vs Python: Diferenças básicas

Tanto Python quanto PHP são linguagens de programação multiuso. No entanto, Python ganhou mais popularidade por causa do seu ecossistema de bibliotecas para projetos de ciência de dados e aprendizado de máquina. Por outro lado, o PHP é uma das linguagens mais utilizadas para desenvolvimento web. O que é Python? Python é uma linguagem de…
Leia mais

Para analistas de dados, ‘trabalho de zelador’ é o principal obstáculo aos insights

As revoluções da tecnologia vêm em passos medidos, às vezes arrastados. A ciência do laboratório e o entusiasmo do marketing tendem a subestimar os gargalos ao progresso que devem ser superados com trabalho árduo e engenharia prática. O campo conhecido como “big data” oferece um estudo de caso contemporâneo. O bordão representa a abundância moderna…
Leia mais

Características da orientação por dados

Existem vários tipos de atividades em que as organizações verdadeiramente orientadas por dados se envolvem: Uma organização orientada por dados pode estar testando continuamente. Pode ser o fluxo de verificação de teste A / B em um site ou o teste de linhas de assunto de e-mail em uma campanha de marketing. O LinkedIn, por…
Leia mais