Big Data

Spark vs Hadoop: qual é a melhor estrutura de Big Data?

Esta postagem do blog fala sobre apache spark vs hadoop. Isso lhe dará uma ideia sobre qual é a estrutura de Big Data certa para escolher em diferentes cenários.

Executando o aplicativo Scala no IDE Eclipse usando Sbteclipse

Este blog ajuda a entender como instalar e configurar o plug-in sbteclipse com instruções passo a passo para executar o aplicativo Scala no Eclipse IDE.

Hadoop dominado? É hora de começar a usar o Apache Spark

Esta postagem do blog explica por que você deve começar a usar o Apache Spark após o Hadoop e por que aprender o Spark depois de dominar o hadoop pode fazer maravilhas pela sua carreira!

Detalhando o Apache Drill, o mecanismo de consulta da Nova Era

Este tutorial do Apache Drill fornece todas as informações de que você precisa para começar a usar o mecanismo de consulta Apache Drill, uso com Hadoop, Big Data e Apache Spark.

Apache Spark combineByKey explicado

Este blog do Spark Hadoop conta tudo o que você precisa saber sobre o Apache Spark combineByKey. Encontre a pontuação média por aluno usando o método combineByKey.

Apache Falcon: nova plataforma de gerenciamento de dados para o ecossistema Hadoop

Apache Falcon é uma nova plataforma de gerenciamento de dados para o ecossistema Hadoop que simplifica o processamento de feed de integração e gerenciamento de feed em clusters de hadoop. Aprenda como configurá-lo.

Acumuladores do Spark explicados: Apache Spark

Este blog do Apache Spark explica os acumuladores Spark em detalhes. Aprenda o uso do acumulador Spark com exemplos. Os acumuladores de faísca são como contadores Hadoop Mapreduce.

Apache Flink: a próxima geração de estrutura de análise de Big Data para processamento de dados em lote e stream

Saiba tudo sobre o Apache Flink e a configuração de um cluster Flink neste blog. Flink suporta processamento em lote e em tempo real e é uma tecnologia de Big Data obrigatória para Big Data Analytics.

Cache Distribuído com Variáveis de Broadcast: Apache Spark

Esta postagem do blog discute o cache distribuído com variáveis de transmissão e apresenta uma introdução à distribuição eficiente de grandes valores na programação do Spark.

Certificações CCA e CCP da Cloudera: tudo o que você precisa saber

As certificações CCA e CCP da Cloudera substituíram os exames CCDH e CCSHB. Este blog contém tudo o que você precisa saber sobre as novas certificações.

Transformações com estado com janelas no fluxo do Spark

Esta postagem de blog discute as transformações com estado com janelas no Spark Streaming. Aprenda tudo sobre como rastrear dados em lotes usando D-Streams de última geração.

Transformação cumulativa com estado no Apache Spark Streaming

Esta postagem do blog discute transformações com estado no Spark Streaming. Saiba tudo sobre o rastreamento cumulativo e o aprimoramento de habilidades para uma carreira no Hadoop Spark.

Big Data em saúde: como o Hadoop está revolucionando a análise de saúde

As tecnologias Hadoop e Big Data estão revolucionando a análise de saúde. Este blog de big data em saúde discute como a análise de big data pode melhorar o atendimento médico.

Hadoop Streaming: Escrevendo um programa Hadoop MapReduce em Python

Esta postagem do blog sobre Hadoop Streaming é um guia passo a passo para aprender a escrever um programa Hadoop MapReduce em Python para processar enormes quantidades de Big Data.

Tutorial de Big Data: Tudo o que você precisa saber sobre Big Data!

Este blog no Tutorial de Big Data oferece uma visão geral completa de Big Data, suas características, aplicações e também desafios com Big Data.

Tutorial HDFS: Introdução ao HDFS e seus recursos

Este blog do tutorial do HDFS ajudará você a entender o HDFS ou Hadoop Distributed File System e seus recursos. Você também explorará seus componentes principais resumidamente.

Splunk vs. ELK vs. Sumo Logic: Qual funciona melhor para você?

Neste tutorial do Splunk, entenda as diferenças entre Splunk vs. ELK vs. Sumo Logic e determine qual dessas ferramentas se adapta melhor a você.

Caso de uso do Splunk: história de sucesso da Domino

Neste blog de caso de uso do Splunk, você entenderá como a Domino's Pizza usou o Splunk para obter insights sobre o comportamento do consumidor e formular suas estratégias de negócios.

Instale o Hadoop: Configurando um cluster Hadoop de nó único

Este tutorial é um guia passo a passo para instalar o cluster Hadoop e configurá-lo em um único nó. Todas as etapas de instalação do Hadoop são para a máquina CentOS.