Big Data

Tutorial do HBase: Introdução ao HBase e estudo de caso do Facebook

Este blog de tutorial do HBase apresenta o que é o HBase e seus recursos. Também cobre o estudo de caso do Facebook Messenger para entender os benefícios do HBase.

Instale o Puppet - Instale o Puppet em quatro etapas simples

Este blog é um guia sobre como instalar o Puppet Master e o Puppet Agent. Também inclui um exemplo para implantar o Apache Tomcat usando o módulo Puppet Tomcat.

Instalação do Apache Pig no Linux

Este blog é um guia passo a passo para a instalação do Apache Pig em ambiente Linux. Vamos instalar o Apache Pig 0.16.0 e executá-lo em diferentes modos.

Arquitetura HBase: modelo de dados HBase e mecanismo de leitura / gravação HBase

Este blog sobre Arquitetura HBase explica o Modelo de Dados HBase e fornece uma visão da Arquitetura HBase. Também explica os diferentes mecanismos do HBase.

Tutorial do Hive - Arquitetura do Hive e estudo de caso da NASA

Este blog de tutorial do Hive oferece um conhecimento profundo da arquitetura do Hive e do modelo de dados do Hive. Também explica o estudo de caso da NASA sobre o Apache Hive.

Tutorial de streaming do Spark - Análise de sentimento usando Apache Spark

Este blog do Spark Streaming apresentará o Spark Streaming, seus recursos e componentes. Inclui um projeto de análise de sentimento usando o Twitter.

Spark MLlib - Biblioteca de aprendizado de máquina do Apache Spark

Este blog do Spark MLlib apresentará a biblioteca de aprendizado de máquina do Apache Spark. Inclui um projeto de Sistema de recomendação de filmes usando Spark MLlib.

Tutorial do Spark GraphX - Graph Analytics no Apache Spark

Este blog do tutorial do GraphX apresentará o Apache Spark GraphX, seus recursos e componentes, incluindo um projeto de análise de dados de voo.

Tutorial do Apache Flume: fluxo de dados do Twitter

Este blog de tutorial do Apache Flume explica os fundamentos do Apache Flume e seus recursos. Ele também exibirá o streaming do Twitter usando o Apache Flume.

Tutorial do Apache Sqoop - Importar / Exportar Dados entre HDFS e RDBMS

Tutorial do Apache Sqoop: Sqoop é uma ferramenta para transferência de dados entre Hadoop e bancos de dados relacionais. Este blog cobre importação e exportação Sooop do MySQL.

Tutorial Oozie: Aprenda como agendar seus trabalhos do Hadoop

Tutorial do Apache Oozie: Oozie é um sistema de agendador de fluxo de trabalho para gerenciar trabalhos do Hadoop. É um sistema escalonável, confiável e extensível.

Aplicativos de Big Data em tempo real em vários domínios

Os aplicativos de Big Data estão revolucionando as organizações e ajudando-as a tomar decisões de negócios mais informativas ao analisar grandes volumes de dados.

Introdução ao Spark com Python - PySpark para iniciantes

O Apache Spark assumiu o controle do mundo do Big Data & Analytics e Python é uma das linguagens de programação mais acessíveis usadas na indústria hoje. Então, aqui neste blog, aprenderemos sobre Pyspark (faísca com python) para obter o melhor dos dois mundos.

Tutorial Hadoop YARN - Aprenda os fundamentos da arquitetura YARN

Este blog se concentra no Apache Hadoop YARN, que foi introduzido no Hadoop versão 2.0 para gerenciamento de recursos e agendamento de tarefas. Explica a arquitetura YARN com seus componentes e as funções desempenhadas por cada um deles. Ele descreve o envio do aplicativo e o fluxo de trabalho no Apache Hadoop YARN.

Principais Artigos

Categoria

Artigos Interessantes