Como executar scripts do Hive?



Este é um tutorial sobre como executar scripts do Hive. A execução desse script reduzirá o tempo e o esforço que dedicamos para escrever e executar cada comando manualmente.

Por ser um pacote de armazenamento de dados criado com base no Hadoop, o Apache Hive está cada vez mais sendo usado para análise de dados, mineração de dados e modelagem preditiva. As organizações procuram profissionais com um controle firme . Nesta postagem, vamos ver como executar scripts do Hive. Em geral, usamos os scripts para executar um conjunto de instruções de uma vez. Os scripts do Hive são usados ​​da mesma maneira. Isso reduzirá o tempo e o esforço que colocamos para escrever e executar cada comando manualmente.

Os scripts do Hive são suportados no Hive 0.10.0 e nas versões superiores. Como a versão Hive 0.90 está instalada em CDH3, não podemos executar Scripts Hive em CDH3. Você pode tentar as etapas abaixo no CDH4, pois ele tem a versão Hive 0.10.0 instalada. Você sabe como criar um script Hive? Se não, clique para obter mais esclarecimentos.





Master-Hive-Now

Agora, vamos ver como escrever os scripts no Hive e executá-los no CDH4:



Etapa 1: escrever um script do Hive.

Para escrever o Hive Script, o arquivo deve ser salvo com a extensão .sql. Abra um terminal em sua distribuição Cloudera CDH4 e dê o seguinte comando para criar um script Hive.
Comando: sudo gedit sample.sql

Ao executar o comando acima, será aberto o arquivo com a lista de todos os comandos do Hive que precisam ser executados.



Neste script, uma tabela será criada, descrita e os dados serão carregados e recuperados da tabela.

java deep copy vs raso copy

1. Criação da tabela no Hive:

Comando: criar tabela de produto (productid: int, productname: string, price: float, category: string) campos delimitados por formato de linhas terminados por ‘,’

Aqui, product é o nome da tabela e {productid, productname, price, category} são as colunas desta tabela.

Os campos terminados por ‘,’ indicam que as colunas no arquivo de entrada são separadas pelo símbolo ‘,’.

Por padrão, os registros no arquivo de entrada são separados por uma nova linha.

2. Descrevendo a Tabela:

Comando: descrever o produto

3. Carregando os dados na tabela.

Para carregar os dados na tabela, primeiro precisamos criar um arquivo de entrada que contém os registros que precisam ser inseridos na tabela.

Vamos criar um arquivo de entrada.

Comando: sudo gedit input.txt

Edite o conteúdo do arquivo conforme mostrado na figura.

4. Recuperando os dados:

Para recuperar os dados, o comando select é usado.

Comando: Selecione * do produto

O comando acima é usado para recuperar o valor de todas as colunas presentes na tabela. O script deve ser como mostrado na imagem abaixo.

Agora, terminamos de escrever o script do Hive. O arquivo sample.sql agora pode ser salvo.

como definir o caminho java

Etapa 2: executando o script do Hive

A seguir está o comando para executar o script Hive:

Comando: colmeia –f /home/cloudera/sample.sql

Ao executar o script, certifique-se de que todo o caminho do local do arquivo Script esteja presente.

Podemos ver que todos os comandos são executados com sucesso.

É assim que os scripts do Hive são executados e executados no CDH4.

O Hive é um componente crítico do Hadoop e sua experiência no Hive pode lhe trazer os melhores empregos do Hadoop! Edureka tem um curso Hadoop especialmente curado que ajuda você a dominar conceitos como MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume e Sqoop. Clique no botão abaixo para começar.

Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.

.trim () java

Postagens relacionadas:

Comandos Hive

Modelos de Dados Hive