Oracle para HDFS usando Sqoop



Oracle para HDFS usando Sqoop - Confira as etapas para Oracle para HDFS usando Sqoop.

1. Baixe o Oracle Expresss Edition no link abaixo e descompacte-o.





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



2. Após a extração, você encontrará um arquivo executável do Oracle XE Edition conforme a imagem abaixo.

3. Clique duas vezes em OracleXEUniv para instalar o banco de dados Oracle em seu sistema e clique em Executar.



4. Clique em Avançar

5. Aceite o contrato de licença e clique em Avançar.

6. Por padrão, o oracle tomará system como nome do banco de dados. Deixe-nos inserir a senha

para este banco de dados.

Digite a senha -> sistema

como instalar hadoop no ubuntu

Confirme a senha -> sistema

Clique em Avançar:

7. Clique em Instalar

8. Clique em Concluir

9. Vamos editar o arquivo sqlnet.ora presente na pasta

C: oraclexepporacleproduct.2.0serverNETWORKADMIN

Ao abri-lo, você encontrará o conteúdo abaixo.

Edite-o como na captura de tela abaixo

10. Vamos iniciar a linha de comando SQL do Oracle.

Vá para o menu Iniciar -> Todos os Programas -> Oracle Database 10g Express Edition ->

Execute a linha de comando SQL e clique duas vezes nela.

11. Você obterá o Cli fo Oracle Database.

12. Vamos nos conectar ao banco de dados Oracle.

Nome de usuário: sistema

Senha: sistema

Você receberá a mensagem conectada com sucesso.

13. Vamos criar uma tabela simples.

Comando:

criar mesa emp (número de id)

14. Vamos inserir alguns valores usando o comando Inserir.

Comando:

inserir em valores emp (2)

15.Vamos verificar se os dados estão inseridos na tabela usando o comando Selecionar.

Comando:

selecione * de emp

16. Vamos enviar os dados.

Comando:

comprometer

17. Para importar os dados do banco de dados Oracle para o Sqoop, precisamos adicionar o

Conector Oracle (ojdbc6_g.jar).

Você pode baixar o jar no link abaixo.

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18. Abra o Cloudera cdh3 e mova o conector Oracle para o Cloudera cdh3 (para a área de trabalho) usando o FileZilla.

Use o link abaixo para entender como mover um arquivo do Windows para o cloudera cdh3 vm.

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

19. Assim que o conector Oracle estiver presente no Cloudera Cdh3 Desktop, mova-o para a pasta lib de

sqoop executando o comando abaixo:

Comando:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

20. Mude o diretório para Sqoop executando o comando abaixo:

Comando:

cd / usr / lib / sqoop /

21. Abra o Prompt de Comando (CMD) no Windows e verifique o Endereço IPv4

executando o

comando abaixo:

Comando:

ipconfig

22. Importe os dados da tabela emp presente no banco de dados Oracle para hdfs executando o seguinte

comando:

Itens necessários para o comando:

Endereço IPv4 - Seu endereço IPv4. No meu caso, é 192.168.46.1

Nome do banco de dados - sistema

Nome da tabela - emp

Nome de usuário - sistema

Senha - sistema

Diretório de saída - pode ser qualquer um. Eu usei sqoopoutput1

Comando:

sudo bin / sqoop import –connect jdbc: oracle: thin: system /

system@192.168.46.1: 1521: veículo

–Username system -P –table system.emp –columns “ID” –target-dir /

sqoopoutput1 -m 1

23. Quando o comando for executado com sucesso, você receberá a mensagem

que recuperou os registros como na imagem abaixo.

24. Abra o navegador e vá para o URL abaixo:

URL: http: // localhost: 50070 / dfshealth.jsp

Clique em Navegar no sistema de arquivos

25. Clique no diretório sqoopoutput1

26. Clique no arquivo part-m-00000:

27.A seguir estão os dados que foram importados do banco de dados Oracle:

Parabéns! Você importou dados com sucesso do banco de dados Oracle

para HDFS usando Sqoop ..!