1. Baixe o Oracle Expresss Edition no link abaixo e descompacte-o.
https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit
2. Após a extração, você encontrará um arquivo executável do Oracle XE Edition conforme a imagem abaixo.
3. Clique duas vezes em OracleXEUniv para instalar o banco de dados Oracle em seu sistema e clique em Executar.
4. Clique em Avançar
5. Aceite o contrato de licença e clique em Avançar.
6. Por padrão, o oracle tomará system como nome do banco de dados. Deixe-nos inserir a senha
para este banco de dados.
Digite a senha -> sistema
como instalar hadoop no ubuntu
Confirme a senha -> sistema
Clique em Avançar:
7. Clique em Instalar
8. Clique em Concluir
9. Vamos editar o arquivo sqlnet.ora presente na pasta
C: oraclexepporacleproduct.2.0serverNETWORKADMIN
Ao abri-lo, você encontrará o conteúdo abaixo.
Edite-o como na captura de tela abaixo
10. Vamos iniciar a linha de comando SQL do Oracle.
Vá para o menu Iniciar -> Todos os Programas -> Oracle Database 10g Express Edition ->
Execute a linha de comando SQL e clique duas vezes nela.
11. Você obterá o Cli fo Oracle Database.
12. Vamos nos conectar ao banco de dados Oracle.
Nome de usuário: sistema
Senha: sistema
Você receberá a mensagem conectada com sucesso.
13. Vamos criar uma tabela simples.
Comando:
criar mesa emp (número de id)
14. Vamos inserir alguns valores usando o comando Inserir.
Comando:
inserir em valores emp (2)
15.Vamos verificar se os dados estão inseridos na tabela usando o comando Selecionar.
Comando:
selecione * de emp
16. Vamos enviar os dados.
Comando:
comprometer
17. Para importar os dados do banco de dados Oracle para o Sqoop, precisamos adicionar o
Conector Oracle (ojdbc6_g.jar).
Você pode baixar o jar no link abaixo.
https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit
18. Abra o Cloudera cdh3 e mova o conector Oracle para o Cloudera cdh3 (para a área de trabalho) usando o FileZilla.
Use o link abaixo para entender como mover um arquivo do Windows para o cloudera cdh3 vm.
https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/
19. Assim que o conector Oracle estiver presente no Cloudera Cdh3 Desktop, mova-o para a pasta lib de
sqoop executando o comando abaixo:
Comando:
sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /
20. Mude o diretório para Sqoop executando o comando abaixo:
Comando:
cd / usr / lib / sqoop /
21. Abra o Prompt de Comando (CMD) no Windows e verifique o Endereço IPv4
executando o
comando abaixo:
Comando:
ipconfig
22. Importe os dados da tabela emp presente no banco de dados Oracle para hdfs executando o seguinte
comando:
Itens necessários para o comando:
Endereço IPv4 - Seu endereço IPv4. No meu caso, é 192.168.46.1
Nome do banco de dados - sistema
Nome da tabela - emp
Nome de usuário - sistema
Senha - sistema
Diretório de saída - pode ser qualquer um. Eu usei sqoopoutput1
Comando:
sudo bin / sqoop import –connect jdbc: oracle: thin: system /
system@192.168.46.1: 1521: veículo
–Username system -P –table system.emp –columns “ID” –target-dir /
sqoopoutput1 -m 1
23. Quando o comando for executado com sucesso, você receberá a mensagem
que recuperou os registros como na imagem abaixo.
24. Abra o navegador e vá para o URL abaixo:
URL: http: // localhost: 50070 / dfshealth.jsp
Clique em Navegar no sistema de arquivos
25. Clique no diretório sqoopoutput1
26. Clique no arquivo part-m-00000:
27.A seguir estão os dados que foram importados do banco de dados Oracle:
Parabéns! Você importou dados com sucesso do banco de dados Oracle
para HDFS usando Sqoop ..!