o que é um token java
Hive é um sistema de data warehouse para Hadoop que facilita o resumo de dados, consultas ad-hoc e a análise de grandes conjuntos de dados armazenados em sistemas de arquivos compatíveis com Hadoop. O Hive estrutura os dados em conceitos de banco de dados bem compreendidos, como tabelas, linhas, colunas e partições. Suporta tipos primitivos como Inteiros, Flutuantes, Duplos e Strings. O Hive também oferece suporte a Associative Arrays, Lists, Structs e Serialize e a API desserializada é usada para mover dados para dentro e para fora das tabelas.
Vejamos os modelos de dados do Hive em detalhes
Modelos de dados do Hive:
Os modelos de dados Hive contêm os seguintes componentes:
- Bancos de dados
- Mesas
- Partições
- Buckets ou clusters
Partições:
Partição significa dividir uma tabela em partes grosseiras com base no valor de uma coluna de partição, como 'dados'. Isso torna mais rápido fazer consultas em fatias de dados
Então, qual é a função da partição? As chaves de partição determinam como os dados são armazenados. Aqui, cada valor exclusivo da chave de partição define uma partição da tabela. As partições são nomeadas após datas por conveniência. É semelhante a ‘Block Splitting’ no HDFS.
como fechar um aplicativo java
Buckets:
Buckets fornecem estrutura extra para os dados que podem ser usados para consultas eficientes. Uma junção de duas tabelas que são agrupadas nas mesmas colunas, incluindo a coluna de junção, pode ser implementada como uma junção do lado do mapa. O agrupamento por ID usado significa que podemos avaliar rapidamente uma consulta baseada no usuário, executando-a em uma amostra aleatória do conjunto total de usuários.
Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.
Postagens relacionadas:
como se tornar um engenheiro de IA