OLTP vs OLAP



O blog a seguir fala brevemente sobre OLTP vs OLAP e os vários casos de uso.

OLTP vs OLAP

O OLTP é mais um sistema transacional online ou sistema de armazenamento de dados, onde o usuário faz muitas transações online usando o armazenamento de dados. Também é dito que há mais leituras / gravações ad-hoc acontecendo em tempo real.





OLAP é mais um armazenamento de dados offline. É acessadonúmero de vezesno modo offline. Por exemplo, os arquivos de log em massa são lidos e gravados de volta nos arquivos de dados. Algumas das áreas comuns onde OLAP é usado são Log Jobs, Data Mining Jobs, etc.

Diz-se que Cassandra é mais OLTP, pois é em tempo real, enquanto o Hadoop é mais OLAP, pois é usado para análises e gravações em massa.



Por que integrar OLAP e OLTP?

Se caso você esteja procurando o preço mais barato para reserva de hotel nos próximos 365 dias, aqui você tem um enorme conjunto de dados do Cassandra e quer ter recomendação em banco de dados em tempo real, é feita uma promoção baseada no preço.

aprenda pl sql online grátis

Em tal cenário, temos que iterar todos os registros e manter a análise em cima deles, o que é um grande trabalho offline que deve ser iniciado com frequência. Aqui, o Hadoop entra em ação para processamento de dados em massa.

O outro benefício é que podemos executar um cluster e interromper a execução de um cluster Hadoop diferente.



O terceiro benefício é que também se pode reduzir muito o custo operacional.

Dado um cenário em que, se um usuário é bem versado em vários ecossistemas Hadoop, como Hive, Pig Latin e precisa integrar dados a ele, deve-se conectar alguma fonte de dados no Cassandra e tentar executar o Map Reduza os empregos também.

exemplo de variável de instância em java

Existe um padrão perceptível entre OLTP e OLAP. Em OLTP, há menos número de gravações, por exemplo, Informação do hotel. Supondo que as mudanças de preço acontecem a cada 5000 vezes por segundo, as leituras podem ser mais aqui. Nesse cenário, pode haver 1 gravação por segundo, mas as leituras podem ser expelidas para centenas e milhares. Portanto, a proporção aqui é de cerca de 1: 1000.

É uma observação interessante que o Cassandra pode se encaixar neste modelo facilmente, que inclui modelos, onde leitura / gravação é igual. Além disso, quando se trata de OLTP, mesmo se alguém entrar em um modelo de consistência forte e ajustável, pode-se ver uma lacuna de milissegundos entre os modelos consistentes eventuais e os modelos consistentes mais fortes. Assim, o Cassandra pode caber no OLTP.

Chegando ao OLAP, é possível ver diferentes padrões OLAP, o que significa que há várias gravações acontecendo simultaneamente. No OLAP, despejamos os dados de uma vez, ou seja, todos os arquivos de log são colocados no armazenamento de dados e então iniciamos o processamento. O padrão de dados ou padrão de acesso é exatamente o oposto do tipo de aplicativo OLTP. Aqui, o Hadoop ou MapReduce será útil.

encontre o maior elemento no array java

Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.

Postagens relacionadas:

5 razões principais para aprender Cassandra