Técnicas de Modelagem em Análise de Negócios com R



O blog fornece uma breve introdução às Técnicas de Modelagem em Análise de Negócios com R.

Diferentes técnicas de modelagem:

Podemos dividir qualquer problema em processos menores:





Classificação - é, onde classificamos os dados. Por exemplo. doenças todas as doenças exibem certo comportamento e podemos classificá-las posteriormente.

definir caminho de classe para java

Por exemplo: doenças que reduzem a imunidade, doenças que dão dor de cabeça, etc.



Regressão - envolve descobrir a relação entre várias variáveis.

Por exemplo: como o peso de um ser humano está relacionado à sua altura.

AnomolyDetecção - é basicamente uma flutuação.



Por exemplo: No caso de alta ou baixa tensão.

Outro exemplo pode incluir o comportamento regulamentado que envolve a condução no lado direito ou esquerdo com base no país. A anomia aqui é alguém que dirige do contrário.

Outro exemplo pode ser a intrusão na rede. Aqui, um usuário autenticado faz login no site da sua empresa e, se alguém não autenticado, é umAn0moly.

Importância do atributo - Basicamente, dá vários atributos, como altura, peso, temperatura, batimento cardíaco. Um ponto a ser observado é que todos esses atributos são importantes para uma tarefa.

python converter decimal em binário

Por exemplo: Alguém está tentando prever a que horas uma pessoa chegará ao cargo. Cada atributo desempenha um papel importante, mas nem todos os atributos são importantes.

Regras de Associação - Em termos mais simples, é analisar ou prever o próximo comportamento, onde gira em torno do mecanismo de recomendação.

Por exemplo: Uma pessoa que compra pão também pode comprar leite. Se analisarmos os comportamentos de compra anteriores, todos os itens na cesta têm uma relação. Nesse caso, pode haver uma probabilidade de que a pessoa que compra pão também compre leite.

Clustering - É uma das técnicas mais antigas da estatística. Na verdade, sempre se pode modelar qualquer problema, seja de classificação ou clustering, o que significa agrupar entidades semelhantes.

Por exemplo:

1) Pegue uma cesta de maçãs e laranjas, na qual podemos separar maçãs de laranjas.

2) Um caso de uso importante para cluster é saúde. Quase todas as estatísticas e análises começaram com casos de uso de saúde. Para ir mais fundo, existe um termo de agrupamento chamado coortes (pessoas com doenças semelhantes), para que possam ser estudadas separadamente dos clientes existentes. Por exemplo, se 10 pessoas estão com febre e outras 10 pessoas com dor de cabeça, vamos descobrir o que há de comum entre elas e gerar remédio.

Extração de característica - Na precisão de extração de recursos, validade e falha são bastante relevantes. Em outras palavras, a extração de recursos pode ser denominada como reconhecimento de padrão.

Por exemplo:

Na pesquisa do Google, quando um usuário insere um termo, ele apresenta resultados. Agora, uma pergunta importante a ser feita é como ele sabe qual página é relevante e não é relevante para o termo? Isso pode ser respondido com extração de recursos e reconhecimento de padrões, onde são adicionados recursos proeminentes. Digamos que uma foto é dada, certas câmeras detectam rostos, realçam rosto para dar belas imagens, que também usa recurso de reconhecimento.

Aprendizagem supervisionada versus aprendizagem não supervisionada

para) Categoria de previsão - As técnicas incluem regressão, logística, redes neurais e árvores de decisão. Alguns exemplos incluem detecção de fraude (onde um computador aprende e prevê a próxima fraude do histórico de fraude anterior). Na aprendizagem não supervisionada, não se pode prever com exemplos, pois não há dados históricos.

como usar python anaconda

b) Categoria de Classificação - Por exemplo, se a transação é fraudulenta ou não, entra na categoria de classificação. Aqui, pegamos dados históricos e os classificamos com árvores de decisão ou, caso não recebamos nenhum dado histórico, então começamos diretamente com os dados e tentamos explorar os recursos por conta própria. Por exemplo, se precisarmos conhecer os funcionários, quem provavelmente sairá da organização ou ficará. No caso, é uma nova organização, onde não podemos usar dados históricos, podemos sempre usar clustering para extração de dados.

c) Categoria de Exploração - Este é um método direto, propondo o que significa big data. No aprendizado não supervisionado, é chamado de componentes principais e agrupamento.

d) Categoria de afinidade - aqui, vários elementos estão envolvidos, como venda cruzada / venda incrementada, análise de cesta de compras. Na análise de cesto, não há aprendizagem supervisionada, pois não há dados históricos. Assim, pegamos os dados diretamente e encontramos associações, sequenciamento e análise fatorial.

Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.

Postagens relacionadas: