Aprendizagem supervisionada no Apache Mahout



Aprendizado supervisionado é uma técnica de aprendizado de máquina, em que uma função é inferida a partir dos exemplos rotulados de dados de treinamento.

Aprendizagem supervisionada é o método em que os dados de treinamento incluem tanto a entrada quanto os resultados desejados. Treinar o sistema com exemplos é chamado de aprendizado supervisionado. Ou então, treinar o algoritmo com um professor também pode ser tratado como aprendizagem supervisionada. Depois de treinar o algoritmo com todos os dados de amostra ou dados rotulados, que possui ambos os preditores na variável de destino, pode-se treinar o algoritmo e usar o exemplo invisível para classificação posterior.





Aqui estão alguns dos recursos importantes da Aprendizagem Supervisionada no Mahout:

  • A construção de um conjunto adequado de treinamento, validação e teste (Bok) é crucial.
  • Esses métodos geralmente são rápidos e precisos.
  • Os métodos de Aprendizagem Supervisionada devem ser capazes de generalizar.
  • Eles dão resultados corretos, quando novos dados são fornecidos na entrada sem saber umpriorialvo.
  • Em alguns casos, os resultados corretos (metas) são conhecidos e fornecidos como entrada para o modelo durante o processo de aprendizagem.

Exemplo de aprendizagem supervisionada

No caso, você deseja treinar uma missão e recebe dois grupos diferentes de imagens junto com os dados rotulados, por exemplo, na foto acima, um grupo tem as imagens de um elefante e o outro tem as de um leão. Dados rotulados implicam que cada conjunto de dados tenha um valor de destino. No exemplo acima, o conjunto de dados são imagens de elefante, enquanto o rótulo dado a ele, ou seja, 'Elefante' é o valor alvo do conjunto de dados. Esse conjunto de dados rotulados é usado para o processo de treinamento, de modo que o algoritmo de treinamento possa aproveitar esse conjunto de dados e construir algum modelo, que pode ser usado posteriormente para classificar os exemplos não vistos sem os dados rotulados ou a variável de destino.



Vamos identificar as características que ajudam a identificar um objeto como um elefante ou leão:

As características poderia ser - tamanho, cor, altura, tamanho da orelha, tronco, presa

Isso pode ser chamado de conjunto de recursos, que será usado para fins de treinamento. Este conjunto de recursos afetará a variável de destino final. Essas variáveis ​​são conhecidas como variáveis ​​preditoras , porque eles nos ajudam a determinar o variável alvo final . A variável final também pode ser chamada de rótulo. A variável final aqui está Elefante / Leão.



table-word

Neste exemplo, cada um dos registros nas categorias, tamanho, cor, altura, tamanho da orelha, tronco e presa é uma variável de previsão, enquanto Elefante e Leão são as variáveis ​​de destino. Essas variáveis ​​podem ser tratadas como exemplos de treinamento e conjuntos de dados de treinamento, respectivamente.

dígitos reversos de um python inteiro

Assim, a Aprendizagem Supervisionada é uma forma, através da qual você treina junto com os rótulos, onde você pede ao algoritmo para extrair certas características dele, e com base nisso, sempre que você vir um exemplo não visto, o algoritmo será capaz de classificá-lo na classe certa.

Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.

Postagens relacionadas: