O que é uma rede neural? Introdução às redes neurais artificiais



Este blog sobre o que são Redes Neurais apresentará os conceitos básicos de Redes Neurais e como elas podem resolver problemas complexos baseados em dados.

Com o avanço do aprendizado de máquina, tomou um bom caminho. O Deep Learning é considerado a tecnologia mais avançada desenvolvida para resolver problemas complexos que usam conjuntos de dados massivos. Este blog sobre o que são Redes Neurais apresentará os conceitos básicos de Redes Neurais e como elas podem resolver problemas complexos baseados em dados.

Para obter conhecimento profundo de Inteligência Artificial e Aprendizagem Profunda, você pode se inscrever para por Edureka com suporte 24 horas por dia, 7 dias por semana e acesso vitalício.





Aqui está uma lista de tópicos que serão abordados neste Blog:

  1. O que é uma rede neural?
  2. O que é Deep Learning?
  3. Diferença entre AI, ML e DL
  4. Necessidade de aprendizado profundo
  5. Caso de uso de aprendizado profundo
  6. Como funcionam as redes neurais?
  7. Rede Neural Explicada com Exemplo

Definição Simples de Rede Neural

Modelado de acordo com o cérebro humano, um Rede Neural foi construída para imitar a funcionalidade de um cérebro humano . O cérebro humano é uma rede neural composta de vários neurônios, da mesma forma, uma Rede Neural Artificial (RNA) é composta de vários perceptrons (explicado mais tarde).



Rede Neural - O que é uma Rede Neural - Edureka

Uma rede neural consiste em três camadas importantes:

  • Camada de entrada: Como o nome sugere, essa camada aceita todas as entradas fornecidas pelo programador.
  • Camada Oculta: Entre a camada de entrada e a de saída está um conjunto de camadas conhecidas como camadas ocultas. Nesta camada, são realizados cálculos que resultam na saída.
  • Camada de saída: As entradas passam por uma série de transformações por meio da camada oculta que finalmente resulta na saída que é entregue por meio deste camada.

Antes de entrarmos em detalhes sobre como funciona uma rede neural, vamos entender o que é Deep Learning.



O que é aprendizado profundo?

Deep Learning é um campo avançado de Aprendizado de Máquina que usa os conceitos de Redes Neurais para resolver casos de uso altamente computacionais que envolvem a análise de dados multidimensionais. Ele automatiza o processo de extração de recursos, garantindo que seja necessária uma intervenção humana mínima.

Então, o que exatamente é Deep Learning?

Deep Learning é um avançado subcampo do Aprendizado de Máquina que utiliza algoritmos inspirados na estrutura e função do cérebro denominados Redes Neurais Artificiais.

Diferença entre IA, ML e DL (inteligência artificial vs. aprendizado de máquina vs. aprendizado profundo)

As pessoas costumam pensar que , , e Aprendizado Profundo são iguais, uma vez que têm aplicações comuns. Por exemplo, Siri é um aplicativo de IA, aprendizado de máquina e aprendizado profundo.

Então, como essas tecnologias estão relacionadas?

  • Inteligência artificial é a ciência de fazer com que as máquinas imitem o comportamento dos humanos.
  • Aprendizado de máquina é um subconjunto de Inteligência Artificial (IA) que se concentra em fazer com que as máquinas tomem decisões alimentando-as com dados.
  • Aprendizagem profunda é um subconjunto do aprendizado de máquina que usa o conceito de redes neurais para resolver problemas complexos.

Para resumir, AI, Machine Learning e Deep Learning são campos interconectados. O aprendizado de máquina e o aprendizado profundo auxiliam a inteligência artificial, fornecendo um conjunto de algoritmos e redes neurais para resolver problemas baseados em dados.

Agora que você está familiarizado com o básico, vamos entender o que levou à necessidade de Deep Learning.

c ++ sort array

Necessidade de aprendizado profundo: limitações dos algoritmos e técnicas de aprendizado de máquina tradicionais

O Aprendizado de Máquina foi um grande avanço no mundo técnico, pois levou à automação de tarefas monótonas e demoradas, ajudou a resolver problemas complexos e a tomar decisões mais inteligentes. No entanto, havia algumas desvantagens no aprendizado de máquina que levaram ao surgimento do Deep Learning.

Aqui estão algumas limitações do aprendizado de máquina:

  1. Incapaz de processar dados dimensionais elevados: O aprendizado de máquina pode processar apenas pequenas dimensões de dados que contêm um pequeno conjunto de variáveis. Se você deseja analisar dados contendo centenas de variáveis, o Machine Learning não pode ser usado.
  2. A engenharia de recursos é manual: Considere um caso de uso onde você tem 100 variáveis ​​preditoras e precisa restringir apenas as significativas. Para fazer isso, você deve estudar manualmente a relação entre cada uma das variáveis ​​e descobrir quais são importantes na previsão do resultado. Essa tarefa é extremamente tediosa e demorada para um desenvolvedor.
  3. Não é ideal para realizar detecção de objetos e processamento de imagens: Como a detecção de objetos requer dados de alta dimensão, o Machine Learning não pode ser usado para processar conjuntos de dados de imagem, ele só é ideal para conjuntos de dados com um número restrito de recursos.

Antes de entrarmos nas profundezas de Redes Neurais, vamos considerar um caso de uso do mundo real onde o Deep Learning é implementado.

Caso de uso / aplicativos de aprendizado profundo

Você sabia que o PayPal processa mais de US $ 235 bilhões em pagamentos de quatro bilhões de transações por seus mais de 170 milhões de clientes? Ele usa essa vasta quantidade de dados para identificar possíveis atividades fraudulentas, entre outros motivos.

Com a ajuda de algoritmos de Deep Learning, o PayPal extraiu dados do histórico de compras de seus clientes, além de revisar os padrões de possíveis fraudes armazenados em seus bancos de dados para prever se uma determinada transação é fraudulenta ou não.

A empresa conta com a tecnologia Deep Learning & Machine Learning há cerca de 10 anos. Inicialmente, a equipe de monitoramento de fraude usava modelos lineares simples. Mas, com o passar dos anos, a empresa mudou para uma tecnologia de aprendizado de máquina mais avançada, chamada Deep Learning.

Ke Wang, gerente de risco de fraude e cientista de dados do PayPal, citou:

“O que gostamos de um aprendizado de máquina mais moderno e avançado é a capacidade de consumir muito mais dados, lidar com camadas e mais camadas de abstração e ser capaz de 'ver' coisas que uma tecnologia mais simples não seria capaz de ver, até mesmo seres humanos poderiam não ser capaz de ver. ”

Um modelo linear simples é capaz de consumir cerca de 20 variáveis. No entanto, com a tecnologia Deep Learning, é possível executar milhares de pontos de dados. Portanto, implementando Tecnologia Deep Learning, PayPal pode finalmente analisar milhões de transações para identificar qualquer fraude atividade.

Agora, vamos aprofundar as redes neurais e entender como elas funcionam.

Como funciona uma rede neural?

Para entender as redes neurais, precisamos dividi-las e entender a unidade mais básica de uma rede neural, ou seja, um Perceptron.

O que é um Perceptron?

Um Perceptron é uma rede neural de camada única usada para classificar dados lineares. Possui 4 componentes importantes:

  1. Entradas
  2. Pesos e Bias
  3. Função de Soma
  4. Função de ativação ou transformação

A lógica básica por trás de um Perceptron é a seguinte:

As entradas (x) recebidas da camada de entrada são multiplicadas com seus pesos atribuídos w. Os valores multiplicados são então adicionados para formar a Soma Ponderada. A soma ponderada das entradas e seus respectivos pesos são então aplicados a uma função de ativação relevante. A função de ativação mapeia a entrada para a respectiva saída.

Pesos e preconceitos no aprendizado profundo

Por que temos que atribuir pesos a cada entrada?

Depois que uma variável de entrada é fornecida à rede, um valor escolhido aleatoriamente é atribuído como o peso dessa entrada. O peso de cada ponto de dados de entrada indica o quão importante essa entrada é na previsão do resultado.

O parâmetro bias, por outro lado, permite que você ajuste a curva da função de ativação de forma que uma saída precisa seja alcançada.

conversão de string para data em java

Função de Soma

Uma vez que os insumos são atribuídos a algum peso, o produto do respectivo insumo e peso é considerado. Adicionar todos esses produtos nos dá a Soma Ponderada. Isso é feito pela função de soma.

Função de Ativação

O principal objetivo das funções de ativação é mapear a soma ponderada para a saída. Funções de ativação como tanh, ReLU, sigmóide e assim por diante são exemplos de funções de transformação.

Para aprender mais sobre as funções dos Perceptrons, você pode ler este Blog.

Antes de nós para encerrar este blog, vamos dar um exemplo simples para entender como funciona uma rede neural.

Redes neurais explicadas com um exemplo

Considere um cenário onde você deve construir uma Rede Neural Artificial (RNA) que classifica as imagens em duas classes:

  • Classe A: Contendo imagens de folhas não doentes
  • Classe B: contendo imagens de folhas doentes

Então, como você cria uma rede Neural que classifica as folhas em colheitas doentes e não doentes?

O processo sempre começa com o processamento e transformação da entrada de forma que possa ser facilmente processada. No nosso caso, cada imagem de folha será dividida em pixels dependendo da dimensão da imagem.

Por exemplo, se a imagem for composta por 30 por 30 pixels, o número total de pixels será 900. Esses pixels são representados como matrizes, que são então alimentados na camada de entrada da Rede Neural.

Assim como nossos cérebros têm neurônios que ajudam a construir e conectar pensamentos, uma RNA tem perceptrons que aceitam entradas e os processam, passando-os da camada de entrada para a camada oculta e, finalmente, a camada de saída.

Conforme a entrada é passada da camada de entrada para a camada oculta, um peso inicial aleatório é atribuído a cada entrada. As entradas são então multiplicadas com seus pesos correspondentes e sua soma é enviada como entrada para a próxima camada oculta.

Aqui, um valor numérico denominado polarização é atribuído a cada perceptron, que está associado à ponderação de cada entrada. Além disso, cada perceptron é passado por ativação ou uma função de transformação que determina se um perceptron particular é ativado ou não.

Um perceptron ativado é usado para transmitir dados para a próxima camada. Desta forma, os dados são propagados (propagação direta) através da rede neural até que os perceptrons atinjam a camada de saída.

Na camada de saída, é derivada uma probabilidade que decide se os dados pertencem à classe A ou à classe B.

Parece simples, não é? Bem, o conceito por trás das Redes Neurais é puramente baseado no funcionamento do cérebro humano. Você precisa de um conhecimento profundo de vários conceitos e algoritmos matemáticos. Aqui está uma lista de blogs para você começar:

  1. O que é Deep Learning? Introdução ao aprendizado profundo
  2. Deep Learning with Python: Beginners Guide to Deep Learning

Se você achou este blog relevante, verifique o pela Edureka, uma empresa de aprendizagem online confiável com uma rede de mais de 250.000 alunos satisfeitos espalhados por todo o mundo. O curso Edureka Deep Learning with TensorFlow Certification Training ajuda os alunos a se tornarem especialistas em treinamento e otimização de redes neurais básicas e convolucionais usando projetos e atribuições em tempo real, juntamente com conceitos como função SoftMax, Redes Neurais de Codificador Automático, Máquina Boltzmann Restrita (RBM).