R Tutorial - um guia para iniciantes no aprendizado da programação R



Este blog no R Tutorial apresenta a ferramenta R e ajuda a entender os vários fundamentos da programação R em detalhes com exemplos.

R é a ferramenta de análise de dados mais popular, pois é de código aberto, flexível, oferece vários pacotes e tem uma enorme comunidade. Ele foi projetado para programadores de software, estatísticos e mineradores de dados e, portanto, deu origem à popularidade de .Neste blog do tutorial R, darei uma visão completa sobre o R com exemplos.

exemplo de variável de instância em java

Abaixo estão os tópicos neste blog R Tutorial que irei discutir na seguinte seqüência:





  1. Por que precisamos do Analytics ?
  2. O que é Business Analytics ?
  3. Por que R e quem usa R ?
  4. Instalação de R
  5. Operadores de dados
  6. Tipos de dados
  7. Controle de fluxo

R Tutorial: Por que precisamos de análises?

Antes de responder à pergunta, deixe-me informá-lo sobre alguns dos problemas e suas soluções em R em vários domínios.



bancário - R Tutorial - Edureka

Bancário :

Grande quantidade de dados de clientes é gerada diariamente nos bancos. WEmbora lidando com milhões de clientes regularmente, fica difícil rastrear suas hipotecas.



Solução :

R constrói um modelo personalizado que mantém os empréstimos fornecidos a cada cliente individual, o que nos ajuda a decidir o valor a ser pago pelo cliente ao longo do tempo.

Seguro :

O seguro depende amplamente da previsão. Isso é difícildecidir qual política aceitar ou rejeitar.

Solução:

Usando o relatório de crédito contínuo como entrada, podemos criar um modelo em R que não apenas avaliará o apetite pelo risco, mas também fará uma previsão preditiva.

Cuidados de saúde:

Todos os anos, milhões de pessoas são admitidas no hospital e bilhões são gastos anualmente apenas no processo de admissão.

Solução :

Dada a história do paciente e da história médica, um modelo preditivo pode ser construído para identificar quem está em risco de hospitalização e até que ponto o equipamento médico deve ser dimensionado.

Agora sabemos como a análise de dados ajuda as organizações a aproveitar seus dados e usá-los para identificar novas oportunidades. Se falamos sobre a necessidade de análises em uma organização, você deve se deparar com estes 4 aspectos:

A seguir, vamos avançar no blog do tutorial R, onde primeiro entenderemos o que exatamente é análise de negócios.

R Tutorial: O que é Business Analytics?

A análise de negócios é um processo de examinar grandes conjuntos de dados e alcançar padrões ocultos, correlações e outros insights. Basicamente, ajuda você a entender todos os dados que você reuniu, sejam dados organizacionais, dados de pesquisa de mercado ou de produto ou qualquer outro tipo de dado. Torna-se fácil para você tomar melhores decisões, melhores produtos, melhores estratégias de marketing, etc. Consulte a imagem abaixo para melhor compreensão:

Se você olhar para a figura acima, seus dados na primeira imagem estão espalhados. Agora, se você deseja algo específico, como um determinado registro em um banco de dados, torna-se complicado. Para simplificar isso, você precisa de análise. Com a análise, fica fácil estabelecer uma correlação entre os dados. Depois de estabelecer o que fazer, torna-se muito fácil tomar decisões como qual caminho deseja seguir ou, em termos de análise de negócios, qual caminho levará à melhoria de sua organização.

Mas você não pode esperar que as pessoas na cadeia acima sempre entendam os dados brutos que você está fornecendo após a análise. Então, para superar essa lacuna, temos um conceito de Visualização de dados .

Visualização de dados : A visualização de dados é um acesso visual a grandes quantidades de dados que você gerou após a análise. A mente humana processa imagens visuais e gráficos visuais são melhores do que comparar com dados brutos. É sempre fácil para nós entender um gráfico de pizza ou um gráfico de barras em comparação com números brutos. Agora você deve estar se perguntando como pode obter essa visualização de dados a partir dos dados que já analisou?
Existem várias ferramentas disponíveis no mercado para Visualização de Dados:

Todos vocês devem estar se perguntando se já existem tantas ferramentas que ajudam a obter a visualização de dados e certa quantidade de análises, por que escolher R?

Portanto, meu próximo tópico no blog do tutorial R trata de ‘por que R’ e ‘quem usa R’.

R Tutorial: Por que R e quem usa R?

Por que R?

R é uma linguagem de programação e estatística.

R é usado para análise e visualização de dados.

R é simples e fácil de aprender, ler e escrever.

R é um exemplo de FLOSS (Software Livre e de Código Aberto) onde se pode distribuir gratuitamente cópias deste software, ler seu código-fonte, modificá-lo, etc.

Quem usa R?

  • O Consumer Financial Protection Bureau usa R para análise de dados
  • Os estatísticos da John Deere usam R para modelagem de séries temporais e análise geoespacial de maneira confiável e reproduzível.
  • O Bank of America usa R para relatórios.
  • R é parte da tecnologia por trás do famoso mecanismo de recomendação do Foursquare.
  • ANZ, o quarto maior banco da Austrália, usando R para análise de risco de crédito.
  • O Google usa R para prever a atividade econômica.
  • Mozilla, a fundação responsável pelo navegador Firefox, usa R para visualizar a atividade na web.

Abaixo estão alguns dos domínios em que R é usado:

Agora, vamos avançar no blog do tutorial R e instalar o R.

Tutorial R: Instalação de R

Deixe-me guiá-lo pelo processo de instalação do R em seu sistema. Basta seguir as etapas abaixo:

Passo 1 : Vá para o link- https://cran.r-project.org/

Passo 2 : Baixe e instale R 3.3.3 em seu sistema.

Consulte a captura de tela abaixo para entender melhor.

Seguindo as etapas acima, você concluiu a parte de instalação do R. Agora, você pode iniciar a codificação diretamente em R baixando o RStudio IDE. Para fazer o download, siga as etapas abaixo:

Passo 1 : Vá para o link- https://www.rstudio.com/

Passo 2 : Baixe e instale o Rstudio em seu sistema.

Depois de instalar tudo, você está pronto para codificar!

R Tutorial para iniciantes | Tutorial de programação R | Edureka

A seguir, vamos avançar no blog R Tutorial e entender o que são operadores de dados em R.

Tutorial R: Operadores de dados em R

Existem principalmente 5 tipos diferentes de operadores, que estão listados abaixo:

  1. Operadores aritméticos : Execute operações aritméticas, como adição, subtração, multiplicação, divisão, etc.
  2. Operadores de atribuição :Operadores de atribuição são usados ​​para atribuir valores. Por exemplo:
  • Operador de Atribuição =
    Sintaxe:
    nome da variável = valor
> x = 5 >x 
Resultado: [1] 5
  • Operador de Atribuição<-
    Sintaxe:
    nome variável<- value

    > x<- 15 > x
    Resultado: [1] 15
  • Operador de Atribuição<<-
    Sintaxe:
    nome variável<<- value
> x<<- 2 > x
Resultado: [1] 2
  • Operador de Atribuição ->
    Sintaxe:
    valor -> nome da variável

    > 25 -> x > x 
    Resultado: [1] 25

3. Operador Relacional : Define uma relação entre duas entidades. Por exemplo: ,<=,!= etc.

> xx! = 2
Resultado:[1] VERDADEIRO

4. Operadores lógicos : Esses operadores comparam as duas entidades e são normalmente usados ​​com valores booleanos (lógicos) como &, | e!

> x2 e 3
Resultado:[1] VERDADEIRO

5. Operadores especiais : Esses operadores são usados ​​para fins específicos, não para computação lógica. Por exemplo:

  • Ele cria a série de números em sequência para um vetor.

    > xx
    Resultado: [1] 2 3 4 5 6 7 8
  • % em% Este operador é usado para identificar se um elemento pertence a um vetor.
    Exemplo

    > xyy% em% x
    Resultado: [1] VERDADEIRO

Tutorial R: Tipos de dados

Os tipos de dados são usados ​​para armazenar informações. Em R, não precisamos declarar uma variável como algum tipo de dados. As variáveis ​​são atribuídas com objetos R e o tipo de dados do objeto R torna-se o tipo de dados da variável.Existem principalmente seis tipos de dados presentes em R:

Vamos entrar em mais detalhes sobre cada um deles:

Vetor : Um vetor é uma sequência de elementos de dados do mesmo tipo básico. Exemplo:

vtr = (1, 3, 5, 7 9)

ou

vtr<- (1, 3, 5 ,7 9)

Existem 5 vetores atômicos, também denominados como cinco classes de vetores.

Lista : Listas são os objetos R que contêm elementos de diferentes tipos, como & menos números, strings, vetores e outra lista dentro deles.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = lista (n, s, TRUE) > x

Resultado -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] VERDADEIRO

Arrays : Arrays são os objetos de dados R que podem armazenar dados em mais de duas dimensões. Ele pega vetores como entrada e usa os valores no parâmetro dim para criar uma matriz.

vector1<- c(5,9,3) vector2<- c(10,11,12,13,14,15) resultado<- array(c(vector1,vector2),dim = c(3,3,2))

Resultado -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Arrays : Matrizes são os objetos R nos quais os elementos são dispostos em um layout retangular bidimensional. Uma matriz é criada usando a função matrix (). Exemplo: matriz (dados, nrow, ncol, byrow, dimnames) Onde,

dados é o vetor de entrada que se torna os elementos de dados da matriz.

agora é o número de linhas a serem criadas.

ncol é o número de colunas a serem criadas.

Byrow é uma pista lógica. Se TRUE, os elementos do vetor de entrada são organizados por linha.

dimname são os nomes atribuídos às linhas e colunas.

> Tapete<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Tapete
Resultado :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Fatores : Fatores são os objetos de dados usados ​​para categorizar os dados e armazená-los como níveis. Eles podem armazenar strings e inteiros. Eles são úteis na análise de dados para modelagem estatística.

> dados<- c('East','West','East','North','North','East','West','West“,'East“) > fator_dados<- factor(data) > fator_dados

Resultado :

[1] Leste Oeste Leste Norte Nordeste Oeste Oeste Leste Níveis: Leste Noroeste

Frames de dados : Um quadro de dados é uma tabela ou uma estrutura semelhante a uma matriz bidimensional em que cada coluna contém valores de uma variável e cada linha contém um conjunto de valores de cada coluna.

> id_std = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > marcas = c (623,3,515,2,611,0,729,0,843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Resultado :

std_id std_name marcas 1 1 Rick 623,30 2 2 e 515.20 3 3 Michelle 611,00 4 4 Ryan 729,00 5 5 Gary 843,25

Com isso, chegamos ao fim de diferentes tipos de dados em R. A seguir, vamos avançar no blog R Tutorial e entender outro conceito-chave - instruções de controle de fluxo.

Tutorial R: Declarações de controle de fluxo

As instruções de controle de fluxo desempenham um papel muito importante, pois permitem controlar o fluxo de execução de um script dentro de uma função. As instruções de controle de fluxo mais comumente usadas são representadas na imagem abaixo:

Agora, vamos discutir cada um deles com exemplos.

Tutorial R: declarações do seletor

  • Declaração de controle If : Esta instrução de controle avalia uma única condição. É muito fácil, pois tem apenas uma única palavra-chave “if” seguida da condição e, em seguida, um determinado conjunto de instruções que precisa ser executado caso seja verdadeiro. Consulte o fluxograma abaixo para obter um melhor entendimento:

Neste fluxograma, o código responderá da seguinte maneira:

  1. Em primeiro lugar, ele entrará no loop onde verifica a condição.
  2. Se a condição for verdadeira, o código condicional ou as instruções escritas serão executados.
  3. Se a condição for falsa, as instruções serão ignoradas.

Abaixo está um exemplo de E se instrução de controle em R. Tente executar este exemplo no R Studio.

x = 2 repetir {x = x ^ 2 imprimir (x) se (x> 100) {quebrar}

Resultado :

[1] 4 [1] 16 [1] 256
  • Declaração de controle If Else :Exametipo de declaração de controleavalia um grupo de condições e seleciona as declarações. Consulte o fluxograma abaixo para obter um melhor entendimento:

Neste fluxograma, o código responderá da seguinte maneira:

  1. Em primeiro lugar, ele entrará no loop onde verifica a condição.
  2. Se a condição for verdadeira, as primeiras declarações ‘if’ serão executadas.
  3. Se a condição for falsa, então ele vai para a condição ‘else if’ e, se for verdadeira, o código ‘else if’ será executado.
  4. Finalmente, se o código ‘else if’ também for falso, ele irá para o código ‘else’ e será executado. Isso significa que se nenhuma dessas condições for verdadeira, a instrução ‘else’ será executada.

Abaixo está um exemplo de se mais instrução de controle em R. Tente executar este exemplo no R Studio.

x5) {print ('x é maior que 5')} elseif (x == 5) {print ('x é igual a 5')} else {print ('x não é maior que 5')}

Resultado:

[1] 'x é igual a 5'
  • Declarações de mudança : Essas instruções de controle são usadas basicamente para comparar uma determinada expressão a um valor conhecido. Consulte o fluxograma abaixo para obter um melhor entendimento:

Neste fluxograma de caso de Switch, o código responderá nas seguintes etapas:

  1. Em primeiro lugar, ele entrará na caixa do switch que tem uma expressão.
  2. Em seguida, ele irá para a condição do Caso 1, verifica o valor passado para a condição. Se for verdadeiro, o bloco de declaração será executado. Depois disso, ele sairá dessa caixa de switch.
  3. Caso seja falso, então passará para o próximo caso. Se a condição do Caso 2 for verdadeira, ele executará a instrução e interromperá aquele caso, caso contrário, saltará novamente para o próximo caso.
  4. Agora, digamos que você não tenha especificado nenhum caso ou que haja alguma entrada errada do usuário, então ele irá para o caso padrão, onde imprimirá sua declaração padrão.

Abaixo está um exemplo de instrução switch em R. Tente executar este exemplo no R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Resultado :

[1] 275

Tutorial R: Demonstrações de Loop

Os loops ajudam a repetir certo conjunto de ações para que você não tenha que executá-las repetidamente. Imagine que você precise realizar uma operação 10 vezes, se começar a escrever o código a cada vez, a duração do programa aumentará e será difícil para você entendê-lo posteriormente. Mas, ao mesmo tempo, usando um loop, se eu escrever a mesma instrução dentro de um loop, isso economiza tempo e torna mais fácil a legibilidade do código. Ele também fica mais otimizado com relação à eficiência do código.

Na imagem acima, ‘ repetir' e ‘ enquanto 'As declarações ajudam você a executar um certo conjunto de regras até que a condição seja verdadeira, mas' para' é uma instrução de loop usada quando você sabe quantas vezes deseja repetir um bloco de instruções. Agora, se você sabe que deseja repeti-lo por 10 vezes, então você usará a instrução 'for', mas se você não tiver certeza sobre quantas vezes deseja que o código seja repetido, use 'repeat' ou loop 'while'.

Vamos discutir cada um deles com exemplos.

  • Repetir : O loop de repetição ajuda a executar o mesmo conjunto de código repetidas vezes até que uma condição de parada seja encontrada. Consulte o fluxograma abaixo para obter um melhor entendimento:

No fluxograma acima, o código responderá nas seguintes etapas:

  1. Em primeiro lugar, ele irá inserir e executar um conjunto de códigos.
  2. Em seguida, ele verificará a condição, se for verdadeira, ele voltará e executará o mesmo conjunto de código novamente até que deva ser falso.
  3. Se for considerado falso, ele sairá diretamente do loop.
  • Enquanto : A instrução while também ajuda a executar o mesmo conjunto de código repetidamente até que uma condição de parada seja satisfeita. Consulte o fluxograma abaixo para obter um melhor entendimento:

No fluxograma acima, o código responderá nas seguintes etapas:

  1. Em primeiro lugar, ele verificará a condição.
  2. Se for verdadeiro, ele executará o conjunto de códigos.
  3. Em seguida, ele verifica novamente a condição, se for verdadeira executará o mesmo código novamente. Assim que a condição for considerada falsa, ele sai imediatamente do loop.

Abaixo está um exemplo de instrução while em R. Tente executar este exemplo no R Studio.

x = 2 enquanto (x<1000) { x=x^2 print(x) } 

Resultado:

4 16 256 65 536

Portanto, você deve estar se perguntando como essas duas afirmações diferem? Deixe-me esclarecer sua dúvida!
Aqui, a principal diferença entre a instrução repeat e while é que ela muda em relação à sua condição. Enquanto loop define basicamente quando você vai entrar no loop para executar as instruções e repetir loop define quando você sai do loop após a execução das instruções. Portanto, essas duas instruções são conhecidas como loop de controle de entrada e loop de controle de saída. É assim que as declarações while e repeat são diferentes.

  • For Loop: Os loops For são usados ​​quando você precisa executar um bloco de código várias vezes. Consulte o fluxograma abaixo para obter um melhor entendimento:

No fluxograma acima, o código responderá nas seguintes etapas:

  1. Em primeiro lugar, há a inicialização, onde você especifica quantas vezes deseja que o loop se repita.
  2. Em seguida, ele verifica a condição. Se a condição for verdadeira, ele executará o conjunto de códigos pelo número especificado de vezes.
  3. Assim que a condição for considerada falsa, ele sai imediatamente do loop.

Abaixo está um exemplo de instrução for em R. Tente executar este exemplo no R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Resultado :

7 19 25 65 45

A seguir, vamos passar para o nosso último conjunto de instruções no blog R Tutorial, ou seja, instruções de salto.

R Tutorial: Jump Statements

Declaração de quebra : As instruções break ajudam a encerrar o programa e retoma o controle para a próxima instrução após o loop. Essas instruções também são usadas no caso de switch. Consulte o fluxograma abaixo para obter um melhor entendimento:

No fluxograma acima, o código responderá nas seguintes etapas:

  1. Em primeiro lugar, ele entrará no loop onde verifica a condição.
  2. Se a condição do loop for falsa, ele sai diretamente do loop.
  3. Se a condição for verdadeira, ele verificará a condição de interrupção.
  4. Se a condição de interrupção for verdadeira, ela existe no loop.
  5. Se a condição de interrupção for falsa, ele executará as instruções restantes no loop e repetirá as mesmas etapas.

Abaixo está um exemplo de instrução de salto em R. Tente executar este exemplo no R Studio.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Resultado:

[1] 1 [1] 2

Próxima declaração : Uma próxima instrução é usada quando você deseja pular a iteração atual do loop sem terminá-la. A próxima instrução é bastante semelhante a ‘continue’ em outra linguagem de programação. Consulte o fluxograma abaixo para obter um melhor entendimento:

No fluxograma acima, o código responderá nas seguintes etapas:

  1. Em primeiro lugar, ele entrará no loop onde verifica a condição.

  2. Se a condição do loop for falsa, ele sai diretamente do loop.

  3. Se a condição do loop for verdadeira, ele executará as instruções do bloco 1.

  4. Depois disso, ele verificará a declaração 'próxima'. Se estiver presente, as instruções subsequentes não serão executadas na mesma iteração do loop.

  5. Se a instrução ‘próxima’ não estiver presente, todas as instruções posteriores serão executadas.

Abaixo está um exemplo da próxima instrução em R. Tente executar este exemplo no R Studio.

para (i em 1:15) {if ((i %% 2) == 0) {next} print (i)}

Resultado :

1 3 5 7 9 11 13 15

Este é o fim do blog do tutorial R. Espero que vocês estejam claros sobre cada um dos conceitos que discuti acima. Fique ligado, meu próximo blog será sobre treinamento de R, onde estarei explicando mais alguns conceitos de R em detalhes com examplo.

Agora que você entendeu o básico de R, verifique o pela Edureka, uma empresa de aprendizagem online confiável com uma rede de mais de 250.000 alunos satisfeitos espalhados por todo o mundo. O treinamento de Análise de Dados com R da Edureka o ajudará a ganhar experiência em Programação R, Manipulação de Dados, Análise Exploratória de Dados, Visualização de Dados, Mineração de Dados, Regressão, Análise de Sentimentos e usando R Studio para estudos de caso da vida real em Varejo, Mídia Social.

Tem alguma questão para nós? Mencione isso na seção de comentários deste blog “R Tutorial” e entraremos em contato com você o mais breve possível.