Programação R - Guia para iniciantes na linguagem de programação R



Este blog sobre Programação R apresenta R e ajuda a entender os vários conceitos fundamentais da programação R em detalhes com exemplos.

R é uma das ferramentas de análise mais populares. Mas, além de ser usado para análises, R também é uma linguagem de programação.Com o seu crescimento na indústria de TI, há uma demanda crescente por profissionais qualificados ou com uma compreensão de R como uma ferramenta de análise de dados e uma linguagem de programação.Neste blog, vou ajudá-lo a entender os vários fundamentos da programação R. Na nossa p revious Blog ,discutimos Por que precisamos do Analytics, O que é Business Analytics, Por que e quem usa R.

Neste blog, vamos entender os conceitos básicos de Programação R abaixo na seguinte sequência:





  1. Variáveis
  2. Tipos de dados
  3. Operadores de dados
  4. Afirmação condicional
  5. rotações
  6. Funções

Você pode assistir à gravação do webinar da linguagem de programação R, onde nosso instrutor explicou os tópicos de maneira detalhada com exemplos que o ajudarão a entender melhor a programação R.

Programação R para iniciantes | Tutorial de linguagem de programação R | Edureka



Então, vamos seguir em frente e olhar para o primeiro conceito de Programação R - Variáveis.

como configurar php

Programação R: Variáveis

As variáveis ​​nada mais são do que um nome para um local de memória contendo um valor. Uma variável em R pode armazenar valores numéricos, valores complexos, palavras, matrizes e até mesmo uma tabela. Surpreendente, certo?

Variável - Programação R - Edureka

FIG: Criaçãode variáveis



A imagem acima nos mostra como as variáveis ​​são criadas e como são armazenadas em diferentes blocos de memória. Em R, não precisamos declarar uma variável antes de usá-la, ao contrário de outras linguagens de programação como Java, C, C ++, etc.

Vamos seguir em frente e tentar entender o que é um tipo de dados e os vários tipos de dados suportados em R.

Programação R: Tipos de Dados

Em R, uma variável em si não é declarada de nenhum tipo de dados, em vez disso, ela obtém o tipo de dados do objeto R atribuído a ela. Portanto, R é chamada de linguagem de tipo dinâmico, o que significa que podemos alterar um tipo de dados da mesma variável repetidamente ao usá-la em um programa.

Tipos de dados especifica qual tipo de valor uma variável possui e que tipo de operações matemáticas, relacionais ou lógicas podem ser aplicadas a ela sem causar um erro. Existem muitos tipos de dados em R, no entanto, abaixo estão os usados ​​com mais frequência:

Vamos agora discutir cada um desses tipos de dados individualmente, começando em Vetores.

Vetores

Vetores são os objetos de dados R mais básicos e existem seis tipos de vetores atômicos. Abaixo estão os seis vetores atômicos:

Lógico : É usado para armazenar valor lógico como VERDADE ou FALSO .

Numérico : É usado para armazenar números positivos e negativos, incluindo o número real.

Por exemplo: 25, 7,1145, 96547

Inteiro : Contém todos os valores inteiros, ou seja, todos os números inteiros positivos e negativos.

Por exemplo: 45,479, -856,479, 0

Complexo : Têm a forma x + yi, em que x e y são numéricos ei representa a raiz quadrada de -1.

Por exemplo: 4 + 3i

Personagem : É usado para armazenar um único caractere, grupo de caracteres (palavras) ou um grupo de palavras juntos. Os caracteres podem ser definidos entre aspas simples ou duplas.

Por exemplo: 'Edureka', 'R é divertido de aprender'.

Em geral, um vetor é definido e inicializado da seguinte maneira:

Vtr = c (2, 5, 11, 24) Ou Vtr<- c(2, 5, 11 , 24)

Vamos seguir em frente e entender outros tipos de dados em R.

Lista

As listas são bastante semelhantes aos vetores, mas as listas são os objetos R que podem conter elementos de diferentes tipos, como números & menos, strings, vetores e outra lista dentro deles.

Por exemplo:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Resultado:

[[1]] [1] 'Olá' 'Olá' 'Como você está fazendo '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] VERDADEIRO

Matriz

Matrix é o objeto R no qual os elementos são dispostos em um layout retangular bidimensional.

A sintaxe básica para criar uma matriz em R é & menos

 matriz (dados, nrow, ncol, byrow, dimnames) 

Onde:

  • dados é o vetor de entrada que se torna os elementos de dados da matriz.
  • agora é o número de linhas a serem criadas.
  • ncol é o número de colunas a serem criadas.
  • Byrow é uma pista lógica. Se TRUE, os elementos do vetor de entrada são organizados por linha.
  • dimname são os nomes atribuídos às linhas e colunas.

Exemplo:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Resultado:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Arrays em R são objetos de dados que podem ser usados ​​para armazenar dados em mais de duas dimensões. Ele pega vetores como entrada e usa os valores no não parâmetro para criar uma matriz.

A sintaxe básica para criar uma matriz em R é & menos

 array (dados, dim, dimnames) 

Onde:

  • dados é o vetor de entrada que se torna os elementos de dados do array.
  • não é a dimensão do array, onde você passa o número de linhas, coluna e o número de matrizes a serem criadas pelas dimensões mencionadas.
  • dimname são os nomes atribuídos às linhas e colunas.

Exemplo:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Resultado:

, , 1 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Quadro de dados

Um Data Frame é uma tabela ou estrutura bidimensional semelhante a um array em que cada coluna contém os valores de uma variável e cada linha contém um conjunto de valoresparacada coluna. Abaixo estão algumas das características de um quadro de dados que precisam ser consideradas sempre que trabalhamos com eles:

  • Os nomes das colunas não devem estar vazios.
  • Cada coluna deve conter a mesma quantidade de itens de dados.
  • Os dados armazenados em um quadro de dados podem ser numéricos, fator ou tipo de caractere.
  • Os nomes das linhas devem ser exclusivos.

Exemplo:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Vendas', 'Finanças', 'Marketing', 'RH ',' R & D ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Resultado:

emp_id emp_name departamento 1 100 John Sales 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R&D

Então, agora que entendemos os tipos de dados básicos de R, é hora de mergulharmos profundamente em R, entendendo os conceitos de Operadores de Dados.

Programação R: Operadores de dados

Existem principalmente 4 operadores de dados em R, eles são vistos abaixo:

Operadores aritméticos : Esses operadores nos ajudam a realizar as operações aritméticas básicas, como adição, subtração, multiplicação, etc.

Considere o seguinte exemplo:

num1 = 15 num2 = 20 num3 = 0 #adição num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplicação num3 = num1 * num2 num3 #divisão num3 = num1 / num2 num3 # módulo num3 = num1 %% num2 num3 #exponente num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # divisão do piso num3 = num1% /% num2 num3

Resultado:

[1] 35 [quinze [1] 300 [1] 0,75 [1] 15 [1] 125 [onze

Operadores Relacionais : Esses operadores nos ajudam a realizar as operações relacionais, como verificar se uma variável é maior, menor ou igual a outra variável. A saída de uma operação relacional é sempre um valor lógico.

Considere os seguintes exemplos:

num1 = 15 num2 = 20 #equals to num3 = (num1 == num2) num3 #não igual a num3 = (num1! = num2) num3 #menor que num3 = (num1 num2) num3 # menos que igual a num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Resultado:

[1] FALSO [1] VERDADEIRO [1] VERDADEIRO [1] FALSO [1] VERDADEIRO [1] FALSO

Operadores de atribuição: Esses operadores são usados ​​para atribuir valores a variáveis ​​em R. A atribuição pode ser realizada usando o operador de atribuição(<-) ou operador igual (=). O valor da variável pode ser atribuído de duas maneiras, atribuição à esquerda e atribuição à direita.

LógicoOperadores: Esses operadores comparam as duas entidades e são normalmente usados ​​com valores booleanos (lógicos), como ‘e’, ‘ou’e'não'.


Programação R: declarações condicionais

  1. Declaração If: A instrução If ajuda você a avaliar uma única expressão como parte do fluxo. Para realizar esta avaliação, basta escrever a palavra-chave If seguida da expressão a ser avaliada. O diagrama de fluxo abaixo dará uma ideia de como a instrução If controla o fluxo de um código: Considere o seguinte exemplo:
num1 = 10 num2 = 20 se (num1<=num2){ print('Num1 is less or equal to Num2') 

Resultado:

[1] 'Num1 é menor ou igual a Num2'
  • Declaração Else If: A instrução Else if ajuda a estender ramificações para o fluxo criado pela instrução If e dá a você a oportunidade de avaliar várias condições criando novas ramificações de fluxo. O fluxo a seguir lhe dará uma ideia de como a instrução else if ramifica o fluxo do código:

    Considere o seguinte exemplo:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 é menor que Num1')} else if ('Num1 == Num2) {print (' Num1 e Num2 são iguais ')}

    Resultado:

    [1] 'Num1 é menor que Num2'

  • Outra declaração: A instrução else é usada quando todas as outras expressões são verificadas e consideradas inválidas. Esta será a última instrução executada como parte da ramificação If - Else if. O fluxo abaixo dará a você uma ideia melhor de como Else altera o fluxo do código:

Considere o seguinte exemplo:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 é menor que Num1')} else print ('Num1 e Num2 são iguais')}

Resultado:

[1] 'Num1 e Num2 são iguais'

Programação R: Loops

Uma instrução de loop nos permite executar uma instrução ou grupo de instruções várias vezes. Existem basicamente 3 tipos de loops em R:

  1. repetir Loop : Repete uma instrução ou grupo de instruções enquanto uma determinada condição for TRUE. O loop de repetição é o melhor exemplo de um loop de saída controlada, onde o código é executado primeiro e, em seguida, a condição é verificada para determinar se o controle deve estar dentro do loop ou sair dele. Abaixo está o fluxo de controle em um loop de repetição:
    Vejamos o exemplo abaixo para entender como podemos usar o loop de repetição para adicionar n números até que a soma exceda 100:

    x = 2 repetir {x = x ^ 2 imprimir (x) se (x> 100) {quebrar}

    Resultado:

    [1] 4 [1] 16 [1] 256
  2. while Loop : Eut ajuda a repetir uma declaração ou grupo de declarações enquanto uma dada condição é VERDADEIRA. Enquanto o loop, quando comparado ao loop de repetição, é ligeiramente diferente, é um exemplo de um loop controlado por entrada onde a condição é verificada primeiro e somente se a condição for considerada verdadeira o controle será entregue dentro do loop para executar o código . Abaixo está o fluxo de controle em um loop while:
    Vejamos o exemplo abaixo para adicionar a soma dos quadrados dos primeiros 10 números e entender como o loop while funciona melhor:

    num = 1 soma = 0 enquanto (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Resultado:

    [onze [quinze [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. for Loop : É usado para repetir uma instrução ou grupo de um número fixo de vezes. Ao contrário do loop repeat e while, o loop for é usado em situações em que estamos cientes do número de vezes que o código precisa ser executado antes. É semelhante ao loop while em que a condição é verificada primeiro e, em seguida, apenas o código escrito nele é executado. Vamos ver o fluxo de controle do loop for agora:

Vejamos agora um exemplo em que usaremos o loop for para imprimir os primeiros 10 números:

para (x em 1:10) {imprimir (x)}

Resultado:

[onze [1] 2 [1] 3 [1] 4 [quinze [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

Programação R: Funções

Uma função é um bloco de código organizado e reutilizável que é usado para realizar uma única ação relacionada. Existem basicamente dois tipos de funções em R:

Funções Predefinidas : Estas são funções integradas que podem ser usadas pelo usuário para fazer seu trabalho easier. Ex: mean( x) , svocêm( x) , sqrt ( x ), toupper( x ), etc.

Usuário definido Funções: Essas funções são criadas pelo usuário para atender a um requisito específico do usuário. A seguir está a sintaxe para criar uma função emR:

 função  nome_da_ção  <– função (arg_1, arg_2 e hellip){ // Corpo da função }

Considere o seguinte exemplo de uma função simples para gerar a soma dos quadradosdo2 números:

__init__ python 3
sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Resultado: [1] 25

Espero que você tenha gostado de ler este blog de programação R. Cobrimos todos os fundamentos do R neste tutorial, então você pode começar a praticar agora. Depois desse blog de programação em R, estarei criando mais blogs em R para Analytics, portanto, fique ligado.

Agora que você entendeu o básico de R, verifique o pela Edureka, uma empresa de aprendizagem online confiável com uma rede de mais de 250.000 alunos satisfeitos espalhados por todo o mundo. O treinamento de Análise de Dados com R da Edureka o ajudará a ganhar experiência em Programação R, Manipulação de Dados, Análise Exploratória de Dados, Visualização de Dados, Mineração de Dados, Regressão, Análise de Sentimento e usando RStudio para estudos de caso da vida real no Varejo, Mídia Social.

Tem alguma questão para nós? Mencione isso na seção de comentários deste blog “Programação R” e entraremos em contato com você o mais breve possível.