R é uma linguagem de programação destinada à análise estatística e criação de gráficos para esse fim. Em vez de tipos de dados, possui objetos de dados que são utilizados para cálculos. É usado nas áreas de mineração de dados, análise de regressão, estimativa de probabilidade etc., usando muitos pacotes disponíveis nele.

Existem 6 objetos de dados em R. Eles são vetores, listas, arrays, matrizes, quadros de dados e tabelas.

Um nome de variável válido consiste em letras, números e pontos ou caracteres sublinhados. O nome da variável começa com uma letra ou o ponto não seguido por um número.

Uma matriz é sempre bidimensional, pois possui apenas linhas e colunas. Mas uma matriz pode ser de qualquer número de dimensões e cada dimensão é uma matriz. Por exemplo, uma matriz 3x3x2 representa 2 matrizes, cada uma com dimensão 3x3.

Os objetos de dados de fator em R são usados ​​para armazenar e processar dados categóricos em R.

Um arquivo csv pode ser carregado usando a função read.csv. R cria um quadro de dados ao ler os arquivos csv usando esta função.

O comando getwd () fornece o diretório de trabalho atual no ambiente R.

Este é o pacote que é carregado por padrão quando o ambiente R é definido. Ele fornece as funcionalidades básicas como entrada / saída, cálculos aritméticos, etc. no ambiente R.

A regressão logística trata da medição da probabilidade de uma variável de resposta binária. Em R, a função glm () é usada para criar a regressão logística.

A expressão M [4,2] fornece o elemento na 4ª linha e na 2ª coluna.

Quando dois vetores de comprimento diferente estão envolvidos em uma operação, os elementos do vetor mais curto são reutilizados para completar a operação. Isso é chamado de reciclagem de elemento. Exemplo - v1 <- c (4,1,0,6) e V2 <- c (2,4) então v1 * v2 resulta (8,4,0,24). Os elementos 2 e 4 são repetidos.

Podemos chamar uma função em R de 3 maneiras. O primeiro método é chamar usando a posição dos argumentos. Segundo ID de método a ser chamado usando o nome dos argumentos e o terceiro método é chamado por argumentos padrão.

A avaliação preguiçosa de uma função significa que o argumento é avaliado apenas se for usado dentro do corpo da função. Se não houver referência ao argumento no corpo da função, ele será simplesmente ignorado.

Para instalar um pacote em R, usamos o comando abaixo.

install.packages("package Name")

O pacote denominado "XML" é usado para ler e processar os arquivos XML.

Podemos atualizar qualquer um dos elementos, mas podemos excluir apenas o elemento no final da lista.

A expressão geral para criar uma matriz em R é - matriz (dados, nrow, ncol, byrow, dimnames)

A função boxplot () é usada para criar boxplots em R. Leva uma fórmula e um quadro de dados como entradas para criar os boxplots.

A frequência 6 indica que o intervalo de tempo para os dados da série temporal é a cada 10 minutos de uma hora.

Em R, os objetos de dados podem ser convertidos de uma forma para outra. Por exemplo, podemos criar um quadro de dados mesclando muitas listas. Isso envolve uma série de comandos R para trazer os dados para o novo formato. Isso é chamado de remodelagem de dados.

Ele gera 4 números aleatórios entre 0 e 1.

Use o comando

installed.packages()

Ele divide as strings no vetor x em substrings na posição da letra e.

x <- "The quick brown fox jumps over the lazy dog"
split.string <- strsplit(x, " ")
extract.words <- split.string[[1]]
result <- unique(tolower(extract.words))
print(result)

Erro em v * x [1]: argumento não numérico para operador binário

[1] 5 12 21 32s

Ele converte uma lista em um vetor.

x <- pbinom(26,51,0.5)
print(x)

N / D

Usando a função as.data.frame ()

function(x) { x[is.na(x)] <- sum(x, na.rm = TRUE); x }

É usado para aplicar a mesma função a cada um dos elementos em um Array. Por exemplo, encontrar a média das linhas em cada linha.

Cada matriz pode ser chamada de array, mas não o contrário. Matrix é sempre bidimensional, mas array pode ser de qualquer dimensão.

?N / D

sd (x, na.rm = TRUE)

setwd ("Caminho")

"%%" fornece o restante da divisão do primeiro vetor com o segundo, enquanto "% /%" fornece o quociente da divisão do primeiro vetor com o segundo.

Encontre a coluna que tem o valor máximo para cada linha.

hist ()

rm (x)

dados (pacote = "MASSA")

data(package = .packages(all.available = TRUE))

É usado para instalar um pacote de um diretório local, navegando e selecionando o arquivo.

15 %in% x
pairs(formula, data)

Onde fórmula representa a série de variáveis ​​usadas em pares e dados representam o conjunto de dados do qual as variáveis ​​serão obtidas.

As funções de subconjunto () são usadas para selecionar variáveis ​​e observações. A função sample () é usada para escolher uma amostra aleatória de tamanho n de um conjunto de dados.

is.matrix (m) deve retornar TRUE.

[1] NA

A função t () é usada para transpor uma matriz. Exemplo - t (m), onde m é uma matriz.

A instrução "próxima" na linguagem de programação R é útil quando queremos pular a iteração atual de um loop sem terminá-la.