SAS - Desvio Padrão

O desvio padrão (SD) é uma medida de quão variados são os dados em um conjunto de dados. Matematicamente, ele mede quão distantes ou próximos estão cada valor do valor médio de um conjunto de dados. Um valor de desvio padrão próximo de 0 indica que os pontos de dados tendem a estar muito próximos da média do conjunto de dados e um desvio padrão alto indica que os pontos de dados estão espalhados por uma faixa mais ampla de valores

No SAS, os valores SD são medidos usando PROC MEAN e PROC SURVEYMEANS.

Usando PROC MEANS

Para medir o SD usando proc meansescolhemos a opção STD na etapa PROC. Ele traz os valores SD para cada variável numérica presente no conjunto de dados.

Sintaxe

A sintaxe básica para calcular o desvio padrão no SAS é -

PROC means DATA = dataset STD;

A seguir está a descrição dos parâmetros usados ​​-

  • Dataset - é o nome do conjunto de dados.

Exemplo

No exemplo abaixo, criamos o conjunto de dados CARS1 do conjunto de dados CARS na biblioteca SASHELP. Escolhemos a opção STD com o PROC significa passo.

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc means data = CARS1 STD;
run;

Quando executamos o código acima, ele fornece a seguinte saída -

Usando PROC SURVEYMEANS

Este procedimento também é usado para medir o SD junto com alguns recursos avançados, como medir o SD para variáveis ​​categóricas, bem como fornecer estimativas de variação.

Sintaxe

A sintaxe para usar PROC SURVEYMEANS é -

PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;

A seguir está a descrição dos parâmetros usados ​​-

  • BY - indica as variáveis ​​usadas para criar grupos de observações.

  • CLASS - indica as variáveis ​​usadas para variáveis ​​categóricas.

  • VAR - indica as variáveis ​​para as quais o SD será calculado.

Exemplo

O exemplo abaixo descreve o uso de class opção que cria as estatísticas para cada um dos valores na variável de classe.

proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

Quando executamos o código acima, ele fornece a seguinte saída -

Usando a opção BY

O código a seguir dá um exemplo da opção BY. Nele o resultado é agrupado para cada valor da opção BY.

Exemplo

proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

Quando executamos o código acima, ele fornece a seguinte saída -

Resultado para make = "Audi"

Resultado para make = "BMW"