SAS - Distribuições de Freqüência

Uma distribuição de frequência é uma tabela que mostra a frequência dos pontos de dados em um conjunto de dados. Cada entrada na tabela contém a frequência ou contagem das ocorrências de valores dentro de um determinado grupo ou intervalo e, dessa forma, a tabela resume a distribuição dos valores na amostra.

SAS fornece um procedimento chamado PROC FREQ para calcular a distribuição de frequência de pontos de dados em um conjunto de dados.

Sintaxe

A sintaxe básica para calcular a distribuição de frequência no SAS é -

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

A seguir está a descrição dos parâmetros usados ​​-

  • Dataset é o nome do conjunto de dados.

  • Variables_1 são os nomes das variáveis ​​do conjunto de dados cuja distribuição de frequência precisa ser calculada.

  • Variables_2 são as variáveis ​​que categorizaram o resultado da distribuição de frequência.

Distribuição de frequência de variável única

Podemos determinar a distribuição de frequência de uma única variável usando PROC FREQ.Neste caso, o resultado mostrará a frequência de cada valor da variável. O resultado também mostra a distribuição percentual, frequência cumulativa e porcentagem cumulativa.

Exemplo

No exemplo abaixo, encontramos a distribuição de frequência da variável de potência para o conjunto de dados denominado CARS1 que é criado a partir da biblioteca SASHELP.CARS.Podemos ver o resultado dividido em duas categorias de resultados. Um para cada marca do carro.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

Quando o código acima é executado, obtemos o seguinte resultado -

Distribuição de frequência múltipla variável

Podemos encontrar as distribuições de frequência para variáveis ​​múltiplas que as agrupam em todas as combinações possíveis.

Exemplo

No exemplo abaixo, calculamos a distribuição de frequência para a marca de um carro para grouped by car type e também a distribuição de frequência de cada tipo de carro grouped by each make.

proc FREQ data = CARS1 ;
tables make type; 
run;

Quando o código acima é executado, obtemos o seguinte resultado -

Distribuição de frequência com peso

Com a opção de peso podemos calcular a distribuição de frequência enviesada com o peso da variável. Aqui, o valor da variável é considerado o número de observações em vez da contagem do valor.

Exemplo

No exemplo abaixo, calculamos a distribuição de frequência das variáveis ​​marca e tipo com peso atribuído à potência.

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

Quando o código acima é executado, obtemos o seguinte resultado -