SAS - Histogramas

Um histograma é a exibição gráfica de dados usando barras de diferentes alturas. Ele agrupa os vários números no conjunto de dados em vários intervalos. Também representa a estimativa da probabilidade de distribuição de uma variável contínua. No SAS oPROC UNIVARIATE é usado para criar histogramas com as opções abaixo.

Sintaxe

A sintaxe básica para criar um histograma no SAS é -

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

A seguir está a descrição dos parâmetros usados ​​-

  • DATASET é o nome do conjunto de dados usado.

  • variables são os valores usados ​​para traçar o histograma.

Histograma Simples

Um histograma simples é criado especificando o nome da variável e o intervalo a ser considerado para agrupar os valores.

Exemplo

No exemplo a seguir, consideramos os valores mínimo e máximo da variável de potência e tomamos um intervalo de 50. Portanto, os valores formam um grupo em etapas de 50.

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

Quando executamos o código acima, obtemos a seguinte saída -

Histograma com ajuste de curva

Podemos ajustar algumas curvas de distribuição no histograma usando opções adicionais.

Exemplo

No exemplo abaixo, ajustamos uma curva de distribuição com valores de média e desvio padrão mencionados como EST. Esta opção usa e estima os parâmetros.

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

Quando executamos o código acima, obtemos a seguinte saída -