1. Distribuição de Frequência
1.1. É uma tabela que mostra classes ou intervalos dos valores com a contagem do número de ocorrências em cada classe ou intervalo, a frequência é o número de ocorrência de dados na classe.
1.2. Classe
1.2.1. Limite superior: maior número possível
1.2.2. Limite inferior: menor número possível
1.2.3. Amplitude: distância entre os limites superiores e inferiores
1.3. Características adicionais
1.3.1. Ponto médio: soma dos limites superiores e inferiores da classe, dividido por dois
1.3.2. Frequência relativa: é a frequência dividido pelo tamanho da amostra
1.3.3. Frequência acumulada: soma das frequências dessa classe com todas as anteriores
1.4. Gráficos
1.4.1. Histograma de Frequência
1.4.1.1. é um diagrama de barras que representa a distribuição de frequência de um conjunto de dados
1.4.1.2. Barras consecutivas devem estar encostadas umas nas outras, e para isso devemos considerar as fronteiras de classes que são números que as separam visando a não formação de lacunas
1.4.1.3. Podemos também criar um histograma de frequência relativa, que possui a mesma forma mas utiliza dados da frequência relativa
1.4.2. Polígono de Frequência
1.4.2.1. é um gráfico de linha que mostra as mudanças contínuas na frequência
1.4.3. Ogiva
1.4.3.1. é um gráfico de linhas que mostra a frequência acumulada até cada classe em sua fronteira superior
2. Gráficos e representações
2.1. Conjunto de dados quantitativos
2.1.1. Diagrama de ramo e folha
2.1.1.1. é um recurso de análise exploratória de dados
2.1.1.2. é similar a um histograma, mas tem a vantagem de que o gráfico ainda mantem os valores originais dos dados
2.1.1.3. fornece um modo fácil de ordenar dados
2.1.2. Diagrama de pontos
2.1.2.1. nele cada valor é representado usando um ponto acima do eixo horizontal
2.1.2.2. permite ver a representação de cada dado
2.2. Conjunto de dados qualitativos
2.2.1. Gráfico de pizza
2.2.1.1. é um círculo dividido em setores que representam cada categoria de acordo com a frequência de cada uma
2.2.1.2. é um círculo dividido em setores que representam cada categoria de acordo com a frequência de cada uma
2.2.2. Gráfico de pareto
2.2.2.1. é um gráfico de barras verticais, na qual a altura de cada barra representa a frequência ou frequência relativa
2.3. Conjunto de dados emparelhados
2.3.1. Gráfico de dispersão
2.3.1.1. nele os pares ordenados são representados como pontos em um plano coordenado
2.3.1.2. nele os pares ordenados são representados como pontos
2.3.2. Gráfico de series temporais
2.3.2.1. Quando os dados são observados/analisados em um certo período de tempo
2.3.3. Gráfico de series temporais
3. Medidas de tendência central
3.1. Média
3.1.1. é a soma dos valores dos dados, dividida pelo número de observações.
3.1.2. Pode ser muito afetada por valores discrepantes no conjunto. O que causa lacunas na distribuição.
3.2. Mediana
3.2.1. é o valor que está no meio do conjunto de dados quando ele está ordenado, quando o número de dados for par a mediana é a soma dos valores centrais dividido por dois.
3.3. Moda
3.3.1. é o valor que ocorre com mais frequência, quando nenhum valor se repete o conjunto não tem moda, quando dois valores tem a mesma frequência o conjunto é bimodal.
3.4. Média ponderada
3.4.1. é a média de um conjunto no qual os dados tem pesos diferentes na análise
3.5. Formas da distribuição
3.5.1. Simétrica
3.5.1.1. Quando uma linha vertical desenhada no centro do gráfico, o divide em duas partes iguais
3.5.2. Uniforme
3.5.2.1. Quando todos os valores ou classes tem frequências iguais ou bem próximas
3.5.3. Assimétrica
3.5.3.1. Quando a cauda do gráfico se alonga para esquerda ou para direita.
3.5.3.2. a média sempre cairá na direção na qual a distribuição for assimétrica
4. Medidas de variação
4.1. Amplitude
4.1.1. é a diferença entre os valores máximo e mínimo
4.2. Desvio
4.2.1. é a diferença entre o valor e a média do conjunto de dados
4.3. Variância
4.3.1. indica o quão longe em geral os seus valores estão de um certo "valor esperado"
4.4. Desvio padrão
4.4.1. mede a variação dos dados em relação a média, é dado pela raiz quadrada da variância
4.4.2. Quanto mais espalhados estiverem os valores, maior será o desvio padrão
4.4.3. Pode ser calculado tanto para toda população, quanto para apenas uma amostra.
4.5. Coeficiente de variação
4.5.1. descreve o desvio padrão como uma percentagem da média, usada para conjunto de dados com unidades de medida ou médias distintas.
5. Medidas de posição
5.1. Separatrizes
5.1.1. São números que dividem um conjunto de dados ordenados em porções iguais
5.1.2. Quartis
5.1.2.1. Dividem um conjunto de dados ordenados em quatro partes iguais
5.1.2.2. Amplitude interquartil: é uma medida de variação que fornece a amplitude da porção central dos dados
5.1.2.3. Com eles podemos interpretar um conjunto de dados usando um boxplot, que é uma ferramenta de análise exploratória de características relevantes em um conjunto
5.1.3. Decis
5.1.3.1. Dividem um conjunto de dados ordenados em dez partes iguais
5.1.4. Percentis
5.1.4.1. Dividem um conjunto de dados ordenados em cem partes iguais
5.2. Escore Padrão
5.2.1. representa o número de desvios padrão em que um valor se encontra a partir da média, mede a posição de um elemento no conjunto