ESTADÍSTICA DESCRIPTIVA

Get Started. It's Free
or sign up with your email address
ESTADÍSTICA DESCRIPTIVA by Mind Map: ESTADÍSTICA DESCRIPTIVA

1. MÈTODE ESTADÍSTIC

1.1. L'Estadística descriptiva, principalment, s'encarrega de resumir/organitzar la informació i de i de proporcionar una breu descripció inicial de les dades.

2. CONCEPTES BÀSICS

2.1. Població

2.1.1. Conjunt d'individus obre el que es fa un estudi estadístic.

2.2. Mostra

2.2.1. Subconjunt de la població d'on prenem les dades per fer el nostre estudi.

2.3. Mida mostral

2.3.1. Nombre d'observacions a la mostra.

2.4. Dada

2.4.1. Cada valor observat de la variable.

2.5. Variable

2.5.1. Característica que estem mesurant.

2.5.1.1. TIPUS DE VARIABLES

2.5.1.1.1. Qualitatives

2.5.1.1.2. Quantitatives

3. FREQÜÈNCIES

3.1. Freqüència absoluta (ni)

3.1.1. Nombre de vegades que es repeteix a la mostra un determinat valor (xi) de la variable.

3.1.1.1. La suma de totess las freqüencies absolutes es igual al tamany mostral (n): Eni=n

3.2. Freqüència relativa (fi)

3.2.1. És la freqüència absoluta dividida pel nombre total de dades, és a dir, pel tamany mostral: fi=ni/n

3.3. Freqüències acumulades (Ni)

3.3.1. Ens diu el nombre de dades que hi ha igual o inferiors a un determinat.

3.3.1.1. Es calcula sumant el nombre de freqüències absolutes que hi ha anteriors a arribar a la que volem calcular.

3.3.1.2. És el resultat de dividir cada freqüència acumulada pel número total de dades: Fi=Ni/n

3.4. Freqüència relativa acumulada (Fi)

4. TAULA DE FREQÜÈNCIES D'UNA VARIABLE

4.1. És la presentació més habitual de les freqüències obtingudes.

5. DISTRIBUCIÓ DE FREQÜÈNCIES MARGINALS

5.1. És com s'anomena a les freqüències de cada variable per separat.

5.1.1. Freqüència absoluta marginal

5.1.1.1. Per la "X" (xi) sería el número de vegades que es repeteix el valor "xi" sense tenir en compte els valors de la "Y", la representem per "ni".

5.1.1.2. Para la "Y" (yj) sería el número de vegades que es repeteix el valor "yj" sense tenir en compte els valors de la "X", la representem per "nj".

5.1.2. Freqüències relatives marginals

5.1.2.1. A partir de les absolutes anteriors i, de la mateixa manera, es construiran aquestes freqüències "fi" i "fj".

6. DISTRIBUCIÓ DE FREQÜÈNCIES CONDICIONADES

6.1. A partir de la distribució de freqüències conjuntes podem definir un altre tipus de distribucions unidimensionals, les distibucions condcionades, les quals s'obtindran en fixar el valor de l'altra variable.

6.1.1. Freqüència absoluta condicionada

6.1.1.1. Per a "X"(xi) atès que "Y" (yj) és el nombre de vegades que es repeteix el valor "xi" tenint en compte només aquells valors en què "Y" (ij); així és "ni" (j) = nij per a tot i= 1, 2, ... k.

6.1.2. Freqüències relatives condicionades

6.1.2.1. Per a "Y" (yj) atès que "X" (xi) és el nombre de vegades que es epeteix el valor "ij" tenint en compte només aquells valors en què "X" (xi); així és "n" (i) j = nij per a tot j= 1, 2,... h.

7. DEPENDÈNCIA ESTADÍSTICA I DIAGRAMA DE DISPERSIÓ

7.1. Dependència estadística

7.1.1. Apareix quan els valors que pren una variable estan relacionats d'alguna manera amb els valors que pren l'altra, tenint com a objectiu principal descobrir la manera en què es relacionen entre elles.

7.1.1.1. Pot ser: quadràtica, exponencial, lineal, funcional, ...

7.1.1.1.1. Problema de regressió

7.1.1.1.2. Problema de correlació

7.2. Diagrama de dispersió

7.2.1. Es fa servir per detectar si hi ha algun tipus de relació de dependència entre dues variables, representant sobre uns eixos de coordenades tots els parells de valors que apareguin en la mostra.

7.2.1.1. Habitualment es representa en l'eix d'abscises (X) la variable independent, i en l'eix de les ordenades (Y) la variable dependent.

8. COVARIANÇA

8.1. Consisteix en el tipus de variació conjunta que pot haver-hi entre dues variables quantitatives al ser analitzades de manera conjunta. Si Oxy>0 -> Dependència lineal positiva, si Oxy Dependència lineal negativa i si Oxy=o -> No hi ha dependència lineal.

8.1.1. Oxy=[(Exi·yi·ni)/n]-^x·^y

8.1.2. Oxy=E(xi-^x)·(yi-^y)/n

9. COEFICIENT DE CORRELACIÓ LINEAL

9.1. La correlació, que es calcula a partir de la covariància, ens diu si hi ha o no dependència de tipus lineal i ens dona informació sobre el grau d'aquesta dependència (si és forta o fluixa). Podem mesurar la correlació entre dues variables quantitativament mitjançant el coeficient de correlació lineal de Pearson r: rxy=Oxy/Ox·Oy, el que sempre ens donarà un nombre entre -1 i 1.

9.1.1. Desviació típica o estàndard de la variable "X"

9.1.1.1. Ox=√[(Exi²·ni)/n]-^x²

9.1.2. Desviació típica o estàndard de la variable "Y"

9.1.2.1. Oy=√[(Eyj²·nj)/n]-^y²

10. DISTRIBUCIONS DE FREQÜÈNCIES AGRUPADES

10.1. En el cas que la variable a estudiar sigui contínua, la variable prendrà molts valors, fent que haguem d'agrupar els diferents valors de la variable en intervals/intervals de classe.

10.1.1. Anomenarem

10.1.1.1. A les fronteres de l'interval: límits inferior (li) i superior de classe (Li)

10.1.1.2. Marca de classe (ci) al punt mitjà de l'interval: ci=(Li+li)/2

10.1.1.3. Recorregut o rang és la diferència entre l'extrem superior i inferior: R=Li-li

10.1.1.4. Al nombre d'observacions d'una classe se'n diu freqüència de classe (ni), si ho dividim pel nombre total d'observacions, s'obté la freqüència relativa de classe (fi), i de la mateixa manera que ho fèiem per a dadesacumulades definiríem (Ni) i (Fi).

11. GRÀFICS

11.1. Histograma

11.1.1. És la representació gràfica equivalent al diagrama de barres per a dades agrupades.

11.2. Diagrama de barres

11.2.1. És la representació gràfica usual per a les variables quantitatives sense agrupar o per a variables qualitatives.

11.3. Polígon de freqüències

11.3.1. És la representació gràfica usual per a les variables quantitatives sense agrupar o per a variables qualitatives.

11.4. Diagrama de sectors

11.4.1. És el més usual en variables qualitatives.

12. PARÀMETRES ESTADÍSTICS DE CENTRALITZACIÓ

12.1. Mitjana Aritmètica

12.1.1. És el quocient entre la suma de totes les dades i el nombre.

12.1.1.1. Dades no agrupades: ^x=Exi/n

12.1.1.2. Dades agrupades: ^x=(Exi·ni)/n

12.2. Mediana

12.2.1. És aquell valor que, en ordenar les observacions de menor a major, ocupa el lloc central.

12.3. Moda

12.3.1. És aquell valor que té més freqüència: el que més es repeteix.

12.4. Quartils

12.4.1. Els quartils d'un conjunt ordenat de dades són els tres punts de tall que divideixen el conjunt de dades en quatre grups de la mateixa mida: primer, segon i tercer quartil.

13. PARÀMETRES ESTADÍSTICS DE DISPERSIÓ

13.1. Rang o Recorregut (R)

13.1.1. És la diferència entre el valor més gran i el valor més petit de la variable.

13.2. Desviacions respecte la mitjana

13.2.1. S'anomena desviació respecte de la mitjana d'una dada "xi" la diferència xi-^x.

13.3. Desviació mitjana respecte la mitjana (Dm)

13.3.1. És la mitjana aritmètica de la sèrie xi-^x, on "xi" són els valors de la distribució i "^x" la seva mitjana: Dm=[E(xi-^x)·ni]/n.

13.4. Variància (s²)

13.4.1. És la mitjana aritmètica de la sèrie (xi-^x)², on "xi" són els valors de la distribució i "^x" la seva mitjana.

13.4.1.1. Per a les distribucions de dades no agrupades: s²=[E(xi-^x)²·ni]/n.

13.4.1.2. Per a les distribucions de dades agrupades en classes, "xi" representa les marques de classe i "ni" el nombre de dades que hi ha a cada classe.

13.5. Desviació típica (s)

13.5.1. És l'arrel quadrada de la variància

13.6. Rang interquartílic

13.6.1. Mesura de la dispersió d'una distribució de valor igual a la diferència entre el tercer quartil i el primer quartil.

13.7. Coeficient de variació (CV)

13.7.1. És el quocient entre la desviació típica i la mitjana aritmètica d'aquesta variable: CV=s/^x.

14. FREQÜÈNCIES CONJUNTES

14.1. Freqüència absoluta conjunta (nij)

14.1.1. Nombre de vegades que es presenta a la mostra el valor "xi" de la variable "X" amb el valor "yj" de la variable "Y".

14.2. Freqüència relativa conjunta (fij)

14.2.1. fij = nij/n

14.3. Taula de doble entrada

14.3.1. És la manera més habitual d’expressar els valors obtinguts en una distribució estadística bidimensional

14.3.1.1. Al marge superior de la taula s’escriuen els resultats d’una de les variables i al marge esquerre, els valors de l’altra variable i, en les caselles de la taula, s’indiquen simultàniament les freqüències absolutes, les freqüències relatives o els percentatges corresponents a les dues variables.

15. LA RECTA DE REGRESSIÓ

15.1. Mitjançant el coeficient de correlació lineal de Pearson (r) es poden fer prediccions de valors possibles d'una variable. Per fer aquestes prediccions, s'ha de calcular una recta de regressió, és a dir s'ha de buscar l'expressió algebraica de la recta que millor s'ajusta a la distribució de punts (núvol de punts).

15.1.1. Y sobre X: y=^y+[(Oxy/O²x)·(x-^x)]

15.1.2. X sobre Y: x=^x+[(Oxy/O²y)·(y-^y)]