Hur man räknar ut kvartilavstånd
Kvartiler samt lådagram
I detta förra avsnittet angående lägesmått använde oss oss från en modell tillsammans med enstaka släktmiddag liksom familjen Mattecentrum anordnade.
Räkna ut kvartilerÅldrarna vid dem närvarande personerna nära släktmiddagen var
$$1,\, 4,\, 3,\, 15,\, 72,\, 41,\, 30,\, 27,\, 72,\, 8,\, 42,\, 36,\, 33,\, 46,\, 44$$
En individ likt ej plats tillsammans med vid släktmiddagen fanns Mattias, likt istället plats vid kvällsmål tillsammans med en antal vänner. Åldern vid dem 15 personer liksom plats tillsammans med nära Mattias kvällsmål plats likt följer:
$$30,\, 31,\, 33,\, 34,\, 35,\, 34,\, 28,\, 34,\, 33,\, 34,\, 36,\, 35,\, 32,\, 31,\, 32$$
Vi jämför lägesmåtten vilket gäller åldern vid personerna inom dessa båda grupper.
Då ser oss för att medelvärdet samt medianen till släktmiddagen är
$$medel=31,6 \,år$$
$$median=33 \,år$$
För personerna såsom deltog nära kompismiddagen blir lägesmåtten följande:
$$medel=32,8\,år$$
$$median=33\,år$$
Tittar oss bara vid dessa lägesmått därför ser detta ej ut liksom för att detta fanns sålunda massiv skillnad mellan åldrarna nära dem numeriskt värde tillställningarna, utom möjligtvis för att gruppen vilket närvarade nära kompismiddagen verkar aningen äldre angående man jämför medelvärdena.
oss likt dock äger sett åldrarna liksom förekommer inom dem numeriskt värde grupperna vet för att detta existerar massiv skillnad vid spridningen från åldrarna mellan dem numeriskt värde grupperna - nära släktmiddagen existerar spridningen massiv, medan spridningen nära kompismiddagen existerar mindre.
För för att behärska jämföra numeriskt värde alternativt flera serier från observationsvärden äger man därför infört olika mått för hur något sprids.
Genom dessa förmå man ett fåtal enstaka mer rättvisande foto från hur olika serier från värden ser ut samt hur massiv spridningen existerar inom dem olika serierna.
Exempel: nio tal 3, 8, 8, 5, 16, 1, 0, 7, 7inom detta denna plats avsnittet bör oss därför vandra igenom begreppen variationsbredd, kvartiler samt lådagram, på grund av för att inom nästa del titta närmare vid standardavvikelse vilket en mått vid hur många värden avviker ifrån medelvärdet inom ett serie.
Variationsbredd
Ett enkelt mått vid spridning inom enstaka serie observationsvärden existerar variationsbredd, vilket definieras såsom skillnaden (differensen) mellan detta största samt detta minsta observationsvärdet inom serien.
I vårt modell tillsammans släktmiddagen får oss variationsbredden vad gäller ålder genom för att subtrahera den högsta förekommande åldern (72 år) samt den lägsta (1 år)
Det önskar säga
$$72-1=71\, år$$
På identisk sätt kalkylerar oss variationsbredden vad gäller ålder nära kompismiddagen, var den högsta åldern plats 36 tid samt den lägsta 28 kalenderår.
oss får inom detta fall variationsbredden
$$36-28=8\, år$$
Som oss ser således får oss väldigt olika värden vid variationsbredden inom dem båda grupperna, vilket ju beror vid för att åldersspridningen existerar många större nära släktmiddagen än nära kompismiddagen.
Variationsbredden existerar alltså många lätt för att räkna ut, dock detta mått äger nackdelen för att detta ej tar hänsyn mot samtliga observationsvärdena, utan enbart detta största samt detta minsta värdet.
på grund av för att ett fåtal ett förbättrad foto från spridningen använder man därför även andra spridningsmått.
Kvartiler
Ett förbättrad sätt för att förklara spridningen runt medianen existerar för att dela in observationsvärdena inom kvartiler. Kvartil betyder fjärdedel samt dessa kvartiler kommer oss fram mot genom för att dela in våra storlekssorterade observationsvärden inom fyra lika stora grupper.
Det finns fem viktiga värden för att hålla koll vid då oss bör dela in våra observationsvärden inom kvartiler:
Det högsta värdet samt detta lägsta värdet, likt existerar dem maximalt extrema observationsvärdena oss besitter åt vardera hållet inom följd.
Ofta betecknar man den nedre kvartilen som Q 1, medianen som Q 2 och den övre kvartilen som Q 3Dessa motsvarar alltså detta största samt detta minsta värdet liksom oss använde då oss räknade ut variationsbredden tidigare inom avsnittet.
Vi behöver även uppleva mot medianen, såsom ju delar våra storlekssorterade observationsvärden inom numeriskt värde lika stora delar.
De numeriskt värde sista värdena såsom oss måste ta reda vid existerar den nedre kvartilen, vilket delar dem lägre 50 % från värdena inom numeriskt värde lika stora delar, samt den övre kvartilen, såsom delar upp dem högre 50 % från värdena inom numeriskt värde lika stora delar.
Detta innebär för att 25 % från våra observationsvärden kommer för att existera mindre än den nedre kvartilen samt 75 % från observationsvärdena kommer för att existera mindre än den övre kvartilen.
Ofta betecknar man den nedre kvartilen såsom Q1, medianen såsom Q2 samt den övre kvartilen såsom Q3.
Vi visar hur dessa viktiga värden förhåller sig mot observationsvärdena inom figuren nedan.
När oss för tillfället äger gått igenom definitionerna från dessa term är kapabel oss beräkna dessa fem värden på grund av våra numeriskt värde middagssällskap
Skillnaden mellan den övre samt den nedre kvartilen kallas till kvartilavståndet.
Detta motsvarar variationsbredden till dem 50 % från värdena likt befinner sig inom mitten från följd från observationsvärden. på det sättet existerar kvartilavståndet en mått vid hur massiv spridningen existerar inom närheten från medianen.
Kvartilavståndet på grund av deltagarnas ålder nära släktmiddagen får oss genom denna definition till
$$44-8= 36\, kalenderår $$
På motsvarande sätt kalkylerar oss kvartilavståndet på grund av deltagarnas ålder nära kompismiddagen till
$$34-31=3\, år$$
Lådagram
Med hjälp från dem term rörande kvartiler såsom oss besitter introducerat ovan förmå oss åskådliggöra spridningen runt medianen tillsammans med hjälp från lådagram.
Ett lådagram ritas vid enstaka tallinje samt består från enstaka behållare (rektangel) vars vänstra respektive högra blad befinner sig nära den nedre respektive den övre kvartilen.
Observationsvärdenas medianvärde existerar även markerat tillsammans ett vertikal linje inuti lådagrammet. ifrån lådans respektive sidor sträcker sig ett vågrät linje ut mot detta största respektive lägsta observationsvärdet inom serien.
Nedan äger oss ritat en lådagram på grund av värden inom intervallet 1 (lägsta värdet) mot samt tillsammans med 21 (högsta värdet).
För att beskriva spridningen i variabeln kan man till exempel beräkna kvartiler som delar in populationen i fyra lika stora grupper med hjälp av tre värdeninom detta modell existerar medianen 11, nedre kvartilen 6 samt övre kvartilen 16.
På motsvarande sätt är kapabel oss presentera observationsvärdena ifrån vår granskning från åldern vid deltagarna nära släktmiddagen respektive kompismiddagen tillsammans med hjälp från nästa numeriskt värde lådagram:
Nu förmå oss klart titta för att även ifall deltagarna nära dem båda middagarna ägde identisk medianålder (33 år) sålunda existerar detta massiv skillnad inom spridningen från åldrar.
Percentiler
På motsvarande sätt vilket man kunna dela upp observationsvärden inom fjärdedelar (kvartiler) kunna man även dela upp stora serier från observationsvärden inom hundradelar.
fullfölja man ett uppdelning inom hundradelar benämner man dessa hundradelar likt percentiler.
Specifika percentiler benämner man vid en liknande sätt såsom kvartiler. mot modell motsvarar den nedre kvartilen, Q1, den 25:e percentilen, liksom oss betecknar P25 (alltså för att 25 % från observationsvärdena bör artikel mindre än detta värde). vid motsvarande sätt kunna man beteckna medianen vilket P50 samt övre kvartilen liksom P75.
Eftersom vårt observationsmaterial ifrån dem båda middagarna existerar således resehandling litet (15 observationsvärden inom vardera fallet) existerar detta mer lämpligt för att nyttja sig från kvartiler än percentiler.
ägde oss haft ett serie bestående från en större antal observationsvärden, mot modell angående man gjorde ett analys från åldern bland tusen människor, då ägde användning från percentiler kunnat artikel mer användbar.
I nästa segment bör oss gå vidare för att undersöka hur man kunna ange spridningen inom serier från observationsvärden, genom användning från måttet standardavvikelse.