Vad är Covariance?
Mätningen av förhållandet mellan de två slumpmässiga variablerna kallas kovarians. Som namnet antyder berättar kovariansen för de två variablerna hur den ena variabeln varierar när den andra variabeln ändras. Kovarians definierar inte beroende av en variabel på en annan. Det finns två typer av kovariansberäkningar. Först är befolkningens kovarians och den andra är provets kovarians. I denna artikel kommer vi att lära oss hur man beräknar kovariansen för befolkningen i excel.
Kovariansvärdet kan vara ett negativt eller positivt värde. Ett negativt värde innebär att båda variablerna rör sig i motsatt riktning. Och du gissade rätt, en positiv kovarians innebär att de två variablerna rör sig i samma riktning.
Det kan låta som en korrelationskoefficient men det är annorlunda. Vi kommer att prata om det i slutändan.
Hur hittar man kovarians av befolkningen i Excel?
Excel ger en funktion COVARIANCE.P för att enkelt beräkna kovarians av data. Den introducerades i Excel 2010 och sedan den versionen används den i stor utsträckning. Jag använder den i Excel 2016. Det finns en annan version av denna metod som heter COVARIANCE.S. Den används för att beräkna kovariansen för samplingsdatauppsättningen. En annan metod är att använda analysverktygspaket för att beräkna kovariansen för befolkningen i excel.
Syntaxen för COVARIANCE.P:
= COVARIANCE.P (array1, array2) |
Array1:Värdena för den första variabeln.
Array2:Värdena för den andra variabeln.
Notera:Dessa matriser kan läggas i valfri ordning. Längden på de två matriserna bör vara densamma. Om de två matriserna har två olika längder visar excel #N/A -fel.
Nu när vi vet om kovariansen, låt oss få ett exempel för att göra saker ännu tydligare.
Exempel: Beräkna befolkningens kovarians i Excel
Här har jag en provdatauppsättning. I intervall A2: A7 har jag en variabel X och i intervallet B2: B7 en annan variabel Y. Förutsatt att detta är data för den totala befolkningen. Låt oss nu beräkna kovarianserna för dessa data och se hur dessa två variabler påverkar varandra.
Låt oss använda Excel COVARAINCE.P -funktionen:
= COVARIANCE.P (A2: A7, B2: B7) |
Detta returnerar ett värde på 5.444444444.
Tolkning av Covariance
Kovariansvärdet vi fick är ett positivt värde. Den berättar att X och Y rör sig i samma riktning. Med andra ord kommer Y att öka om X ökar och vice versa. Om kovarians var ett negativt värde skulle motsatsen vara sant.
Hur beräknas COVARIANCE.P?
Den matematiska formeln för att beräkna befolkningens kovarians är som följer:
Här Xiär vilket värde som helst i variabel X där X bar är provmedelvärde för variabel X.
Yi är vilket värde som helst i variabel Y där Y -stapeln är medelvärdet för variabeln Y.
n är antalet observationer.
Om du försöker beräkna kovariansen för befolkningen i excel manuellt är det så här du skulle göra.
- Beräkna först det aritmetiska medelvärdet för X- och Y -variablerna i cellen. Du kan använda AVERAGE -funktionen.
= MEDEL (A4: A9) - Subtrahera medelvärdet av X från varje värde på X. Gör samma sak för Y.
= A4- $ A $ 13 - Nu flera X-medelvärde X och Y-medelvärde Y-intervall. Se bilden ovan.
= D4*C4 - Nu summerar du värdena som erhålls genom multiplikation.
= SUMMA (E4: E9) - Slutligen dela den erhållna summan med ett antal observationer. I vårt fall är det 6.
= E10/COUNT (A4: A9)
Numret vi får är 5.444444444 vilket är exakt samma som det vi fick från Excel COVARIANCE.P -funktionen.
Skillnaden i kovarians och korrelationskoefficient
Den första och stora skillnaden är formeln. Korrelationskoefficienten beräknas genom att dividera kovarians med produkten av standardavvikelsen för Xs och Ys.
Kovariansen berättar riktningen för två slumpmässiga variabler, oavsett om de rör sig i samma riktning eller olika. Det berättar inte styrkan i sambandet mellan två variabler. Där korrelation visar styrkan i förhållandet mellan två variabler i intervallet -100% till 100%.
Så ja killar, så här använder du COVARIANCE.P i Excel. I den här artikeln lärde vi oss inte bara om COVARIANCE.P -funktionen utan vi lärde oss också hur vi beräknar det manuellt och hur vi härleder det. Jag hoppas att jag var tillräckligt förklarande. Om du har några tvivel om denna statiska funktion eller någon annan statisk Excel -funktion, kommentera den i kommentarsfältet nedan.
Hur man hittar korrelationskoefficient i Excel
Beräkna INTERCEPT i Excel
Beräknar SLOPE i Excel
Hur man använder Excel NORMDIST -funktion
Regressioner i excel 2010
Pareto -diagram och analys
Populära artiklar:
50 Excel -genväg för att öka din produktivitet
VLOOKUP -funktionen i Excel
COUNTIF i Excel 2016
Hur man använder SUMIF -funktionen i Excel