Anonim

Teorija koja stoji iza p- vrijednosti i nultu hipotezu u početku se može činiti kompliciranom, ali razumijevanje koncepata pomoći će vam da se krećete po svijetu statistike. Nažalost, ti se pojmovi često zloupotrijebe u popularnoj znanosti, pa bi bilo korisno da svi razumiju osnove.

Također pogledajte naš članak Kako izbrisati svaki drugi redak u Excelu

Izračunavanje p- vrijednosti modela i dokazivanje / pobijanje nulte hipoteze iznenađujuće je jednostavno s MS Excel-om. Postoje dva načina za to i oba ćemo pokriti. Idemo kopati.

Nulta hipoteza i p-vrijednost

Nulta hipoteza je izjava, koja se naziva i zadanom pozicijom, koja tvrdi da odnos između promatranih pojava ne postoji. Može se primijeniti i na asocijacije između dvije promatrane skupine. Tijekom istraživanja testirate ovu hipotezu i pokušavate je opovrgnuti.

Na primjer, recimo da želite primijetiti ima li određena hranljiva dijeta značajne rezultate. Nužna hipoteza u ovom slučaju je da nema značajne razlike u težini ispitanika prije i nakon dijeta. Alternativna hipoteza je da je dijeta napravila promjenu. To bi istraživači pokušali dokazati.

P- vrijednost predstavlja šansu da bi statistički sažetak bio jednak ili veći od promatrane vrijednosti kada je nultova hipoteza istinita za određeni statistički model. Iako se često izražava kao decimalni broj, općenito je bolje izraziti ga kao postotak. Na primjer, p- vrijednost od 0, 1 treba biti predstavljena kao 10%.

Niska vrijednost p znači da su dokazi protiv ništavne hipoteze snažni. To nadalje znači da su vaši podaci značajni. S druge strane, visoka p- vrijednost znači da nema čvrstih dokaza protiv te hipoteze. Da bi dokazali da dječja dijeta djeluje, istraživači bi trebali pronaći nisku p- vrijednost.

Statistički značajan rezultat je onaj koji se vrlo vjerojatno neće dogoditi ako je nulta hipoteza istinita. Razina značajnosti označava se grčkim slovom alfa i mora biti veća od p- vrijednosti kako bi rezultat bio statistički značajan.

Mnogi istraživači u širokom rasponu polja koriste p- vrijednost kako bi dobili bolji i dublji uvid u podatke s kojima rade. Neka od istaknutih područja uključuju sociologiju, kazneno pravosuđe, psihologiju, financije i ekonomiju.

Pronalaženje p -Value u Excelu

Možete pronaći p- vrijednost skupa podataka u MS Excelu putem T-Test funkcije ili pomoću alata za analizu podataka. Prvo ćemo razmotriti funkciju T-testa. Ispitat ćemo pet studenata koji su prešli na 30-dnevnu dijetu. Usporedit ćemo njihovu težinu prije i nakon dijeta.

NAPOMENA: Za potrebe ovog članka koristit ćemo MS Excel 2010. Iako nisu najnoviji, koraci bi se općenito trebali primjenjivati ​​i na novije verzije.

Funkcija T-testa

Slijedite ove korake za izračun p- vrijednosti s funkcijom T-Test.

  1. Stvorite i popunite tablicu. Naša tablica izgleda ovako:

  2. Kliknite bilo koju ćeliju izvan stola.
  3. Upišite: = T.Test (.
  4. Nakon otvorenog zagrade unesite prvi argument. U ovom primjeru to je stupac Prije prehrane. Raspon treba biti B2: B6. Zasad funkcija izgleda ovako: T.Test (B2: B6.
  5. Zatim ćemo unijeti drugi argument. Stupac After Diet i njegovi rezultati su naš drugi argument i raspon koji nam treba je C2: C6. Dodajmo ga u formulu: T.Test (B2: B6, C2: C6.
  6. Nakon drugog argumenta upišite zarez, a opcije raspodjele s jednim repom i dvostrana distribucija automatski će se pojaviti na padajućem izborniku. Odaberemo prvu - jednosmjernu distribuciju. Dvaput kliknite na nju.
  7. Unesite drugi zarez.
  8. Dvaput kliknite na opciju Paired u sljedećem padajućem izborniku.
  9. Sada kada imate sve potrebne elemente, zatvorite nosač. Formula za ovaj primjer izgleda ovako: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Pritisni enter. Ćelija će odmah prikazati p- vrijednost. U našem slučaju vrijednost je 0, 133906 ili 13, 3906%.

Budući da je viši od 5%, ovaj p- vrijednost ne daje čvrste dokaze protiv ništavne hipoteze. U našem primjeru, istraživanje nije dokazalo da je dijeta pomogla ispitanicima da izgube značajnu količinu kilograma. To ne mora nužno značiti da je nulta hipoteza tačna, samo što još nije opovrgnuta.

Ruta za analizu podataka

Alat za analizu podataka omogućuje vam mnogo dobrih stvari, uključujući izračun p- vrijednosti. Da pojednostavimo stvari, upotrijebit ćemo istu tablicu kao u prethodnoj metodi.

Evo kako se to radi.

  1. Budući da već imamo razlike u težini u stupcu D, preskočit ćemo izračun razlike. Za buduće tablice koristite ovu formulu: = "Ćelija 1" - "Ćelija 2".
  2. Zatim kliknite karticu Podaci u glavnom izborniku.
  3. Odaberite alat za analizu podataka.
  4. Pomaknite se prema dolje po popisu i kliknite na opciju t-Test: Upareni dva uzorka za sredstvo.
  5. Kliknite U redu.
  6. Pojavit će se skočni prozor. To izgleda ovako:

  7. Unesite prvi raspon / argument. U našem primjeru to je B2: B6.
  8. Unesite drugi raspon / argument. U ovom slučaju to je C2: C6.
  9. Ostavite zadanu vrijednost u Alfa tekstnom polju (to je 0, 05).
  10. Kliknite radio gumb Izlazni raspon i odaberite mjesto gdje želite rezultat. Ako se radi o ćeliji A8, upišite: $ A $ 8.
  11. Kliknite U redu.
  12. Excel će izračunati p- vrijednost i nekoliko drugih parametara. Završni stol može izgledati ovako:

Kao što vidite, p- vrijednost s jednim repom jednaka je kao u prvom slučaju - 0, 133905569. Budući da je iznad 0, 05, za ovu tablicu vrijedi ništavna hipoteza, a dokazi protiv nje su slabi.

Stvari koje treba znati o p-vrijednosti

Evo nekoliko korisnih savjeta u vezi s izračunom p- vrijednosti u Excelu.

  1. Ako je p- vrijednost jednaka 0, 05 (5%), podaci u vašoj tablici su značajni. Ako je manji od 0, 05 (5%), vaši podaci su vrlo značajni.
  2. U slučaju da je p- vrijednost veća od 0, 1 (10%), podaci u vašoj tablici su beznačajni. Ako je u rasponu 0, 05-0, 10, imate malo značajne podatke.
  3. Možete promijeniti alfa vrijednost, iako su najčešće opcije 0, 05 (5%) i 0, 10 (10%).
  4. Odabir testiranja s dva rebra može biti bolji izbor, ovisno o vašoj hipotezi. U gornjem primjeru, testiranje s jednim repom znači da istražujemo jesu li ispitanici smršali nakon dijeta, a to je upravo ono što smo trebali saznati. No dvostruki test također bi ispitao dobivaju li statistički značajne količine.
  5. Značaj p ne može identificirati varijable. Drugim riječima, ako identificira povezanost, ne može utvrditi uzroke koji stoje iza toga.

P -Value Demistificirana

Svaki statističar koji vrijedi svoju sol mora znati uvida i nedostatke ispitivanja ništavnih hipoteza i šta p- vrijednost znači. To će znanje također dobro doći istraživačima na mnogim drugim poljima.

Jeste li ikada koristili Excel za izračun p- vrijednosti statističkog modela? Koju ste metodu koristili? Da li više volite neki drugi način izračuna? Javite nam se u odjeljku s komentarima.

Kako izračunati p-vrijednost u excelu