Anonim

Теорията зад p- стойностите и нулевата хипотеза може да изглежда сложна в началото, но разбирането на концепциите ще ви помогне да се ориентирате в света на статистиката. За съжаление, тези термини често се злоупотребяват в популярната наука, така че би било полезно всички да разберат основите.

Вижте и нашата статия Как да изтриете всеки друг ред в Excel

Изчисляването на p- стойността на даден модел и доказване / опровержение на нулевата хипотеза е изненадващо просто с MS Excel. Има два начина да го направите и ще обхванем и двете. Нека копаем.

Нулева хипотеза и p -Value

Нулевата хипотеза е изявление, наричано също като позиция по подразбиране, което твърди, че връзката между наблюдаваните явления не съществува. Може да се прилага и за асоциации между две наблюдавани групи. По време на изследването тествате тази хипотеза и се опитвате да я опровергаете.

Например, кажете, че искате да наблюдавате дали определена диета за прищявка има значителни резултати. Нулевата хипотеза в този случай е, че няма съществена разлика в теглото на изпитваните преди и след диета. Алтернативната хипотеза е, че диетата наистина е променила. Това биха се опитали да докажат изследователите.

P- стойността представлява вероятността статистическото обобщение да бъде равно или по-голямо от наблюдаваната стойност, когато нулевата хипотеза е вярна за определен статистически модел. Въпреки че често се изразява като десетично число, обикновено е по-добре да се изрази като процент. Например, p- стойност от 0, 1 трябва да бъде представена като 10%.

Ниска р- стойност означава, че доказателствата срещу нулевата хипотеза са силни. Това допълнително означава, че вашите данни са значителни. От друга страна, високата стойност на p означава, че няма категорични доказателства срещу хипотезата. За да докажат, че диетата за прищявка работи, изследователите ще трябва да намерят ниска р- стойност.

Статистически значим резултат е този, който е малко вероятно да се случи, ако нулевата хипотеза е вярна. Нивото на значимост се обозначава с гръцката буква алфа и трябва да бъде по-голямо от p- стойността, за да бъде статистически значим резултатът.

Много изследователи в широк спектър от области използват р- стойността, за да получат по-добър и задълбочен поглед върху данните, с които работят. Някои от изтъкнатите области включват социология, наказателно правосъдие, психология, финанси и икономика.

Намиране на p -Value в Excel

Можете да намерите p- стойността на набор от данни в MS Excel чрез функцията T-Test или с помощта на инструмента за анализ на данни. Първо ще разгледаме функцията T-Test. Ще разгледаме петима студенти, които са преминали на 30-дневна диета. Ще сравним теглото им преди и след диетата.

ЗАБЕЛЕЖКА: За целите на тази статия ще използваме MS Excel 2010. Въпреки че не е най-новата, стъпките обикновено трябва да се прилагат и за по-новите версии.

Функция на Т-тест

Следвайте тези стъпки, за да изчислите p- стойността с функцията T-Test.

  1. Създайте и попълнете таблицата. Нашата таблица изглежда така:

  2. Кликнете върху всяка клетка извън вашата маса.
  3. Въведете: = T.Test (.
  4. След отворената скоба въведете първия аргумент. В този пример това е графата преди диета. Диапазонът трябва да бъде B2: B6. Засега функцията изглежда така: T.Test (B2: B6).
  5. След това ще въведем втория аргумент. Графата след диета и нейните резултати са вторият ни аргумент и диапазонът, от който се нуждаем, е C2: C6. Нека го добавим към формулата: T.Test (B2: B6, C2: C6.
  6. Въведете запетая след втория аргумент, а опциите за дистрибуция с едно опашка и двустранни разпределения автоматично ще се покажат в падащо меню. Нека изберем първото - еднократно разпределение. Кликнете два пъти върху него.
  7. Въведете друга запетая.
  8. Щракнете двукратно върху опцията Paired в следващото падащо меню.
  9. Сега, когато имате всички необходими елементи, затворете скобата. Формулата за този пример изглежда така: = T.Test (B2: B6, C2: C6, 1, 1)

  10. Натиснете Enter. Клетката ще покаже p- стойността веднага. В нашия случай стойността е 0, 133906 или 13, 3906%.

Като е по-висок от 5%, тази p- стойност не дава категорични доказателства срещу нулевата хипотеза. В нашия пример, изследването не доказа, че диетата е помогнала на изпитваните да загубят значително количество тегло. Това не означава непременно нулевата хипотеза да е правилна, само че тя все още не е опровергана.

Маршрут за анализ на данните

Инструментът за анализ на данни ви позволява да правите много готини неща, включително изчисления на p- стойност. За да опростим нещата, ще използваме същата таблица, както в предишния метод.

Ето как се прави.

  1. Тъй като вече имаме разликите в теглото в колоната D, ще пропуснем изчислението на разликата. За бъдещите таблици използвайте тази формула: = “Cell 1” - “Cell 2”.
  2. След това щракнете върху раздела Данни в Главното меню.
  3. Изберете инструмента за анализ на данни.
  4. Превъртете надолу в списъка и щракнете върху опцията t-Test: Сдвоена две проби за средства.
  5. Щракнете върху OK.
  6. Ще се появи изскачащ прозорец. Изглежда така:

  7. Въведете първия диапазон / аргумент. В нашия пример това е B2: B6.
  8. Въведете втория диапазон / аргумент. В този случай това е C2: C6.
  9. Оставете стойността по подразбиране в текстовото поле на Alpha (това е 0, 05).
  10. Кликнете върху радио бутона Бутон за изход и изберете къде искате резултата. Ако това е клетка A8, въведете: $ A $ 8.
  11. Щракнете върху OK.
  12. Excel ще изчисли p- стойност и няколко други параметри. Финалната маса може да изглежда така:

Както виждате, p- стойността с една опашка е същата като в първия случай - 0, 133905569. Тъй като тя е над 0, 05, нулевата хипотеза се прилага за тази таблица, а доказателствата срещу нея са слаби.

Неща, които трябва да знаете за p -Value

Ето няколко полезни съвета относно изчисленията на p- стойност в Excel.

  1. Ако р- стойността е равна на 0, 05 (5%), данните в таблицата ви са значителни. Ако е по-малко от 0, 05 (5%), данните, които имате, са много значими.
  2. В случай, че p- стойността е повече от 0, 1 (10%), данните в таблицата ви са незначителни. Ако е в обхвата 0.05-0.10, имате незначително значими данни.
  3. Можете да промените алфа стойността, въпреки че най-често срещаните опции са 0, 05 (5%) и 0, 10 (10%).
  4. Изборът на тестване с две опашки може да бъде по-добрият избор, в зависимост от вашата хипотеза. В горния пример еднократно тестване означава да изследваме дали тестваните лица са отслабнали след диета и точно това трябваше да разберем. Но тест с две опашки също ще проучи дали те са получили статистически значими количества.
  5. P- стойност не може да идентифицира променливи. С други думи, ако идентифицира корелация, тя не може да идентифицира причините, които стоят зад нея.

Демистифицираният p -Value

Всеки статистик, който си струва неговата сол, трябва да знае входовете и изходите на теста за нулева хипотеза и какво означава p- стойност. Тези знания също ще бъдат полезни за изследователите в много други области.

Използвали ли сте някога Excel за изчисляване на p- стойността на статистически модел? Кой метод сте използвали? Предпочитате ли друг начин да го изчислите? Уведомете ни в секцията за коментари.

Как да изчислим p-стойност в excel