Теорията зад p- стойностите и нулевата хипотеза може да изглежда сложна в началото, но разбирането на концепциите ще ви помогне да се ориентирате в света на статистиката. За съжаление, тези термини често се злоупотребяват в популярната наука, така че би било полезно всички да разберат основите.
Вижте и нашата статия Как да изтриете всеки друг ред в Excel
Изчисляването на p- стойността на даден модел и доказване / опровержение на нулевата хипотеза е изненадващо просто с MS Excel. Има два начина да го направите и ще обхванем и двете. Нека копаем.
Нулева хипотеза и p -Value
Нулевата хипотеза е изявление, наричано също като позиция по подразбиране, което твърди, че връзката между наблюдаваните явления не съществува. Може да се прилага и за асоциации между две наблюдавани групи. По време на изследването тествате тази хипотеза и се опитвате да я опровергаете.
Например, кажете, че искате да наблюдавате дали определена диета за прищявка има значителни резултати. Нулевата хипотеза в този случай е, че няма съществена разлика в теглото на изпитваните преди и след диета. Алтернативната хипотеза е, че диетата наистина е променила. Това биха се опитали да докажат изследователите.
P- стойността представлява вероятността статистическото обобщение да бъде равно или по-голямо от наблюдаваната стойност, когато нулевата хипотеза е вярна за определен статистически модел. Въпреки че често се изразява като десетично число, обикновено е по-добре да се изрази като процент. Например, p- стойност от 0, 1 трябва да бъде представена като 10%.
Ниска р- стойност означава, че доказателствата срещу нулевата хипотеза са силни. Това допълнително означава, че вашите данни са значителни. От друга страна, високата стойност на p означава, че няма категорични доказателства срещу хипотезата. За да докажат, че диетата за прищявка работи, изследователите ще трябва да намерят ниска р- стойност.
Статистически значим резултат е този, който е малко вероятно да се случи, ако нулевата хипотеза е вярна. Нивото на значимост се обозначава с гръцката буква алфа и трябва да бъде по-голямо от p- стойността, за да бъде статистически значим резултатът.
Много изследователи в широк спектър от области използват р- стойността, за да получат по-добър и задълбочен поглед върху данните, с които работят. Някои от изтъкнатите области включват социология, наказателно правосъдие, психология, финанси и икономика.
Намиране на p -Value в Excel
Можете да намерите p- стойността на набор от данни в MS Excel чрез функцията T-Test или с помощта на инструмента за анализ на данни. Първо ще разгледаме функцията T-Test. Ще разгледаме петима студенти, които са преминали на 30-дневна диета. Ще сравним теглото им преди и след диетата.
ЗАБЕЛЕЖКА: За целите на тази статия ще използваме MS Excel 2010. Въпреки че не е най-новата, стъпките обикновено трябва да се прилагат и за по-новите версии.
Функция на Т-тест
Следвайте тези стъпки, за да изчислите p- стойността с функцията T-Test.
- Създайте и попълнете таблицата. Нашата таблица изглежда така:

- Кликнете върху всяка клетка извън вашата маса.
- Въведете: = T.Test (.
- След отворената скоба въведете първия аргумент. В този пример това е графата преди диета. Диапазонът трябва да бъде B2: B6. Засега функцията изглежда така: T.Test (B2: B6).
- След това ще въведем втория аргумент. Графата след диета и нейните резултати са вторият ни аргумент и диапазонът, от който се нуждаем, е C2: C6. Нека го добавим към формулата: T.Test (B2: B6, C2: C6.
- Въведете запетая след втория аргумент, а опциите за дистрибуция с едно опашка и двустранни разпределения автоматично ще се покажат в падащо меню. Нека изберем първото - еднократно разпределение. Кликнете два пъти върху него.
- Въведете друга запетая.
- Щракнете двукратно върху опцията Paired в следващото падащо меню.
- Сега, когато имате всички необходими елементи, затворете скобата. Формулата за този пример изглежда така: = T.Test (B2: B6, C2: C6, 1, 1)

- Натиснете Enter. Клетката ще покаже p- стойността веднага. В нашия случай стойността е 0, 133906 или 13, 3906%.
Като е по-висок от 5%, тази p- стойност не дава категорични доказателства срещу нулевата хипотеза. В нашия пример, изследването не доказа, че диетата е помогнала на изпитваните да загубят значително количество тегло. Това не означава непременно нулевата хипотеза да е правилна, само че тя все още не е опровергана.
Маршрут за анализ на данните
Инструментът за анализ на данни ви позволява да правите много готини неща, включително изчисления на p- стойност. За да опростим нещата, ще използваме същата таблица, както в предишния метод.
Ето как се прави.
- Тъй като вече имаме разликите в теглото в колоната D, ще пропуснем изчислението на разликата. За бъдещите таблици използвайте тази формула: = “Cell 1” - “Cell 2”.
- След това щракнете върху раздела Данни в Главното меню.
- Изберете инструмента за анализ на данни.
- Превъртете надолу в списъка и щракнете върху опцията t-Test: Сдвоена две проби за средства.
- Щракнете върху OK.
- Ще се появи изскачащ прозорец. Изглежда така:

- Въведете първия диапазон / аргумент. В нашия пример това е B2: B6.
- Въведете втория диапазон / аргумент. В този случай това е C2: C6.
- Оставете стойността по подразбиране в текстовото поле на Alpha (това е 0, 05).
- Кликнете върху радио бутона Бутон за изход и изберете къде искате резултата. Ако това е клетка A8, въведете: $ A $ 8.
- Щракнете върху OK.
- Excel ще изчисли p- стойност и няколко други параметри. Финалната маса може да изглежда така:

Както виждате, p- стойността с една опашка е същата като в първия случай - 0, 133905569. Тъй като тя е над 0, 05, нулевата хипотеза се прилага за тази таблица, а доказателствата срещу нея са слаби.
Неща, които трябва да знаете за p -Value
Ето няколко полезни съвета относно изчисленията на p- стойност в Excel.
- Ако р- стойността е равна на 0, 05 (5%), данните в таблицата ви са значителни. Ако е по-малко от 0, 05 (5%), данните, които имате, са много значими.
- В случай, че p- стойността е повече от 0, 1 (10%), данните в таблицата ви са незначителни. Ако е в обхвата 0.05-0.10, имате незначително значими данни.
- Можете да промените алфа стойността, въпреки че най-често срещаните опции са 0, 05 (5%) и 0, 10 (10%).
- Изборът на тестване с две опашки може да бъде по-добрият избор, в зависимост от вашата хипотеза. В горния пример еднократно тестване означава да изследваме дали тестваните лица са отслабнали след диета и точно това трябваше да разберем. Но тест с две опашки също ще проучи дали те са получили статистически значими количества.
- P- стойност не може да идентифицира променливи. С други думи, ако идентифицира корелация, тя не може да идентифицира причините, които стоят зад нея.
Демистифицираният p -Value
Всеки статистик, който си струва неговата сол, трябва да знае входовете и изходите на теста за нулева хипотеза и какво означава p- стойност. Тези знания също ще бъдат полезни за изследователите в много други области.
Използвали ли сте някога Excel за изчисляване на p- стойността на статистически модел? Кой метод сте използвали? Предпочитате ли друг начин да го изчислите? Уведомете ни в секцията за коментари.






