Оцінка похибки вибірки
 


Більшість даних одержуваних у соціології та маркетингу виходять з урахуванням вибіркових досліджень. Тут наведені flash-ролики, що дозволяють оцінити похибку простої випадкової вибірки.
Проста випадкова вибірка - вибірка, коли вибіркова сукупність формується випадковим відбором об'єктів із множини досліджуваних об'єктів.
Звичайно, в дослідженнях зазвичай використовуються складніші типи вибірки, але оцінки похибки за допомогою формул для розрахунку простої випадкової, дають гарну оцінку якості вибірки.
Звернімо увагу на те, що більшість вибірок є хоч і випадковими, але не простими, а багатоступеневими. На першому кроці відбору випадково відбираються місця зосередження об'єктів дослідження (наприклад, для населення країни такими місця зосередження є населені пункти), але на другому кроці всередині відібраних місць зосередження відбираються вже безпосередні учасники дослідження. При розрахунку похибки для таких вибірок слід, крім оцінки похибки за формулами для простої випадкової вибірки, також розраховувати та враховувати дизайн-ефект (вплив багатоступінчастості на помилку вибірки). Механізми для оцінки дизайн-ефекту досить складні і не наведені тут, адже вимагають безпосереднього аналізу наявних даних.

Для розрахунку обсягу простої випадкової вибірки слід зазначити такі параметри.
Обсяг генеральної сукупності - загальна кількість об'єктів, серед яких проводиться вибіркове дослідження. Слід зазначити, що зі збільшенням числа об'єктів, серед яких проводиться дослідження, вплив даного параметра зменшується. Якщо обсяг генеральної сукупності більше 10 000 об'єктів, сукупність вважається умовно нескінченною і замість точної вказівки її обсягу (у тих випадках, коли він невідомий) для розрахунку можна використовувати число 10 000.
Гранична похибка - оскільки будь-яке вибіркове дослідження несе у собі певну ймовірність помилитися, максимальне припустиме значення цього параметра враховується під час розрахунку обсягу вибірки. Стандартом вважається не перевищувати помилку 5%.
Доля досліджуваної ознаки - цей параметр відображає частку в генеральній сукупності носіїв досліджуваної ознаки. Дуже часто цей параметр буває невідомим, крім того багато досліджень присвячені одночасному вивченню кількох ознак. Тому зазвичай береться значення 0.5, як таке при якому обсяг вибірки буде максимальним. А отже, вплив цього параметра на обсяг вибірки буде враховано якого б значення він не набував насправді.
Довірча ймовірність (у наведених формах розрахунках позначається буквою P) - оскільки цей матеріал є лише загальним описом, ми дозволимо собі дати поверхневу характеристику даному параметру. Це ймовірність того, що задана нами гранична помилка не буде перевищена. Усі розрахунки наводяться для двох довірчих ймовірностей 99% та 95%. Зазначимо, що найчастіше використовується довірча ймовірність 95%.
Також на цій сторінці наведено форму для зворотної процедури - розрахунку похибки для заданого обсягу вибірки.

Обратно

     

E-Mail: oca.feedback@gmail.com |  (c) OCA 2004 - 2022.