В процессе статистического наблюдения обследованию могут подвергаться все элементы данной совокупности или некоторая часть их. В соответствии с этим наблюдения бывают сплошными или несплошными. Наиболее совершенный и научно обоснованный способ несплошного наблюдения—это выборочное наблюдение.
- Оно рассчитано на то, чтобы на основе обследования некоторой части совокупности судить о всей данной совокупности.
- Например, если требуется обследовать большой коллектив рабочих одной и той же профессии в отношении распределения бюджета, то из-за значительной трудоемкости всей работы практикуется выборочное обследование небольшой части этого коллектива.
- Весь коллектив при этом называется Генеральной совокупностью, А выделенная для обследования часть коллектива называется Выборочной соВОкупностью.
- Наиболее простой способ образования «случайной» выборки состоит в следующем.
Предварительно все члены генеральной совокупности нумеруются, и каждый номер записывается на отдельной карточке. Получившаяся пачка содержит столько же карточек, сколько членов имеет вся генеральная совокупность.
Затем после тщательного перемешивания из пачки наугад берутся отдельные карточки, и ноМЕра каждой Нз Них фиксируются. Перечень номеров этих карточек указывает, какие члены генеральной совокупности случайно попали в состав выборочной совокупности.
При этом существуют два принципиально различных вида случайной выборки.
1. Если каждая карточка, вынутая наугад из всей пачки, после фиксирования ее номера возвращается обратно в обЩУю пачку, то зафиксированные номера карточек определят состав Собственно случайной повторной выборки.
2. Если каждая наугад вынутая карточка не возвращаетсЯ в общую пачку, то зафиксированные номера карточек определят состав Собственно случайной бесповторной выборки.
Заметим, что случайная бесповторная выборка имеет место и тогда, когда из тщательного перемешанной пачки сразу берется нужное количество карточек.
Отношение объема выборочной совокупности П к объему генеральной совокупности N, т. Е. , называется Относительным Показателем выборки. Если в нашем примере N=20000 и П=1000, то в данном случае относительный показатель выборки Равен .
Любое выборочное наблюдение независимо от относИТельного показателя выборки, как правило, не дает точной характеристики всей генеральной совокупности. Поэтому каждый результат, вычисленный по данным выборки, имеет некоторую погрешность.
Эта погрешность называется ОшибкоЙ репрезентативности (или представИТельности).
Ошибка репрезентативности показывает величину расхождения между показателями по данным выборочного обследования и соответствующими показателями всей статистической (генеральной) сОВокупности.
Особенностью выборочного наблюдения является то, что отбор единиц (объектов наблюдения) выполняется в случайном порядке. Поэтому к выборочному наблюдению применимы положения и теоремы теории вероятностей, дающие возможность определять границы возможных ошибок.
Случайный характер отбора объектов обследования в выборке приводит к случайному же характеру ошибок репрЕЗентативности.
Поэтому здесь можно на основе закона больших чисел, увеличивая объем выборки, регулировать пределы возможной ошибки репрезентативности и, наоборот, по заданному пределу допустимой ошибки определить необходимую численность выборки.
Ошибка репрезентативности имеет важное значение в применении результатов выборочного обследования. При вычислЕНии средней, она определяется как разность между выборочной средней и генеральной средней.
- Заметим, что Генеральной средней называется среднее значение изучаемого признака в генеральной совокупности
- .
- Это — средняя взвешенная при наличии в совокупности ПовтоРяюЩИхся значений признака.
- При отсутствии повторений применяется формула средней Арифметической
- .
- Аналогично Выборочной средней называется среднее значение того же признака в выборочной совокупности. Здесь соответственно применяются формулы
- Или
- (П — Объем выборочной совокупности).
- Обозначая ошибку репрезентативности символом D, будем иметь
- .
- Приведем конкретный пример.
Пусть в коллективе из 20 000 рабочих СРедняя месячная Заработная плата рабочего (генеральная средняя) составляет 95,9 Руб. При выборочном обследовании 1000 рабочих средняя заработнаЯ Плата рабочего (выборочная средняя) оказалась равной 96 руб.
- Отсюда ошибка репрезентативности при выборочном обследованиЯ определяется так:
Руб.
- Аналогично проводится вычисление ошибки репрезентативностЬ При определении доли изучаемого признака в некоторой генеральноЙ Совокупности. Если N — Численность генеральной совокупности, А М — Количество единиц, обладающих данным признаком в ее составе, то доля (Р) единиц, обладающих этим признаком в генеральной совокупности
- Называется Генеральной долей.
- Если для выборочной совокупности П обозначает численность выборки, Т — Количество единиц, обладающих изучаемым признаком в составе выборочной совокупности, то обозначим буквой W — Долю соответствующих единиц в составе выборки.
- Это — выборочная доля .
Разность определяет ошибку репрезентативности. Пусть в рассматриваемом коллективе из N = 20000 рабочих имеется 1250 учеников, т. Е. М = 1250. Этим определяется генеральная доля учеников в объеме генеральной совокупности
В выборочной совокупности из П=1000 человек оказалось M=64 ученика. Этим определяется Вьборочная доля .
Ошибка репрезентативности, ТакИм образом, составляет
- Или .
- Нахождение параметров распределения по выборочным данным (случай нормальНОго распределения).
- Если ставится вопрос об установлении закона распределения случайной величины Х по ее частным значениям , полученным в результате выборки, то возникает необходимость отыскания значений тех параметров, которые характеризуют этот закон распределения. Наиболее распространенным является нормальное распределение, которое задается плотностью вероятности
- Где параметр А — математическое ожидание случайной величины X, а — Ее дисперсия.
- Значения случайной величины Х , являющиеся независимыми результатами опыта (в порядке выборки), можно рассматривать как значения П независимых случайных величин, имеющих равные математические ожидания А. Для таких случайных величин справедливо следствие из теоремы Чебышева в виде
(при достаточно большом П).
Это означает, что математическое ожидание случайной величины X, т. е. генеральная средняя, приближенно выражается средней арифметической (или средней взвешенной при наличии повторяющихся значений Х) ее значений, полученных в порядке выборки, т. е. .
Переходя к определению , т. е. дисперсии случайной величины Х По выборочным данным, следует отметить, что переход в формуле к значениям по данным выборки приводит к РезульТату (вывод его мы опускаем) .
Это — формула так называемоЙ Выборочной ДИсперсии. При больШой численности П выборки дроби и мало отличаются МеждУ собой, и поэтому значения и почти совпадают. При неболь Шой же численности П эти значения дают заметное расхождение.
В соответствии с указанным результатом для и среднее Квадратическое отклонение по выборочным данным принимается в вид .
Пример 1. Наблюдение в контрольной лаборатории за сроком годности 50 электроламп одинаковой мощности, взятых наудачу из большой партии выпущенных заводом ламп этой же мощности, привело к следующим данным о нарушении установленного гарантийНого срока горения:
Отклонение в Ч | -30 | -20 | -10 | 0 | 10 | 20 | 30 |
Частоты | 5 | 6 | 8 | 10 | 9 | 8 | 4 |
Требуется по этим выборочным данным найти параметры норМального распределения, которое отражает отклонение фактическоГо Срока горения лампочек от гарантийного.
Решение. Среднее отклонение
Выборочная дисперсия
- Таким образом, искомое нормальное распределение Характеризуется следующими значениями параметров: А » 0,4, И . Отсюда плотность вероятности
- .
- Соответствующая этой плотности функция Распределения выразится так:
- .
Источник: http://matica.org.ua/metodichki-i-knigi-po-matematike/posobie-po-teorii-veroiatnosti/5-1-generalnaia-sovokupnost-i-vyborka
Генеральная и выборочная совокупности, выборки
Понятие выборки используется, когда надо изучить какие-либо свойства совокупности объектов. Свойства объектов можно разделить на качественные и количественные.
Пример 1
Пусть нам необходимо изучить совокупность партии сметаны. Тогда качественным признаком может служить срок её годности, а количественным процент содержания жиров в данной сметане.
Совокупность или выборка может быть разделена на генеральную и выборочную.
Определение 1
Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.
Определение 2
Выборочная совокупность — часть отобранных объектов из генеральной совокупности.
С понятием совокупности также связано понятие объема данной совокупности.
Определение 3
Объем совокупности — число объектов этой совокупности.
Понятие объема совокупности относится и к выборочной, и к генеральной совокупности.
Ничего непонятно?
Попробуй обратиться за помощью к преподавателям
Пример 2
Пусть из партии 100 пачек масла для исследования выбрано 10 пачек. Тогда объем генеральной совокупности $N=100$, а объем выборки $n=10$.
Примечание 1
Исходя из первых двух определений, очевидно, что всегда выполняется неравенство $N>n$
Помимо этих двух совокупностей выделяют также репрезентативную или представительную выборку.
Определение 4
Репрезентативная (представительная) выборка — выборка, в которой все объекты выбраны случайно и генеральной совокупности, то есть каждый объект генеральной совокупности имеет одинаковую вероятность попасть в выборку.
Выборка также может быть повторной и бесповторной.
Определение 5
Повторная выборка — выборка, при которой выбранный объект возвращается обратно в генеральную совокупность перед выбором следующего объекта для исследования.
Определение 6
Бесповторная выборка — выборка, при которой объект не возвращается обратно в генеральную совокупность перед выбором очередного объекта для исследования.
Способы отбора
Рассмотрим теперь различные способы отбора (схема 1).
Рисунок 1. Способы отбора.
Разберемся теперь с каждым понятием по отдельности.
Определение 7
Простой случайный бесповторный отбор — отбор, при котором объекты из генеральной совокупности выбираются по одному и не возвращаются обратно в генеральную совокупность.
Определение 8
Простой случайный повторный отбор — отбор, при котором объекты из генеральной совокупности выбираются по одному и возвращаются обратно в генеральную совокупность.
Определение 9
Типический отбор — отбор, при котором выборка производится не из всей генеральной совокупности, а из каждой его части по отдельности.
Пример 3
К примеру, если сметана произведена на трех разных заводах, то выборка делается по каждому заводу отдельно.
Определение 10
Механический отбор — отбор, при котором генеральная совокупность делится на такое количество групп сколько объектов для исследования необходимо выбрать.
Пример 4
Пусть из партии 100 пачек масла нужно для исследования отобрать $10\%$. Тогда выбирается по одной пачке из каждых 10 пачек масла.
!!! Отметим, что при таком отборе выборка не всегда получается репрезентативной.
Определение 11
Серийный отбор — отбор, при котором выборка происходит из генеральной совокупности не по одному, а сериями.
!!! На практике часто применяется комбинированный отбор, при котором используются сразу несколько видов отборов, перечисленных выше.
Формулы, связанные с понятием выборки
Введем несколько формул:
- Генеральная средняя при повторной выборке:
Отметим, что $sum{N_i}=N$
- Генеральная средняя при бесповторной выборке:
- Выборочная средняя при повторной выборке:
Отметим, что $sum{n_i}=n$
- Выборочная средняя при бесповторной выборке:
- Ошибка репрезентативности:
Пример задачи на нахождение ошибки репрезентативности
Пример 5
Пусть в магазине 20 видов глазированных сырков. Средняя цена 1 вида сырка составляет 10,4 рублей. Сырков с начинкой из этих видов составляет $25\%$ и средняя цена каждого вида с начинкой равняется 11 рублей. Найти ошибку репрезентативности данной выборки.
- Решение:
- Ошибка репрезентативности:
- 10,4 — это генеральная средняя величина, то есть $overline{X}=10,4$.
- Так как сырки с начинкой составляют $25\%$, то сырков с начинкой$20cdot 0,25=5$ видов.
- Тогда выборочная средняя $overline{x}=11$.
- Получаем:
- Ответ: 0,6.
[ riangle =overline{x}-overline{X}]
[ riangle =overline{x}-overline{X}=11-10,4=0,6]
Источник: https://spravochnick.ru/matematika/elementy_matematicheskoy_statistiki/generalnaya_i_vyborochnaya_sovokupnosti_vyborki/
Полезные статьи → Как правильно рассчитать объем выборки?
Один из главных компонентов тщательно продуманного исследования – определение выборки и что такое репрезентативная выборка. Это как в примере с тортом. Ведь не обязательно съедать весь десерт, чтобы понять его вкус? Достаточно небольшой части.
Так вот, торт – это генеральная совокупность (то есть все респонденты, которые подходят для опроса). Она может быть выражена территориально, например, лишь жители Московской области. Гендерно – только женщины. Или иметь ограничения по возрасту – россияне старше 65 лет.
Высчитать генеральную совокупность сложно: нужно иметь данные переписи населения или предварительных оценочных опросов. Поэтому обычно генеральную совокупность «прикидывают», а из полученного числа высчитывают выборочную совокупность или выборку.
Что такое репрезентативная выборка?
Выборка – это чётко определенное количество респондентов. Её структура должна максимально совпадать со структурой генеральной совокупности по основным характеристикам отбора.
Например, если потенциальные респонденты – всё население России, где 54% — это женщины, а 46% — мужчины, то выборка должна содержать точно такое же процентное соотношение. Если совпадение параметров происходит, то выборку можно назвать репрезентативной. Это значит, что неточности и ошибки в исследовании сводятся к минимуму.
Объем выборки определяется с учётом требований точности и экономичности. Эти требования обратно пропорциональны друг другу: чем больше объем выборки, тем точнее результат.
При этом чем выше точность, тем соответственно больше затрат необходимо на проведение исследования.
И наоборот, чем меньше выборка, тем меньше на неё затрат, тем менее точно и более случайно воспроизводятся свойства генеральной совокупности.
Поэтому для вычисления объема выбора социологами была изобретена формула и создан специальный калькулятор:
Доверительная вероятность и доверительная погрешность
Что означают термины «доверительная вероятность» и «доверительная погрешность»? Доверительная вероятность – это показатель точности измерений. А доверительная погрешность – это возможная ошибка результатов исследования.
К примеру, при генеральной совокупности более 500 00 человек (допустим, проживающие в Новокузнецке) выборка будет равняться 384 человека при доверительной вероятности 95% и погрешности 5% ИЛИ (при доверительном интервале 95±5%).
Что из этого следует? При проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного. И мы получим репрезентативную выборку с минимальной вероятностью статистической ошибки.
После того, как подсчет объема выборки выполнен, можно посмотреть есть ли достаточное число респондентов в демо-версии Панели Анкетолога. А как провести панельный опрос можно подробнее узнать здесь.
- Сохранить
- Сохранить
- Сохранить
Источник: https://blog.anketolog.ru/2015/12/vyborka/
Генеральная совокупность и выборка — PDF Free Download
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Математическая статистика 1 Выборка X x, x,, x Опр.1 Пусть одномерная с.в., а 1 значения с.в.,полученные в результате испытания. Будем называть полученные значения выборкой из генеральной совокупности
Подробнее
Лекция 9 Тема Введение в теорию оценок. Содержание темы Предмет, цель и метод задачи оценивания Точечные выборочные оценки, свойства оценок Теоремы об оценках Интервальные оценки и интеграл Лапласа Основные
Подробнее
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ О.Ю.Пелевин МЕТОДИЧЕСКАЯ РАЗРАБОТКА по курсу «Теория вероятностей и математическая статистика» для студентов физического
Подробнее
Генеральная совокупность и выборка Точечные оценки и их свойства Центральная предельная теорема Выборочное среднее, выборочная дисперсия Генеральная совокупность Генеральная совокупность множество всех
Подробнее
ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ Основные понятия математической статистики Совокупность — это множество объектов (элементов совокупности), обладающих общим свойством. Объем совокупности — это число
Подробнее
Математическая статистика 1 Выборка X x, x,, x Опр.1 Пусть одномерная с.в., а 1 значения с.в.,полученные в результате независимых испытаний. Будем называть полученные значения выборкой из генеральной совокупности
Подробнее
. СТАТИСТИЧЕСКАЯ ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ.. Понятие о статистической оценке параметров Методы математической статистики используются при анализе явлений, обладающих свойством статистической устойчивости.
Подробнее
Выборочные оценки параметров распределения 1 Выборочные оценки параметров распределения Резюмируя, важно подчеркнуть, что, с точки зрения экспериментатора, функции распределения и статистические характеристики
Подробнее
Лекция 3 7 6 Разложение оценок коэффициентов на неслучайную и случайную компоненты Регрессионный анализ позволяет определять оценки коэффициентов регрессии Чтобы сделать выводы по полученной модели необходимы
Подробнее
Оценка параметров 30 5. ОЦЕНКА ГЕНЕРАЛЬНЫХ ПАРАМЕТРОВ 5.. Введение Материал, содержащийся в предыдущих главах, можно рассматривать как минимальный набор сведений, необходимых для использования основных
Подробнее
Лекция 5 СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ ЦЕЛЬ ЛЕКЦИИ: ввести понятие оценки неизвестного параметра распределения и дать классификацию таких оценок; получить точечные оценки математического
Подробнее
8. ПРИМЕРНЫЕ ВОПРОСЫ ДЛЯ ПОДГОТОВКИ К ЭКЗАМЕНУ (ЗАЧЕТУ) ПО ДИСЦИПЛИНЕ 1. Основные понятия и определения теории вероятностей. Виды случайных событий. Классическое и статистическое определение вероятности
Подробнее
Кафедра математики и информатики ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Учебно-методический комплекс для студентов ВПО, обучающихся с применением дистанционных технологий Модуль 3 МАТЕМАТИЧЕСКАЯ
Подробнее
Лекция 6 Тема: Интервальный статистический ряд 1. Основные определения В случае, когда число значений признака Х велико или признак является непрерывным, составляют интервальный ряд. Опр. Интервальный
Подробнее
Демидова ОА, Ратникова ТА Сборник задач по эконометрике- Повторение теории вероятностей Случайные величины Определение Случайными величинами называют числовые функции, определенные на множестве элементарных
Подробнее
Контрольная работа по математической статистике МЭСИ Контрольная работа по теме «СТАТИСТИЧЕСКАЯ ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ» Задание. На основании вариационного ряда распределения длины плунжеров,
Подробнее
Источник: https://docplayer.ru/305414-Generalnaya-sovokupnost-i-vyborka.html
Генеральная и выборочная совокупности в социологических исследованиях
- Выборка − это метод исследования, когда из общей изучаемой (генеральной) совокупности однородных единиц отбирается некоторая ее часть (выборочная совокупность) и только эта часть подвергается обследованию.
- Процедуры выборки:
- 1) определение слоев и групп населения, на которые предполагается распространить полученные результаты опроса (генеральная совокупность);
- 2) определение численности опрашиваемых, необходимой и достаточной для репрезентации генеральной совокупности
- 3) определение правила поиска и отбора респондентов на последней стадии выбора.
Обычно социологи используют в своих исследованиях случайную выборку. При случайной выборке исследователи осуществляют произвольный отбор объектов исследования с применением либо случайных чисел, либо систематической выборки. Случайные числа используются для обеспечения равного шанса каждому индивидууму в структуре выборки (например, в списках избирателей, почтовых адресов) быть отобранным в качестве члена выборки. Систематическое проведение таких исследований предполагает беспорядочный отбор первого индивидуума из списка, затем последующих в любом из установленных интервалов (например, каждого десятого или двадцатого избирателя). Если выборочная совокупность слишком велика, проводится квотная выборка, предполагающая разбивку ее на страты по полу, возрасту, социальному классу, месту жительства. А затем в каждой страте проводится случайная выборка.
Генеральная и выборочная совокупности. Понятие репрезентативности.
Большинство социологических исследований имеет не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование именуется выборочным.
Выборочное обследование представляет способ систематического сбора данных о поведении и установках людей посредством опроса специально подобранной группы респодентов, дающих информацию о себе и о своем мнении. Оно является более экономичным и не менее надежным, чем сплошное обследование, хотя требует изощренной методики и техники.
Его основа – выборочная совокупность, которая составляется на базе своей уменьшенной копии – генеральной совокупности.
Генеральная совокупность − совокупность всех изучаемых в ходе социологического исследования объектов.
Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить. Генеральная совокупность – множество тех людей, сведения о которых стремится получить социолог в своем исследовании. В зависимости от того, насколько широкой будет тема исследования, настолько же широка будет генеральная совокупность.
Любое эмпирическое исследование осуществляется путем изучения некоей совокупности социальных объектов. Совокупность этих объектов − это генеральная совокупность, она представляется различным количеством людей (от десятков до миллионов).
Если количество исследуемых объектов не позволяет нам (с учетом материально-финансовых возможностей) провести сплошное социологическое исследование, то мы прибегаем к выборочному методу. В этом случае генеральная совокупность представлена очень большим количеством людей (от пятисот и более).
Теория этого метода заимствована из математической статистики: выборка − процесс формирования выборочной совокупности путем отбора из генеральной совокупности некоторого подмножества элементов, которое по исследуемым характеристикам отражает свойства генеральной совокупности.
Элементы выборочной совокупности, которые изучаются, называются единицами наблюдения (анализа).
Свойство выборочной совокупности отражать исследуемые характеристики генеральной совокупности называется репрезентативностью. Очевидно, что абсолютно репрезентативную (отражающую по всем параметрам) выборку сформировать невозможно, но необходимо обеспечивать репрезентативность по основным направлениям исследования.
Любая выборочная совокупность требует определения ее типа, структуры и объема.
Выборочная совокупность – уменьшенная модель генеральной совокупности; те, кому социолог раздает анкеты, кто называется респондентами, кто, наконец, представляет собой объект социологического исследования. Иначе говоря, это множество людей, которых социолог опрашивает.
Полный и точный перечень единиц выборочной совокупности образует основу выборки. Элементы, предназначенные для отбора, называются единицами отбора.
Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группировки по каким-то важным признакам, например, распределение индивидов по профессии, квалификации, полу и возрасту. Таким образом, структура выборки – это процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.
Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое количество попало в нее. Объем выборки – количество единиц выборочной совокупности.
Поскольку выборочная совокупность (или выборка, что одно и то же) – это часть генеральной совокупности, отобранной с помощью специальных методов, — поскольку ее объем всегда меньше объема генеральной.
Расхождение между генеральной и выборочной совокупностью называется ошибкой репрезентативности, допустимое склонение – 5%.
Репрезентативность – свойство выборочной совокупности представляет характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности – мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности.
Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями – генеральной, на которую направлен теоретический интерес социолога, и выборочной, на которую направлен его практический интерес, выступающей одновременно и как объект обследования и как средство получить информацию о генеральной совокупности.
Источник: https://students-library.com/library/read/25909-generalnaa-i-vyborocnaa-sovokupnosti-v-sociologiceskih-issledovaniah
Определение объема выборки
Определение объема выборки
Для проведения социологического исследования недостаточно просто определить объект исследования. Нерационально опрашивать всех людей, составляющих объект исследования (иногда это могут быть тысячи людей). На это уйдет много времени.
Поэтому обычно социологические исследования имеют не сплошной, а выборочный характер.
То есть по определенным и строгим правилам исследователь отбирает небольшое (относительно всего объема выборки) число людей, которые по своим социально-демографическим признакам и другим каким-то характеристикам полностью соответствуют структуре изучаемого объекта. Эта операция носит название «выборка».
• Генеральная совокупность — это объект исследования, который территориально, производственно и во времени ограничен и для которого выводы проведенного исследования будут правомерны.
• Выборочная совокупность (выборка) — это отобранное по строго заданному правилу определенное число элементов генеральной совокупности. Выборка будет своеобразной микро-моделью всей генеральной совокупности, т.е.
по всем основным изучаемым качественным характеристикам и контрольным признакам она будет своей структурой максимально повторять структуру генеральной совокупности. Так составленная выборка будет репрезентативной. От французского слова «представительный».
В репрезентативной выборке есть все элементы генеральной совокупности, а объекты, часто проявляющиеся в генеральной совокупности, чаще проявляются и в ней. Основной принцип построения выборки заключается в том, чтобы все элементы генеральной совокупности имели равные шансы попасть в выборку.
Но как бы тщательно ни соблюдали этот принцип, случайные ошибки все же будут иметь место в выборке. Репрезентативность выборки определяется двумя компонентами: ошибками, допущенными при регистрации, и случайными ошибками. Если у нас сплошное исследование (т.е.
полностью охватывается весь объект), то в идеальной ситуации ошибок репрезентативности не будет. Но если объект исследования огромен, то потребуется большое число анкетеров и интервьюеров, часто среди них бывают и недостаточно квалифицированные, а это ведет к увеличению ошибок регистрации.
Проведение же выборочного исследования более подготовленными кадрами, которых можно лучше проинструктировать и проконтролировать, ведет к уменьшению ошибок регистрации. И тогда, если случайная ошибка не велика, то ошибка при проведении выборочного опроса в целом может быть меньше ошибки сплошного исследования.Если разница в показателях выборки и генеральной совокупности более 5%, то исследование проводить нельзя, так как будет иметь место искажение. Выводы такого социологического исследования не будут соответствовать действительности.
Каким должен быть оптимальный объем выборки? На этот вопрос нет однозначного, конкретного ответа. Все зависит от генеральной совокупности и целей исследования. Социологи руководствуются обычно следующим принципом: чем более однороден изучаемый объект по своим признакам, которые поддаются статистическому выражению, тем меньше может быть выборка.
Если выборка формируется по случайному принципу, то обычно она не превышает 10%. Иногда она может быть завышена, если это будет обусловлено целями исследования.Одни социологи считают, что если объект составляет 50 человек, то необходимо проводить сплошной опрос, если более 50, то можно применять выборочный метод.
Другие придерживаются мнения, что если, в объекте 500 человек и более, то только тогда необходимо применять выборочный метод. Для генеральной совокупности менее 5 тыс. человек достаточна выборка не менее 500 человек, а для генеральной совокупности 5 тыс. человек, и более, надо брать 10% ее состава, но не более 2-2.5 тыс.человек.
Для проведения пробного опроса в масштабном исследовании достаточна выборка объемом 100-250 человек.Математики и статистики вывели формулу для определения объема выборки:
n = сигма в квадрате х на t в квадрате / дельта в квадрате
Где n — объем выборки:
сигма — дисперсия, или мера рассеивания исследуемого признака; в генеральной совокупности (степень однородности исследуе¬мых единиц наблюдения); t — коэффициент доверия (заданная точность); дельта — предельная ошибка выборки.
Как видим, объем выборки (n) будет зависеть, с одной стороны, от разнородности исследуемого объекта, а с другой — от степени точности. Чем больше разнородность объекта и больше степень точности, тем больше и объем выборки.
Чтобы вывести большую точность, для проведения исследования необходимо брать больше единиц наблюдения, например, если стоит задача установить эффективность исследования в пределах рублей, то точность необходима высокая, а если устанавливается эффективность в тысячах — то низкая.
Поэтому точность расчета уже заранее задана.Чтобы вывести среднее квадратическое отклонение генеральной совокупности, надо взять небольшую выборочную совокупность и, пользуясь учебником общей теории статистики, вывести из нее среднее квадратическое отклонение.
Предельная ошибка выборки зависит от выбора инструментария и приемов исследования. Если приемы исследования совершенные — то и предельная ошибка меньше.
Эта формула работает лишь в условиях больших чисел.
А если необходимо провести исследование на одном предприятии или учреждении, то как тогда определить выборку?Для этого можно использовать метод квот. Квотная выборка получила наибольшее распространение при сборе информации при помощи интервью. Под квотой понимается пропорция.
Этим методом пользуются, когда имеются предварительные данные о важных элементах генеральной совокупности. При этом берется какая-то часть (в процентном отношении) генеральной совокупности, непосредственно исследуется, а затем сопоставляется эта часть с целым по каким-то показателям.
Это может быть возраст, образование, профессиональная подготовка и т.д. Показатели генеральной совокупности в этом случае берутся из официальной статистики.Практика применения квотной выборки показала, что достаточно брать 10% единиц наблюдения генеральной совокупности, чтобы выборочная совокупность была обоснованной.
Как же набрать необходимые 10% единиц наблюдений? Рассмотрим основные способы формирования обследуемой совокупности и виды выборок.
Не строго случайные методы: целенаправленная, квотная и стихийная выборки
• Целенаправленная — выбираются типичные для генеральной совокупности элементы по каким-то определенным критериям.• Квотная — представляет собой модель структуры генеральной совокупности, которая строится в виде квот (пропорций) распределения признаков изучаемых объектов.• Стихийная — часто называется выборкой «первого встречного». Критерии выбора не задаются. Исследуя какую-то проблему через газету, заранее трудно предопределить структуру массы читателей, которые заполнят и вышлют обратно анкеты. Поэтому выводы такого исследования будут распространяться только на определенных читателей.Существует три типа вероятностных (случайных) выборок, простая случайная выборка, систематическая выборка, серийная выборка (часто ее называют гнездовой выборкой).• Простая случайная выборка — используется таблица случайных чисел. Существуют разные последовательности случайных чисел объемом от нескольких десятков до миллиона цифр.Если генеральная совокупность не очень велика, то можно использовать другой способ. Нумеруем единицы наблюдения, переносим номера на карточки, тщательно перемешиваем или складываем в барабан и вытаскиваем необходимое их количество.
• Систематическая случайная выборка — в этом случае отбор производится через какой-то определенный интервал из исходного списка. Им могут быть домовые книги, алфавитные списки, финансовые ведомости и т.д.
Первый элемент отбора определяется случайным способом (по таблице случайных чисел), также им может быть средний элемент списка или стоящий рядом с ним. Потом выбор единиц отбора будет производиться через один и тот же интервал. Такая выборка в социологии называется шаговой.
Однако применяя ее, необходимо следить, чтобы шаг отбора не совпадал с какой-то внутренней закономерностью изучаемой генеральной совокупности. Если составляется выборка для опроса рабочих в цехе, надо проверить не попали ли в нее одни бригадиры.• Серийная (гнездовая) выборка — единицей отбора будет статистическая серия, т.е.
совокупность статистически различных единиц. Эта выборка используется, когда есть возможность разбить генеральную совокупность на однородные группы, гнезда (семьи, бригады, территориальные общности и т.д.).Серии, попавшие в выборку, подвергаются сплошному или выборочному обследованию.Гнездовой отбор имеет большие преимущества.
С его помощью легче произвести отбор и изучение нескольких коллективов или групп, которые находятся в одном месте. Выборку можно сконцентрировать в относительно небольшом числе пунктов.Любой тип вероятностной выборки может быть осуществлен в одно- или многоступенчатом отборе.
Если нет необходимой информации о единицах наблюдения генеральной совокупности, то проводится многоступенчатый отбор.
• Многоступенчатая выборка — случайный отбор будет проводиться в несколько ступеней, при этом на каждой следующей ступени единица отбора будет меняться.
Например, на первой ступени мы отобрали учебные заведения или промышленные предприятия, на второй — академические группы или бригады, а на третьей — уже студентов или рабочих из групп или бригад, попавших в выборку на предыдущем этапе.
При этом на первой ступени используется случайный отбор, а со второй ступени случайно отбирается количество единиц, которое должно быть пропорционально размеру отобранной единицы на предыдущей ступени. Если на каждой ступени отбора будет меняться не только единица, но и техника случайного отбора, то это уже будет комбинированная выборка.
Присущие перечисленным основным типам выборок достоинства и недостатки даны в систематизированном виде авторами «Рабочей книги социолога» (с. 232-233) (см. таблицу на с. 58-60).
Качество выборки оценивают по двум показателям: репрезентативности и надежности. О репрезентативности уже говорилось выше. А чтобы создать надежную выборку, необходимо правильно построить ее основу.
Для этого надо соблюдать следующие требования: полнота выборки, отсутствие дублирования, точность, адекватность и удобство работы.
• Полнота выборки — это наличие всех элементов генераль¬ной совокупности в основе выборки. Если в выборку не будут включены многие единицы наблюдения, тем более несущие в себе существенные особенности и характеристи¬ки объекта, то результаты исследования будут неполными и однобокими.• Отсутствие дублирования подразумевает недопустимость повторного включения в выборку одной и той же единицы отбора; построение программы исследования наблюдения (например, ученик перешел учиться в другую школу, его включили в новый список, не вычеркнув при этом из старого, таким образом он дважды попал в выборку).• Под точностью информации выборки понимается исключение несуществующих единиц наблюдения из основы выборки (в избирательных списках часто остаются умершие люди или жильцы снесенных домов). Основа составленной выборки должна быть адекватна решению поставленных в исследовании задач. Например, полный список всех учащихся школы — хорошая основа для того, чтобы сформировать выборку при изучении проблемы общей успеваемости. Но если Вас интересует проблема отношения старшеклассников к основным учебным дисциплинам, то этот список может быть использован только для формирования новой основы выборки — списка старшеклассников.Для удобства работы с основой выборки необходимо четко пронумеровать все элементы, которые входят в основу выборки, а составленные списки централизованно хранить.
Источник: https://smolsoc.ru/index.php/home/2009-12-24-13-38-54/30-2010-08-30-11-30-31/895-2011-01-17-09-51
Генеральная и выборочная совокупности
Главная | Windows XP | Word 2003 | Excel 2003 |
на предыдущую на следующую
Исходным понятием статистики является понятие совокупность, объединяющее обычно какое-либо множество испытуемых (учащихся) по одному или нескольким интересующим признакам. Главное требование к выделению изучаемой совокупности — это ее качественная однородность, например, по уровню знаний, росту, весу и другим признакам.
Члены совокупности могут сравниваться между собой в отношении только того качества, которое становится предметом исследования. При этом обычно абстрагируются от других неинтересующих качеств.
Так, если педагога интересует успеваемость учащихся, то он не принимает во внимание, как правило, их рост, вес и другие параметры, не относящиеся непосредственно к изучаемому вопросу.
Применение большинства статистических методов основано на идее использования небольшой случайной совокупности испытуемых из общего числа тех, на которых можно было бы распространить (генерализовать) выводы, полученные в результате изучения совокупности.
Эта небольшая совокупность в статистике называется выборочной совокупностью (или короче —выборкой).
Главный принцип формирования выборки — это случайный отбор испытуемых из мыслимого множества учащихся, называемого генеральной совокупностью или популяцией объектов или явлений.
Как по анализу элементов, содержащихся в капле крови, медики нередко судят о составе всей крови человека, так и по выборочной совокупности учащихся изучаются явления, характерные для всей генеральной совокупности.
Когда для каждого объекта в выборке измерено значение одной переменной, популяция и выборка называются одномерными. Если же для каждого объекта регистрируются значения двух или нескольких переменных, такие данные называются многомерными.
Одной из основных задач статистического анализа является получение по имеющейся выборке достоверных сведений о интересующих исследователя характеристиках генеральной совокупности.
Поэтому важным требованием к выборке является ее репрезентативность, то есть правильная представимость в ней пропорций генеральной совокупности.
Достижению репрезентативности может способствовать такая организация эксперимента, при которой элементы выборки извлекаются из генеральной совокупности случайным образом.
Теория выборочного метода основана на законе больших чисел.
Закон больших чисел, в его математической трактовке, говорит о том, что с увеличением числа наблюдений уменьшается разница между выборочной средней и генеральной средней, и наоборот, чем меньше выборка, тем меньше надежды на то, что выборочная средняя совпадет по величине со средней арифметической генеральной совокупности. Действие этого закона основано на свойстве самих случайных величин, отрицательные и положительные значения которых способны компенсировать друг друга тем полнее, чем большему числу испытаний подвергается случайная величина. В связи с этим закономерности
распределения, наблюдаемые в ранжированных совокупностях вариант, следует рассматривать как проявление наиболее общего закона поведения случайных величин — закона больших чисел.
При выборочном наблюдении закон больших чисел и теоремы теории вероятностей в силу случайности отбора единиц позволяют определить ошибки репрезентативности, допущенные при выборочном обследовании.
Зная предел допустимой ошибки, на основе закона больших чисел можно определить необходимую численность выборки. Математическое обоснование закона больших чисел было дано еще в начале XVIII столетия Я. Бернулли. В дальнейшем академики П.Л. Чебышев, А.М. Ляпунов и А.А.
Марков расширили и уточнили первоначальную формулировку этого закона.
Необходимый объем выборочного наблюдения зависит от нескольких факторов:
• показателей вариации наблюдаемого признака: чем больше показатели вариации (средний квадрат отклонения), тем больше необходимая численность выборочной совокупности; • размера предельной ошибки случайной выборки: чем меньше должен быть размер предельной ошибки, тем больше нужен объем выборочного наблюдения. Иными словами, для получения большей точности необходимо увеличивать объем выборки; • размера вероятности, с которой требуется гарантировать результаты выборки: чем выше показатель кратности ошибки, тем больше должен быть объем выборки;
• способа отбора единиц выборочного наблюдения из генеральной совокупности. Для бесповторного наблюдения (при прочих равных условиях) требуется меньшая численность выборки, чем при повторном отборе.
Обычно в статистике различают три типа значений переменных: количественные, номинальные и ранговые.
Значения количественных переменных являются числовыми, могут быть упорядочены и для них имеют смысл различные вычисления (например, среднее значение). На обработку количественных переменных ориентировано подавляющее большинство статистических методов.
Значения номинальных переменных (например: пол, вид, цвет) являются нечисловыми, они означают принадлежность к некоторым классам и не могут быть упорядочены или непосредственно использованы в вычислениях.
Для анализа номинальных переменных специально предназначены лишь избранные разделы математической статистики, например, категориальный анализ.
Однако в ряде случаев для этой цели могут быть использованы и некоторые ранговые и количественные методы, если номинальные значения предварительно заменить на числа, обозначающие их условные коды.
Ранговые или порядковые переменные занимают промежуточное положение: их значения упорядочены (состояние больного, степень предпочтения), но не могут быть с уверенностью измерены и сопоставлены количественно. К анализу ранговых переменных применимы так называемые ранговые методы.
Ранг наблюдения – это тот номер, который получит данное наблюдение в упорядоченной совокупности всех данных – после их упорядочивания по определенному правилу (например, от большего значения к меньшим). Процедура перехода от совокупности наблюдений к последовательности их рангов называется ранжированием.
Ранговые и номинальные значения при вводе данных следует обозначать целыми числами.
в начало
на предыдущую на следующую
Источник: http://yuschikev.narod.ru/psk13/lection1-3.html
Генеральная и выборочная совокупности
http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm
– очень полезный сайт!
Выборочный метод
исследования является основным
статистическим методом. Это естественно,
так как объем изучаемых объектов как
правило бесконечен (и даже, если конечен,
то весьма затруднительно перебрать все
объекты, приходится довольствоваться
лишь их частью, выборкой).
-
Генеральной
совокупностью называется совокупность
всех исследуемых в данном эксперименте
элементов. -
Выборочной
совокупностью (или выборкой) называется
конечная совокупность объектов, случайно
отобранных из генеральной совокупности. -
Объемом совокупности
(выборочной или генеральной) называется
число объектов этой совокупности.
Пример генеральной и выборочной совокупностей
Допустим, исследуется
психологическая предрасположенность
человека к делению данного отрезка в
отношении золотого сечения.
Так как
происхождение самого понятия золотого
сечения продиктовано антропометрией
человеческого тела, то понятно, что в
данном случае генеральной совокупностью
является любое антропогенное существо
достигшее физической зрелости и
приобретшее окончательные пропорции,
то есть — вся взрослая часть человечества.
Объем этой совокупности практически
бесконечен.
Если же эта
предрасположенность исследуется
исключительно в художественной среде,
то генеральная совокупность — это люди,
имеющие непосредственное отношение к
дизайну: художники, архитекторы,
дизайнеры. Таких людей тоже очень много,
и можно считать, что объем генеральной
совокупности в данном случае тоже
бесконечен.
И в том, и в другом
случае для исследования мы вынуждены
ограничиться разумными объемами выборок,
выбирая в качестве представителей той
и другой совокупностей студентов
технических специальностей (как людей,
далеких от художественного мира) или
студентов специальности дизайн (как
людей, имеющих непосредственное отношение
к миру художественных образов).
Репрезентативность
Основной проблемой
выборочного метода является вопрос о
том, насколько точно объекты, отобранные
из генеральной совокупности для
исследования, представляют изучаемые
характеристики генеральной совокупности,
то есть — вопрос о репрезентативности
выборки.
Итак, выборка
называется репрезентативной
(представительной), если она достаточно
точно представляет количественные
соотношения генеральной совокупности.
Разумеется, трудно
сказать, что именно скрывается за
расплывчатой формулировкой достаточно
точно. Вопросы
репрезентативности вообще являются
наиболее спорными в любом экспериментальном
исследовании. Имеется масса ставших
уже классическими примеров, когда
недостаточная представительность
выборки приводила экспериментаторов
к абсурдным результатам.
Как правило, вопросы
репрезентативности решаются при помощи
экспертной оценки, когда научное
сообщество принимает точку зрения
группы авторитетных специалистов по
поводу корректности проведенного
исследования.
Пример репрезентативности
Вернемся к примеру
с делением отрезка. Вопросы репрезентативности
выборок лежат здесь в самой основе
исследования: мы ни в коем случае не
должны смешивать группы испытуемых по
признаку принадлежности их к художественной
среде.
Статистическое
распределение наблюдаемого признака
Частота
наблюдаемого значения
Относительная
частота наблюдаемого значения
Понятно, что сумма
частот наблюдаемого признака должна
давать объем выборки
а сумма относительных
частот должна давать единицу:
Эти соображения
можно использовать для контроля при
составлении статистических таблиц.
Если равенства не соблюдаются, то при
протоколировании результатов эксперимента
была допущена ошибка.
- Статистическое
распределение наблюдаемого значения -
Статистическим
распределением наблюдаемого признака
называется соответствие между наблюдаемыми
значениями признака и отвечающими им
частотами (или относительными частотами). -
Как правило,
статистическое распределение записывается
в виде двухстрочной таблицы, в которой
в первой строке указываются наблюдаемые
значения признака, а во второй —
соответствующие им частоты (или
относительные частоты):
или
Если наблюдаемый
признак характеризуется непрерывной
случайной величиной
png» width=»13″>,
принимающей значения из интервала
png» width=»33″>,
то его статистическое распределение
описывается частотами попадания в
частичные интервалы:
или
Источник: https://studfile.net/preview/5716247/