Когда вы делаете наблюдения и делаете выводы о совокупности, случайная выборка является полезным инструментом. Может быть сложно или невозможно работать с данными по всей группе населения, но случайная выборка может дать вам репрезентативное сечение населения и позволить вам сделать выводы о всей группе. В зависимости от размера и сложности популяции, с которой вы работаете, вы можете использовать несколько различных типов случайной выборки. Для более мелких и однородных групп хорошая выборка - простая случайная выборка. Если вы имеете дело с более крупной или разнообразной группой, выберите вместо этого стратифицированную или кластерную выборку.
Шаги
Метод 1 из 3: простая случайная выборка
Шаг 1. Используйте простую случайную выборку для небольших или однородных популяций
Чтобы выполнить простую случайную выборку, вам необходимо иметь доступ к полной структуре выборки, то есть списку всех членов генеральной совокупности, из которых вы будете брать выборку. Кроме того, все члены генеральной совокупности должны иметь довольно схожие характеристики, иначе ваша выборка может быть не очень значимой.
- Например, это может быть хорошим вариантом, если ваша основа выборки состоит из всех учащихся детских садов из одного пригородного муниципального школьного округа. Это четко определенная, довольно ограниченная популяция людей, которые, вероятно, обладают схожими характеристиками (такими как возраст и социально-экономический статус).
- Простая случайная выборка вряд ли будет полезна для более крупной или более разнообразной группы, такой как все учащиеся K-12 в Калифорнии.
Шаг 2. Определите вашу популяцию
Начните с определения точного размера и характеристик вашей выборки. Используйте переменную N, чтобы описать размер всего населения. Вы возьмете случайную выборку из этой совокупности.
Например, предположим, что вы изучаете определенную группу загадочных улиток, выращенных в аквариуме. Если в аквариуме 53 улитки, то N = 53
Шаг 3. Определите желаемый размер выборки
Ваша случайная выборка будет состоять из группы лиц, которые, по крайней мере теоретически, являются репрезентативными для всего населения. Выберите, сколько представителей генеральной совокупности вы хотите выбрать, и определите свою выборку с помощью переменной n.
- Например, если вы решили взять 10 из 53 улиток в аквариуме, то n = 10.
- Хотя нет установленного числа, которое вы должны использовать для размера вашей выборки, вы можете использовать калькулятор размера выборки, чтобы помочь вам определить лучший размер выборки на основе желаемого уровня достоверности и допустимой погрешности (или доверительного интервала). Выполните поиск по запросу «калькулятор размера выборки».
Иметь ввиду:
Большие выборки дают более точную информацию с меньшей погрешностью. Однако для небольшой однородной популяции меньшие выборки имеют тенденцию быть более значимыми, чем они были бы для более крупной и разнообразной популяции.
Шаг 4. Присвойте идентификационный номер каждому члену населения
Прежде чем вы сможете выбрать свою выборку, вам понадобится способ идентифицировать различных людей в вашей популяции. Дайте каждому члену группы N уникальный номер или другой идентификатор.
- Например, вы можете просто пронумеровать своих улиток от 1 до 53.
- Кроме того, вы можете идентифицировать членов населения по имени или титулу. Например, если ваша популяция состоит из книг, название каждой книги может помочь идентифицировать ее в выборке.
Шаг 5. Выберите образец с помощью лотереи, если у вас небольшая популяция
Если ваша популяция и размер выборки относительно малы, то лотерея - это быстрый и простой способ получить вашу выборку. Запишите идентификационный номер или имя каждого члена населения на отдельных полосках бумаги, затем поместите их в миску и перемешайте. Нарисуйте заранее определенное количество полосок из чаши, чтобы создать образец.
- Например, если вы выбираете 10 улиток из вашей популяции в 53 человека, вы можете нарисовать числа 6, 1, 34, 12, 9, 52, 16, 2, 20 и 8.
- Каждый член популяции будет иметь равные шансы быть выбранным, что создаст действительно рандомизированную выборку.
- Чтобы рассчитать точную вероятность того, что будет выбран 1 человек, разделите размер выборки (n) на общую численность населения (N) и умножьте на 100%. Например, 10/53 x 100% = 18,87%, что означает, что у каждой улитки есть примерно 19% шанс быть выбранным.
Шаг 6. Используйте генератор случайных чисел для больших выборок
Если ваша выборка слишком велика, чтобы легко провести лотерею, хорошей альтернативой станет генератор случайных чисел. Введите диапазон чисел в вашей совокупности в генератор и настройте его на создание набора случайных целых чисел того же размера, что и ваша выборка.
- Например, если вы выбираете 500 учеников детского сада из 2000, генератор случайных чисел - хороший вариант.
- Вы можете найти множество генераторов случайных чисел в Интернете. Попробуйте использовать генератор целых чисел на
Шаг 7. Возьмите несколько образцов «без замены», чтобы избежать дублирования
Если вы планируете взять более одной выборки, вы можете убедиться, что одни и те же люди не появляются в разных выборках. Для этого вам нужно исключить ранее выбранных лиц из будущих выборок. Это называется «простой случайный отбор без замены» (SRSWOR).
- Например, если вы отбираете образцы с помощью лотереи, отложите номера для всех членов населения, которых вы не хотите включать в розыгрыш.
- Если вы используете генератор случайных чисел, найдите тот, который позволит вам исключить определенные целые числа из случайно сгенерированных наборов.
- Простая случайная выборка, допускающая дублирование, называется «простой случайной выборкой с заменой» (SRSWR).
Метод 2 из 3: стратифицированная случайная выборка
Шаг 1. Если вам нужен более детальный анализ, выберите стратифицированную выборку
Стратифицированная случайная выборка может дать более значимые результаты, если вы работаете с более крупными и разнообразными группами населения. Выберите этот вариант, если вы хотите иметь возможность посмотреть, как переменные вашего исследования работают в различных подгруппах общей основы выборки.
Например, если вы хотите оценить удовлетворенность работой среди работающих в городе людей, стратифицированная выборка может быть хорошим вариантом, поскольку ваша выборка будет включать большое количество людей с очень разным опытом работы, зарплатами и опытом работы
Шаг 2. Разделите население на слои по общим характеристикам
После того, как вы определили свою совокупность выборки (N), решите, как вы хотите сгруппировать членов генеральной совокупности. Вам нужно будет знать общее количество особей во всей популяции, а также количество особей в каждой страте.
- Например, если вы изучаете группу из 500 улиток, вы можете разделить ее на группы улиток с красными, синими и черными раковинами. Из всей популяции (N = 500) ваш слой может состоять из 287 красных улиток, 67 синих улиток и 146 черных улиток.
- В этом примере Nˬ1 = 287, Nˬ2 = 67 и Nˬ3 = 146.
Шаг 3. Определитесь с желаемым размером выборки для каждой страты
При проведении стратифицированной выборки существует множество способов выбора размера выборки. Подход, который вы будете использовать, будет частично зависеть от того, какие ресурсы вам доступны и насколько точными вы хотите получить результаты. Два общих подхода:
- Равное распределение. Для этого подхода вы должны взять один и тот же размер выборки (например, n = 25) из каждой страты. Если вы используете этот подход, имейте в виду, что ваши результаты могут быть искажены, если одни группы населения представлены лучше, чем другие.
- Пропорциональное распределение. Это включает выбор размера выборки, который пропорционален размеру каждой страты. Для этого используйте формулу nˬi = (n / N) Nˬi, где nˬi - размер выборки для отдельной страты, n - общий размер выборки, N - общий размер генеральной совокупности, а Nˬi - размер страты.
Шаг 4. Возьмите случайную выборку из каждого слоя
Используя выбранные вами размеры выборки, сгенерируйте случайную выборку для каждой страты. Вы можете сделать это с помощью лотереи или генератора случайных чисел. Полученные в результате выборки должны быть репрезентативными для различных слоев вашего населения.
Например, используя стратегию пропорционального распределения, если вы решили выбрать 100 улиток из группы из 500, вам нужно будет выбрать случайную выборку из 57 красных улиток, 13 синих улиток и 30 черных улиток
Метод 3 из 3: случайная кластерная выборка
Шаг 1. Используйте случайную кластерную выборку, когда другие методы нецелесообразны
Если вы имеете дело с огромной или широко рассредоточенной популяцией, простая или стратифицированная выборка может оказаться трудной или невозможной. В таких ситуациях вам нужно будет случайным образом выбрать для работы несколько небольших групп, которые, как мы надеемся, будут репрезентативными для всего населения.
- Например, если вы хотите провести исследование бездомных кошек в Чикаго, собрать данные обо всей популяции, вероятно, будет невозможно. В такой ситуации хорошо подойдет случайная выборка кластеров.
- Имейте в виду, что кластерная выборка не так надежна, как другие типы случайной выборки. Однако во многих ситуациях это наименее затратный и наиболее эффективный способ отбора проб.
Шаг 2. Разделите население на несколько групп, называемых кластерами
После того, как вы определили популяцию, с которой хотите работать, разделите ее на ряд удобных кластеров, для которых вы можете легко получить доступ к четко определенным рамкам выборки. Эти кластеры составят основу ваших данных выборки.
Например, для исследования бездомных кошек Чикаго вы можете разделить данные по отдельным районам, для которых у вас есть полные записи о местных бездомных популяциях
Шаг 3. Произведите случайную выборку кластеров
Решите, сколько кластеров вы хотите использовать для получения репрезентативной выборки, а затем используйте метод простой случайной выборки, чтобы выбрать это количество кластеров. Это предоставит группу образцов, из которой вы получите свои данные.
- Например, если у вас есть данные о бездомных кошках из 25 районов Чикаго, вы можете выбрать для изучения кошек 5 из этих групп.
- Используйте лотерею или генератор случайных чисел, чтобы выбрать, какие группы вы хотите изучать.
Шаг 4. Создайте набор данных для каждого человека в каждом кластере
Кластерная выборка отличается от других форм случайной выборки тем, что вы не отбираете людей из группы населения случайным образом. Вместо этого проанализируйте всю совокупность каждого кластера, чтобы получить результаты.
Кончик:
Когда вы выполняете кластерную выборку, вы обычно получите более точные результаты, если возьмете большее количество меньших кластеров. Однако выборка нескольких больших кластеров проще и эффективнее.