Для чего нужна выборка
Простыми словами о выборке
Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.
Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.
Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.
Выборка и репрезентативность
Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.
Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.
В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.
Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.
Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.
Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).
Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.
Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.
Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.
Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.
Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.
На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.
Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.
Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).
И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.
Что значит «достаточное» количество человек для выборки.
К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.
Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.
Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.
Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.
Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.
Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.
Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.
Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.
На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.
Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.
Методы отбора
В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.
Чтобы этого достичь можно использовать один из методов формирования выборки.
Случайные выборки
Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.
Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.
Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.
Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.
Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.
При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.
Неслучайные выборки
Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.
Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.
Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.
«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.
«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.
Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.
Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).
Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.
Зачем нужна выборка
Глава 2. ТЕОРИЯ И МЕТОДОЛОГИЯ ВЫБОРКИ
Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование именуется выборочным.
Выборочное обследование представляет собой способ систематического сбора данных о поведении и установках людей посредством опроса специально подобранной группы респондентов, дающих информацию о себе и своем мнении. Оно является более экономичным и не менее надежным методом, чем сплошное исследование, хотя требует более изощренной методики и техники.
Зачем нужна выборка
Правильная выборка — залог успеха и необходимая предпосылка любого опроса, если это не общенациональная перепись населения. Если социолог неправильно составил выборочную совокупность, т.е. группу людей, которую собирается опросить, результаты исследования окажутся неверными, а потому и никому не нужными.
Почему нерационально и практически невозможно опрашивать всех людей, составляющих объект исследования?
Можно приблизительно рассчитать, во что обойдется сплошной опрос взрослых жителей хотя бы одного городского района с численностью населения, скажем, 200 тыс. чел. Учитывая, что один анкетер (интервьюер) в состоянии опросить не более трех человек в час, при семичасовом рабочем дне его выработка составит порядка 20 анкет. Это означает, что для полного сбора первичной информации нам потребуется 85 тыс. человеко-дней. Предположим, что мы намереваемся завершить опрос за 10 дней и заплатить за каждое интервью 20 руб. Таким образом, нам придется привлечь 8,5 тыс. помощников и заплатить им в общей сложности 340 тыс. руб. Какой бы важной ни была полученная информация, вряд ли она окупит столь огромные расходы, не говоря о прочих издержках. К прочим можно отнести, например, те деньги, которые теряет предприниматель, разрешая социологам отвлечь для опроса пару-тройку сотен своих рабочих, которые в этот момент не создают материальной продукции и тем самым лишают бизнесмена определенной части прибыли.
Вот почему практически всегда социологи прибегают к выборочным методам опроса.
(Исключение составляют электоральные мероприятия (выборы) и всенародные опросы (референдумы). Однако нельзя забывать, что их проводит государство).
Суть выборочного метода заключается в том, что по определенным — довольно строгим — правилам из общей численности людей, так называемой генеральной совокупности (население всей страны, все городское население, все жители одного города или района, вся молодежь и т.п.), отбирается ограниченное число людей, которое призвано в качестве своеобразной модели воспроизводить структуру объекта. На языке социологов эта группа людей (равно как и процедура по ее определению) именуется выборкой.
Правильное построение выборочной совокупности — основа и гарантия высокой точности социологического исследования. Опрашивать всю генеральную совокупность, например всех наркоманов, физически невозможно, экономически невыгодно, а в научном плане бесполезно. Ученые давно заметили, что после известного количества анкет результаты начинают повторяться, выстраиваясь в определенные закономерности. Минимальным порогом служат обычно 20 анкет (для страховки социологи условно приняли цифру 50 — некий гарантированный объем выборочной совокупности, которая позволяет ученому обнаружить общие тенденции). Если респонденты не очень сильно отличаются друг от друга, скажем, принадлежат к одной профессии, классу, полу, возрасту, то очень скоро в их ответах начинают просвечивать общие тенденции. К примеру, все 30-летние в основном женаты, редко меняют место работы и больше ориентированы на карьеру, чем 20-летние.
Выяснились и другие любопытные особенности. Скажем, чем проще вопросы, тем быстрее выявляются повторы. Чем меньше альтернатив (или, как еще говорят, закрытий) в анкетном опросе, тем через меньшее число анкет начинают проступать общие тенденции. Таким образом, в простейшем случае, если социолог не ставит целью провести фундаментальное исследование с соблюдением всех методических требований, ему лучше сконструировать несложную анкету, сделать однородную выборку и охватить небольшое число респондентов. Обычно подобные исследования называют разведывательными, постановочными, зондажными.
Разумеется, всего этого недостаточно для широкомасштабного обследования, гетерогенной выборки, разнородной и громоздкой анкеты либо для эмпирического подтверждения гипотезы, отвечающего всем требованиям научного канона. Но для пробного или, лучше сказать, постановочного исследования, где социолог не идет дальше постановки проблемы, этого вполне достаточно.
Итак, социологи отказались от сплошного исследования в пользу выборочного не только по финансовым, но и по научным соображениям. Поэтому мы должны себе сказать: собирать информацию обо всей популяции (или генеральной совокупности) не только невозможно, но часто и не нужно. Но в тех ситуациях, особенно в маркетинговом исследовании, где от социолога требуют точной информации о целой категории людей, например потребителях растворимого кофе, заказчик выделяет из своего кармана (по существу, отказывается от части прибыли) немалые деньги и исследовательская фирма рискует своим авторитетом, к выборочному опросу следует подходить по всем правилам, проявлять максимум ответственности, соблюдать все методические правила.
История свидетельствует, что когда нарушаются принципы случайной выборки и какой-то группе респондентов оказывается предпочтение — произвольно или непроизвольно, намеренно или в силу независящих от ученого обстоятельств, — происходит катастрофа. Применение смещенной или неправильно составленной выборки специалисты любят демонстрировать на примере крупного скандала, случившегося в 1930-е гг. с журналом «Литэрари дайджест», организовавшим опрос общественного мнения относительно результатов выборов. Как и любой другой дайджест, журнал в основном жил чужими материалами, перепечаткой газетных и журнальных статей, в данном случае посвященных опросам общественного мнения. Начиная с 1920 г. журнал стал заниматься организацией собственных опросов, в частности провел широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте были разосланы избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившегося журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как при такой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. Однако когда выборы состоялись, он потерпел сокрушительное поражение. Иначе говоря, Ландон проиграл Франклину Д. Рузвельту практически с тем же результатом, с которым должен был победить. Доверие читателей к «Литэрари дайджест» было серьезно подорвано, вскоре журнал перестал выходить. Такой оказалась цена методической ошибки.
Что же произошло? Все очень просто: в голосовании, проведенном «Дайджест», использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, после Великой депрессии в 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, выборка, использовавшаяся в опросе, организованном «Дайджест», была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта оказался такой хороший результат.
Выборочный метод имеет очевидные преимущества перед сплошным изучением генеральной совокупности, так как сокращает объем работы (за счет уменьшения числа наблюдений), позволяет экономить силы и средства, получать информацию о таких совокупностях, полное обследование которых практически невозможно или нецелесообразно. Но происходит все это лишь в том случае, если соблюдаются научные правила выборочного исследования.
Опыт показал, что правильно произведенная выборка довольно хорошо представляет или репрезентирует (от лат. represento — представляю) структуру и состояние генеральной совокупности. Однако полного совпадения выборочных данных с данными обработки генеральной совокупности, как правило, не бывает. В этом и заключается недостаток выборочного метода, на фоне которого видны преимущества сплошного описания генеральной совокупности.
Ввиду неполного отображения выборкой статистических характеристик (параметров) генеральной совокупности перед исследователем возникает важная задача: во-первых, учитывать и соблюдать те условия, при которых выборка наилучшим образом репрезентирует генеральную совокупность, а во-вторых, в каждом конкретном случае устанавливать, с какой уверенностью можно перенести результаты выборочного наблюдения на всю генеральную совокупность, из которой выборка взята.
Репрезентативность выборки зависит от целого ряда условий, и прежде всего от того, как она осуществляется — или планомерно (т.е. по заранее намеченной схеме), или путем непланомерного отбора элементов из генеральной совокупности. В любом случае выборка должна быть типичной и вполне объективной. Эти требования должны выполняться неукоснительно как наиболее существенные условия репрезентативности выборки. Прежде чем обрабатывать выборочный материал, его нужно тщательно проверить и освободить выборку от всего лишнего, что нарушает условия репрезентативности. В то же время при образовании выборки нельзя поступать по произволу, включать в ее состав только те варианты, которые кажутся типичными, а все остальные браковать. Доброкачественная выборка должна быть объективной, т.е. производиться без предвзятых побуждений, при исключении субъективных влияний на ее состав. Выполнению этого условия репрезентативности отвечает принцип рандомизации (от англ. randomization), или случайного отбора элементов из генеральной совокупности. Этот принцип положен в основу теории выборочного метода и должен соблюдаться во всех случаях образования репрезентативной выборочной совокупности, не исключая и случаев планомерного или преднамеренного отбора.
2.2. Основные понятия и сущность выборочного метода
При построении социологической выборки используется множество специальных терминов, в том числе два важнейших — генеральная и выборочная совокупности.
Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки, или выборочной совокупности. Объем генеральной совокупности обозначается символом N, а объем выборочной совокупности — и. Обычно эти символы размещают в заголовке таблице, которая получилась у социолога после анализа данных, либо в подлежащем таблицы.
Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно — на основе информации о выборочной совокупности).
В англоязычной литературе дословного аналога термину «репрезентативность» не существует. Вместо него используется другой — «популяция» (population), который, как и русское слово «генеральная совокупность», имеет два значения. Первое — генеральная совокупность, т.е. все люди, на которых мы хотим распространить полученные в своем исследовании выводы и на которых направлен наш теоретический интерес. В англоязычных источниках так и пишут: «population of interest».
Второе значение — список людей, на основании которого составляется позже выборочная совокупность. Их называют единицами наблюдения. Они считаются элементами генеральной совокупности. Список единиц наблюдения, который нумеруется с использованием таблицы случайных чисел, в отечественной литературе специального названия не имеет, как не имеет он такового и в англоязычной социологии.
Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях.
♦ Выборка (как результат действия) — представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности.
♦ Выборка (как способ или процесс действия) — способ отбора объектов генеральной совокупности в выборочную.
Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).
(Подлежащим таблицы называется объект, который характеризует таблица при
помощи числовых данных).
Выборочная совокупность — уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т.е. темой, выступает экономическая активность пенсионеров. Все пенсионеры — пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет — будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тыс. пенсионеров. Это и станет его выборочной совокупностью.
Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку.Но как этого добиться? Прежде всего надо узнать как можно больше свойств, или параметров генеральной совокупности, например разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией, конкретные величины возраста — значениями, а совокупность всех значений образует переменную.
Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0—5, 6—10, 11—15 лет и т.д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.
Итак, совокупность людей, на которую вы распространяете свои выводы, называется генеральной совокупностью, популяцией, группой интереса (такое название происходит от направленности теоретического интереса ученого).
Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность, решают математические методы. Если социолог намеревается взглянуть на Афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать придется небольшую часть — выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, возможно, затрудняющих его поиск, должен иметь одинаковую вероятность попасть в выборочную совокупность.
Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов — об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.
Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки — наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.
Пол репрезентативностью в социологии понимают такие свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем 6 генеральной совокупности. Иными словами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать (по значимым для исследования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Такое распространение результатов в зарубежной литературе называют генерализуемостью.
Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5%. Практика работы социологов позволяет с достаточной надежностью проводить репрезентативные опросы, руководствуясь элементарными правилами. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100—250 чел.) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25% от общего числа студентов.
Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки. После чего решается вопрос отипе выборки.
Типами выборки называются основные разновидности статистической выборки: случайная (вероятностная) и неслучайная (невероятностная). Вместо термина «тип выборки» часто употребляют слова «вид» и «разновидность», что также правильно. Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.
Методом выборки будем называть способ построения того типа выборки, название которого этот метод носит, например метод вероятностной выборки. В социологии методом называют основной способ сбора, обработки или анализа данных; правила и процедуры, с помощью которых устанавливается связь между фактами, гипотезами и теориями.
Для каждого типа выборки разработаны свои математические аппараты и процедуры. Так, в простой случайной выборке все элементы из списка людей, составляющих основу выборки, пронумеровываются и с помощью таблицы случайных чисел из них отбирается искомая совокупность.
Для обеспечения репрезентативности требуется полный и точный перечень единиц выборочной совокупности. Этот перечень образует основу выборки. Элементы, предназначенные для отбора, называются единицами отбора. Элемент генеральной совокупности, с которого непосредственно ведется сбор информации, называется единицей наблюдения. Обычно единица наблюдения — это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя часто применяется квазислучайный метод, когда из перечня простого берется каждый n-й элемент.
Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группировку, отражающую процентное распределение генеральной совокупности по каким-то важным признакам, например распределение индивидов по профессии, квалификации, полу или возрасту.
Структура выборки — процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.
Если в генеральной совокупности, например, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов. К возрастам могут добавиться классы, пол, национальности и т.д. Для каждого признака устанавливаются процентные пропорции в генеральной и выборочной совокупностях. Расхождение структуры двух совокупностей ведет к ошибке репрезентативности. Таким образом, структура выборки— процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.
Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда.
В программе эмпирического исследования тщательно описывается проект выборки, который в последующем может уточняться. В проекте выборки указываются принципы выделения из объекта той совокупности людей (либо иных источников информации), которые впоследствии будут охвачены опросом; обосновывается техника проведения опроса; указываются подходы к определению достоверности полученной информации (это необходимо для того, чтобы удостовериться в степени правомерности распространения полученных выводов на весь объект исследования).
Составление выборки — процесс выбора единиц (людей, организаций и т.п.) из интересующей социолога генеральной совокупности с таким условием, чтобы, проведя свое исследование, ученый мог обобщить полученные результаты снова на всю генеральную совокупность, из которой осуществлялась выборка.
Составление выборки — очень сложная процедура, включающая множество действий и этапов, на каждом из которых социолог может допустить ошибку. Ранняя ошибка порождает последующие, нарастает снежный ком искаженной информации, который способен парализовать исследование или свести его ценность к нулю. Цепочка ошибок, сделанных самим ученым, либо одна из них называется систематической ошибкой. Например, даже если вы четко определились с генеральной совокупностью, очень сложно установить, сколько именно человек ее составляют. Или предположим, социолог установил общую численность генеральной совокупности, но он никак не может составить список лиц, представляющих собой основу выборочной совокупности. Если и эта трудность устранена, возникает новая: из списка подлежащих опросу лиц далеко не все доступны опросу. Если все респонденты готовы подвергнуться испытанию, то и в этом случае никто не даст гарантии, что они в последний момент не откажутся, дадут истинные сведения, что на их мнение никто не повлияет и т.п. Таким образом, социологический опрос превращается в рисковый бизнес, где ученого подстерегает множество трудностей, неожиданностей и неприятностей. И все надо уметь преодолевать.
Высшей пробой профессионально выполненной работы служит то обстоятельство, что социолог из одной и той же генеральной совокупности может сделать две или три выборки, которые, будучи разными по составу респондентов, дают одинаковые статистические распределения ответов. Если в первой выборке от 60 до 70% респондентов не удовлетворены трудом, то и в трех других процент неудовлетворенных должен быть таким же. Если это так, то вы сделали правильную выборку.
В практике эмпирических исследований широко употребляется понятие целевой выборки. Целевые выборки — группы физических или юридических лиц, отвечающие одному или нескольким определенным критериям, устанавливаемым ученым при организации исследования. Респонденты в целевую группу отбираются на основании фильтрующих вопросов, которые и позволяют определить соответствие этим критериям. Например, при исследованиях среди населения критерием отбора в целевую выборку может являться уровень доходов свыше 5 тыс. руб., использование компьютера не реже трех раз в неделю, наличие дома бытовой техники определенной марки. Критерии отбора зависят от задач исследования.
Выборка в количественном и качественном исследованиях строится на противоположных принципах. В первом случае она является статистической и основана на поиске гомогенной группы респондентов, совпадающих по главным признакам (например, возраст, пол, класс). Во втором случае стремятся найти непохожих людей, сделать группу респондентов гетерогенной; выбор нового респондента, объекта или ситуации происходит по принципу их противоположности и вариативности. Избегая однородности (гомогенности) выборочной совокупности, ученые таким способом стараются отразить как можно больше аспектов изучаемого явления, осветить его с разных сторон, добиваясь комплексного и всестороннего изучения. Выборка в качественном исследовании называется теоретической.
Численность выборочной совокупности варьируется здесь в диапазоне от 20 до 50 единиц. Строгих количественных параметров не существует — они зависят от задач исследования. Правда, негласно социологи используют определенный верхний предел — порог насыщения, который достигается, когда каждое последующее интервью не привносит в изучаемое явление никакого разнообразия, но лишь повторяет данные предыдущих интервью.
Это не только порог насыщения, но и точка расхождения двух стратегий. Представители количественной методологии радуются тому моменту, когда каждое последующее интервью начинает повторять предыдущее. С этой точки открываются захватывающие перспективы, как вид из окна, — социолог предчувствует появление тенденции, а возможно, и статистической закономерности. А вот его сопернику тенденции и статистика не нужны. Он ищет несхожесть, разнообразие, неповторяемость.