Для чего нужна выборка

Простыми словами о выборке

Для чего нужна выборка. Смотреть фото Для чего нужна выборка. Смотреть картинку Для чего нужна выборка. Картинка про Для чего нужна выборка. Фото Для чего нужна выборка

Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.

Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.

Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.

Для чего нужна выборка. Смотреть фото Для чего нужна выборка. Смотреть картинку Для чего нужна выборка. Картинка про Для чего нужна выборка. Фото Для чего нужна выборка

Выборка и репрезентативность

Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.

Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.

В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.

Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.

Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.

Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).

Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.

Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.

Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.

Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.

Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.

Для чего нужна выборка. Смотреть фото Для чего нужна выборка. Смотреть картинку Для чего нужна выборка. Картинка про Для чего нужна выборка. Фото Для чего нужна выборка

На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.

Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.

Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).

И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.

Что значит «достаточное» количество человек для выборки.

К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.

Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.

Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.

Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.

Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.

Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.

Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.

На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.

Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.

Методы отбора

В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.

Чтобы этого достичь можно использовать один из методов формирования выборки.

Случайные выборки

Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.

Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.

Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.

Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.

Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.

При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.

Неслучайные выборки

Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.

Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.

Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.

«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.

«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.

Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.

Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).

Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.

Источник

Зачем нужна выборка

Глава 2. ТЕОРИЯ И МЕТОДОЛОГИЯ ВЫБОРКИ

Большинство социологических исследований носит не сплош­ной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-де­мографическим признакам структуру изучаемого объекта. Такое исследование именуется выборочным.

Выборочное обследование представляет собой способ система­тического сбора данных о поведении и установках людей посред­ством опроса специально подобранной группы респондентов, да­ющих информацию о себе и своем мнении. Оно является более экономичным и не менее надежным методом, чем сплошное ис­следование, хотя требует более изощренной методики и техники.

Зачем нужна выборка

Правильная выборка — залог успеха и необходимая предпосыл­ка любого опроса, если это не общенациональная перепись насе­ления. Если социолог неправильно составил выборочную совокуп­ность, т.е. группу людей, которую собирается опросить, резуль­таты исследования окажутся неверными, а потому и никому не нужными.

Почему нерационально и практически невозможно опрашивать всех людей, составляющих объект исследования?

Можно приблизительно рассчитать, во что обойдется сплош­ной опрос взрослых жителей хотя бы одного городского района с численностью населения, скажем, 200 тыс. чел. Учитывая, что один анкетер (интервьюер) в состоянии опросить не более трех человек в час, при семичасовом рабочем дне его выработка составит порядка 20 анкет. Это означает, что для полного сбора пер­вичной информации нам потребуется 85 тыс. человеко-дней. Предположим, что мы намереваемся завершить опрос за 10 дней и заплатить за каждое интервью 20 руб. Таким образом, нам при­дется привлечь 8,5 тыс. помощников и заплатить им в общей слож­ности 340 тыс. руб. Какой бы важной ни была полученная инфор­мация, вряд ли она окупит столь огромные расходы, не говоря о прочих издержках. К прочим можно отнести, например, те день­ги, которые теряет предприниматель, разрешая социологам от­влечь для опроса пару-тройку сотен своих рабочих, которые в этот момент не создают материальной продукции и тем самым лиша­ют бизнесмена определенной части прибыли.

Вот почему практически всегда социологи прибегают к выбо­рочным методам опроса.

(Исключение составляют электоральные мероприятия (выборы) и всенародные опросы (референдумы). Однако нельзя забывать, что их проводит государство).

Суть выборочного метода заключается в том, что по определенным — довольно строгим — правилам из общей численности людей, так называемой генеральной совокуп­ности (население всей страны, все городское население, все жи­тели одного города или района, вся молодежь и т.п.), отбирается ограниченное число людей, которое призвано в качестве своеоб­разной модели воспроизводить структуру объекта. На языке со­циологов эта группа людей (равно как и процедура по ее опреде­лению) именуется выборкой.

Правильное построение выборочной совокупности — основа и гарантия высокой точности социологического исследования. Опрашивать всю генеральную совокупность, например всех нар­команов, физически невозможно, экономически невыгодно, а в научном плане бесполезно. Ученые давно заметили, что после известного количества анкет результаты начинают повторяться, выстраиваясь в определенные закономерности. Минимальным порогом служат обычно 20 анкет (для страховки социологи услов­но приняли цифру 50 — некий гарантированный объем выбороч­ной совокупности, которая позволяет ученому обнаружить общие тенденции). Если респонденты не очень сильно отличаются друг от друга, скажем, принадлежат к одной профессии, классу, полу, возрасту, то очень скоро в их ответах начинают просвечивать об­щие тенденции. К примеру, все 30-летние в основном женаты, редко меняют место работы и больше ориентированы на карьеру, чем 20-летние.

Выяснились и другие любопытные особенности. Скажем, чем проще вопросы, тем быстрее выявляются повторы. Чем меньше альтернатив (или, как еще говорят, закрытий) в анкетном опро­се, тем через меньшее число анкет начинают проступать общие тенденции. Таким образом, в простейшем случае, если социолог не ставит целью провести фундаментальное исследование с соблю­дением всех методических требований, ему лучше сконструиро­вать несложную анкету, сделать однородную выборку и охватить небольшое число респондентов. Обычно подобные исследования называют разведывательными, постановочными, зондажными.

Разумеется, всего этого недостаточно для широкомасштабно­го обследования, гетерогенной выборки, разнородной и громозд­кой анкеты либо для эмпирического подтверждения гипотезы, отвечающего всем требованиям научного канона. Но для пробного или, лучше сказать, постановочного исследования, где социолог не идет дальше постановки проблемы, этого вполне достаточно.

Итак, социологи отказались от сплошного исследования в пользу выборочного не только по финансовым, но и по научным соображениям. Поэтому мы должны себе сказать: собирать инфор­мацию обо всей популяции (или генеральной совокупности) не только невозможно, но часто и не нужно. Но в тех ситуациях, особенно в маркетинговом исследовании, где от социолога тре­буют точной информации о целой категории людей, например потребителях растворимого кофе, заказчик выделяет из своего кармана (по существу, отказывается от части прибыли) немалые деньги и исследовательская фирма рискует своим авторитетом, к выборочному опросу следует подходить по всем правилам, про­являть максимум ответственности, соблюдать все методические правила.

История свидетельствует, что когда нарушаются принципы случайной выборки и какой-то группе респондентов оказывается предпочтение — произвольно или непроизвольно, намеренно или в силу независящих от ученого обстоятельств, — происходит ка­тастрофа. Применение смещенной или неправильно составленной выборки специалисты любят демонстрировать на примере круп­ного скандала, случившегося в 1930-е гг. с журналом «Литэрари дайджест», организовавшим опрос общественного мнения отно­сительно результатов выборов. Как и любой другой дайджест, журнал в основном жил чужими материалами, перепечаткой га­зетных и журнальных статей, в данном случае посвященных оп­росам общественного мнения. Начиная с 1920 г. журнал стал за­ниматься организацией собственных опросов, в частности провел широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте были разосланы избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В тече­ние ряда лет результаты опроса, проводившегося журналом, ока­зывались настолько точными, что опрос, проведенный в сентяб­ре, казалось, делал ноябрьские выборы малосущественными. Да и как при такой большой выборке могла произойти ошибка? Од­нако в 1936 г. именно это и случилось: с большим перевесом го­лосов (60:40) победа была предсказана кандидату от республикан­ской партии Альфу Ландону. Однако когда выборы состоялись, он потерпел сокрушительное поражение. Иначе говоря, Ландон про­играл Франклину Д. Рузвельту практически с тем же результатом, с которым должен был победить. Доверие читателей к «Литэрари дайджест» было серьезно подорвано, вскоре журнал перестал вы­ходить. Такой оказалась цена методической ошибки.

Что же произошло? Все очень просто: в голосовании, прове­денном «Дайджест», использовалась смещенная выборка. Почто­вые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регист­рации автомобилей. И хотя прежде этот метод отбора не слиш­ком отличался от других методов, совсем по-другому обстояло дело теперь, после Великой депрессии в 1936 г., когда менее со­стоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомоби­ле. Таким образом, выборка, использовавшаяся в опросе, орга­низованном «Дайджест», была смещена в сторону тех, кто, ско­рее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта оказался такой хороший ре­зультат.

Выборочный метод имеет очевидные преимущества перед сплошным изучением генеральной совокупности, так как сокра­щает объем работы (за счет уменьшения числа наблюдений), по­зволяет экономить силы и средства, получать информацию о та­ких совокупностях, полное обследование которых практически невозможно или нецелесообразно. Но происходит все это лишь в том случае, если соблюдаются научные правила выборочного исследования.

Опыт показал, что правильно произведенная выборка доволь­но хорошо представляет или репрезентирует (от лат. represento — представляю) структуру и состояние генеральной совокупности. Однако полного совпадения выборочных данных с данными об­работки генеральной совокупности, как правило, не бывает. В этом и заключается недостаток выборочного метода, на фоне ко­торого видны преимущества сплошного описания генеральной совокупности.

Ввиду неполного отображения выборкой статистических харак­теристик (параметров) генеральной совокупности перед исследо­вателем возникает важная задача: во-первых, учитывать и соблю­дать те условия, при которых выборка наилучшим образом реп­резентирует генеральную совокупность, а во-вторых, в каждом конкретном случае устанавливать, с какой уверенностью можно перенести результаты выборочного наблюдения на всю генераль­ную совокупность, из которой выборка взята.

Репрезентативность выборки зависит от целого ряда условий, и прежде всего от того, как она осуществляется — или планомер­но (т.е. по заранее намеченной схеме), или путем непланомерно­го отбора элементов из генеральной совокупности. В любом слу­чае выборка должна быть типичной и вполне объективной. Эти требования должны выполняться неукоснительно как наиболее существенные условия репрезентативности выборки. Прежде чем обрабатывать выборочный материал, его нужно тщательно прове­рить и освободить выборку от всего лишнего, что нарушает усло­вия репрезентативности. В то же время при образовании выбор­ки нельзя поступать по произволу, включать в ее состав только те варианты, которые кажутся типичными, а все остальные брако­вать. Доброкачественная выборка должна быть объективной, т.е. производиться без предвзятых побуждений, при исключении субъективных влияний на ее состав. Выполнению этого условия репрезентативности отвечает принцип рандомизации (от англ. randomization), или случайного отбора элементов из генеральной совокупности. Этот принцип положен в основу теории выбороч­ного метода и должен соблюдаться во всех случаях образования репрезентативной выборочной совокупности, не исключая и слу­чаев планомерного или преднамеренного отбора.

2.2. Основные понятия и сущность выборочного метода

При построении социологической выборки используется мно­жество специальных терминов, в том числе два важнейших — ге­неральная и выборочная совокупности.

Совокупность, из которой отбираются варианты для совмест­ного изучения, называется генеральной, а отобранная из генераль­ной совокупности часть ее членов носит название выборки, или выборочной совокупности. Объем генеральной совокупности обо­значается символом N, а объем выборочной совокупности — и. Обычно эти символы размещают в заголовке таблице, которая получилась у социолога после анализа данных, либо в подлежа­щем таблицы.

Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая по­пуляцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого на­правлен теоретический интерес социолога (в том смысле, что уз­нать о каждом представителе генеральной совокупности ученый может только косвенно — на основе информации о выборочной совокупности).

В англоязычной литературе дословного аналога термину «реп­резентативность» не существует. Вместо него используется другой — «популяция» (population), который, как и русское слово «генераль­ная совокупность», имеет два значения. Первое — генеральная со­вокупность, т.е. все люди, на которых мы хотим распространить полученные в своем исследовании выводы и на которых направ­лен наш теоретический интерес. В англоязычных источниках так и пишут: «population of interest».

Второе значение — список людей, на основании которого со­ставляется позже выборочная совокупность. Их называют едини­цами наблюдения. Они считаются элементами генеральной сово­купности. Список единиц наблюдения, который нумеруется с использованием таблицы случайных чисел, в отечественной ли­тературе специального названия не имеет, как не имеет он тако­вого и в англоязычной социологии.

Выборкой называется совокупность элементов объекта социо­логического исследования, подлежащая непосредственному изу­чению. Понятие выборки в статистике и социологии рассматри­вается в двух значениях.

♦ Выборка (как результат действия) — представительная часть генеральной совокупности, в которой закон распределения при­знака соответствует закону распределения этого признака в гене­ральной совокупности.

♦ Выборка (как способ или процесс действия) — способ отбора объектов генеральной совокупности в выборочную.

Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).

(Подлежащим таблицы называется объект, который характеризует таблица при
помощи числовых данных).

Выборочная совокупность — уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых со­циолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно оп­росить. Представим, что предметом его исследования, т.е. темой, выступает экономическая активность пенсионеров. Все пенсионе­ры — пожилые люди в возрасте старше 55 (женщины) и 60 (муж­чины) лет — будут составлять генеральную совокупность. По спе­циальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тыс. пенсионеров. Это и станет его выборочной со­вокупностью.

Основное правило ее составления гласит: каждый элемент ге­неральной совокупности должен иметь одинаковые шансы попасть в выборку.Но как этого добиться? Прежде всего надо узнать как можно больше свойств, или параметров генеральной совокупно­сти, например разброс в возрасте, доходах, национальности, мес­тах проживания респондентов. Разброс в возрасте респондентов называется вариацией, конкретные величины возраста — значени­ями, а совокупность всех значений образует переменную.

Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0—5, 6—10, 11—15 лет и т.д. Их мож­но группировать иначе, все зависит от задач исследования. Ин­тервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.

Итак, совокупность людей, на которую вы распространяете свои выводы, называется генеральной совокупностью, популяцией, группой интереса (такое название происходит от направлен­ности теоретического интереса ученого).

Кого именно относить к генеральной совокупности, определя­ют цели исследования, а кого включать в выборочную совокуп­ность, решают математические методы. Если социолог намерева­ется взглянуть на Афганскую войну глазами ее участников, в ге­неральную совокупность войдут все воины-афганцы, но опрашивать придется небольшую часть — выборочную совокуп­ность. Для того чтобы выборка точно отражала генеральную со­вокупность, социолог придерживается правила: любой воин-аф­ганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, возможно, затрудняющих его поиск, должен иметь одинаковую вероятность попасть в выбороч­ную совокупность.

Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам эле­ментов — об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выбороч­ного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.

Репрезентативной выборкой в социологии считается такая вы­борочная совокупность, основные характеристики которой полно­стью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупно­сти. Только для этого типа выборки результаты обследования час­ти единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентатив­ной выборки — наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

Пол репрезентативностью в социологии понимают такие свой­ства выборки, которые позволяют ей выступать на момент опро­са моделью, представителем 6 генеральной совокупности. Иными словами, репрезентативная выборка представляет собой микро­косм, меньшую по размеру, но точную модель генеральной сово­купности, которую она должна отражать (по значимым для иссле­дования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исход­ной совокупности. Такое распространение результатов в зарубеж­ной литературе называют генерализуемостью.

Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным призна­кам не превышает 5%. Практика работы социологов позволяет с достаточной надежностью проводить репрезентативные опросы, руководствуясь элементарными правилами. При пилотажном оп­росе небольшой генеральной совокупности (например, в рамках факультета численностью до 100—250 чел.) репрезентативным бу­дет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25% от общего числа студентов.

Как только социолог определился с тем, кого он хочет опро­сить, он определил основу выборки. После чего решается вопрос отипе выборки.

Типами выборки называются основные разновидности статисти­ческой выборки: случайная (вероятностная) и неслучайная (неве­роятностная). Вместо термина «тип выборки» часто употребляют слова «вид» и «разновидность», что также правильно. Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.

Методом выборки будем называть способ построения того типа выборки, название которого этот метод носит, например метод вероятностной выборки. В социологии методом называют основ­ной способ сбора, обработки или анализа данных; правила и про­цедуры, с помощью которых устанавливается связь между факта­ми, гипотезами и теориями.

Для каждого типа выборки разработаны свои математические аппараты и процедуры. Так, в простой случайной выборке все элементы из списка людей, составляющих основу выборки, про­нумеровываются и с помощью таблицы случайных чисел из них отбирается искомая совокупность.

Для обеспечения репрезентативности требуется полный и точ­ный перечень единиц выборочной совокупности. Этот перечень образует основу выборки. Элементы, предназначенные для отбора, называются единицами отбора. Элемент генеральной совокупно­сти, с которого непосредственно ведется сбор информации, на­зывается единицей наблюдения. Обычно единица наблюдения — это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя часто применяется квазислучайный метод, когда из перечня просто­го берется каждый n-й элемент.

Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группировку, отражающую процентное распределение генеральной совокупности по каким-то важным признакам, например распределение индивидов по профессии, квалификации, полу или возрасту.

Структура выборки процентные пропорции признаков объекта, на основании которых составляется выборочная совокуп­ность.

Если в генеральной совокупности, например, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные про­порции трех возрастов. К возрастам могут добавиться классы, пол, национальности и т.д. Для каждого признака устанавливаются процентные пропорции в генеральной и выборочной совокупно­стях. Расхождение структуры двух совокупностей ведет к ошибке репрезентативности. Таким образом, структура выборки— процент­ные пропорции признаков объекта, на основании которых состав­ляется выборочная совокупность.

Если тип выборки говорит о том, как попадают люди в выбо­рочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда.

В программе эмпирического исследования тщательно описыва­ется проект выборки, который в последующем может уточняться. В проекте выборки указываются принципы выделения из объекта той совокупности людей (либо иных источников информации), которые впоследствии будут охвачены опросом; обосновывается техника проведения опроса; указываются подходы к определению достоверности полученной информации (это необходимо для того, чтобы удостовериться в степени правомерности распространения полученных выводов на весь объект исследования).

Составление выборки — процесс выбора единиц (людей, орга­низаций и т.п.) из интересующей социолога генеральной совокуп­ности с таким условием, чтобы, проведя свое исследование, уче­ный мог обобщить полученные результаты снова на всю генераль­ную совокупность, из которой осуществлялась выборка.

Составление выборки — очень сложная процедура, включаю­щая множество действий и этапов, на каждом из которых социо­лог может допустить ошибку. Ранняя ошибка порождает после­дующие, нарастает снежный ком искаженной информации, кото­рый способен парализовать исследование или свести его ценность к нулю. Цепочка ошибок, сделанных самим ученым, либо одна из них называется систематической ошибкой. Например, даже если вы четко определились с генеральной совокупностью, очень слож­но установить, сколько именно человек ее составляют. Или пред­положим, социолог установил общую численность генеральной совокупности, но он никак не может составить список лиц, пред­ставляющих собой основу выборочной совокупности. Если и эта трудность устранена, возникает новая: из списка подлежащих оп­росу лиц далеко не все доступны опросу. Если все респонденты готовы подвергнуться испытанию, то и в этом случае никто не даст гарантии, что они в последний момент не откажутся, дадут истин­ные сведения, что на их мнение никто не повлияет и т.п. Таким образом, социологический опрос превращается в рисковый биз­нес, где ученого подстерегает множество трудностей, неожидан­ностей и неприятностей. И все надо уметь преодолевать.

Высшей пробой профессионально выполненной работы служит то обстоятельство, что социолог из одной и той же генеральной совокупности может сделать две или три выборки, которые, бу­дучи разными по составу респондентов, дают одинаковые стати­стические распределения ответов. Если в первой выборке от 60 до 70% респондентов не удовлетворены трудом, то и в трех других процент неудовлетворенных должен быть таким же. Если это так, то вы сделали правильную выборку.

В практике эмпирических исследований широко употребляет­ся понятие целевой выборки. Целевые выборки — группы физичес­ких или юридических лиц, отвечающие одному или нескольким определенным критериям, устанавливаемым ученым при органи­зации исследования. Респонденты в целевую группу отбираются на основании фильтрующих вопросов, которые и позволяют оп­ределить соответствие этим критериям. Например, при исследо­ваниях среди населения критерием отбора в целевую выборку может являться уровень доходов свыше 5 тыс. руб., использова­ние компьютера не реже трех раз в неделю, наличие дома быто­вой техники определенной марки. Критерии отбора зависят от задач исследования.

Выборка в количественном и качественном исследованиях стро­ится на противоположных принципах. В первом случае она явля­ется статистической и основана на поиске гомогенной группы респондентов, совпадающих по главным признакам (например, возраст, пол, класс). Во втором случае стремятся найти непохо­жих людей, сделать группу респондентов гетерогенной; выбор нового респондента, объекта или ситуации происходит по прин­ципу их противоположности и вариативности. Избегая однород­ности (гомогенности) выборочной совокупности, ученые таким способом стараются отразить как можно больше аспектов изучае­мого явления, осветить его с разных сторон, добиваясь комплек­сного и всестороннего изучения. Выборка в качественном иссле­довании называется теоретической.

Численность выборочной совокупности варьируется здесь в диапазоне от 20 до 50 единиц. Строгих количественных парамет­ров не существует — они зависят от задач исследования. Правда, негласно социологи используют определенный верхний предел — порог насыщения, который достигается, когда каждое последую­щее интервью не привносит в изучаемое явление никакого раз­нообразия, но лишь повторяет данные предыдущих интервью.

Это не только порог насыщения, но и точка расхождения двух стратегий. Представители количественной методологии радуют­ся тому моменту, когда каждое последующее интервью начинает повторять предыдущее. С этой точки открываются захватывающие перспективы, как вид из окна, — социолог предчувствует появле­ние тенденции, а возможно, и статистической закономерности. А вот его сопернику тенденции и статистика не нужны. Он ищет несхожесть, разнообразие, неповторяемость.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *