Способ оценивания общее правило для получения какого либо параметра по данным выборки
Способ оценивания общее правило для получения какого либо параметра по данным выборки
271. Спектральная плотность может принимать __________________ значения.
• только положительные
272. Спектральная плотность связана с интенсивностью согласно формуле
•
273. Спецификация запаздываний применительно к переменным в модели называется:
• лаговой структурой
274. Способ оценивания (estimator) — общее правило для получения __________________ какого-либо параметра по данным выборки.
• приближенного численного значения
275. СС(1)-процесс обратим при:
•
276. СС(2)-процесс обратим лишь при условии, что корни его характеристического уравнения лежат:
• вне единичного круга
277. Стандартное отклонение оценки b для параметра β вычисляется по формуле
•
278. Стандартное отклонение оценки а для параметра a вычисляется по формуле
•
279. Стандартное отклонение случайной величины характеризует среднее ожидаемое расстояние между наблюдениями этой случайной величины и ее:
• математическим ожиданием
280. Стандартные отклонения коэффициентов регрессии обратно пропорциональны величине __________________, где n — число наблюдений.
•
281. Стандартные ошибки, вычисленные при гетероскедастичности
• занижены по сравнению с истинными значениями
282. Статистика Дарбина-Уотсона проверяет нулевую гипотезу Но:
• отсутствие автокорреляции
283. Статистика для теста ранговой корреляции Спирмена имеет __________________ распределение.
• нормальное
284. Статистика критерия Дарбина-Уотсона вычисляется по формуле __________________, где ek — остатки в наблюдениях авторегрессионной схемы первого порядка.
•
Простыми словами о выборке
Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.
Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.
Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.
Выборка и репрезентативность
Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.
Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.
В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.
Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.
Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.
Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).
Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.
Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.
Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.
Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.
Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.
На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.
Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.
Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).
И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.
Что значит «достаточное» количество человек для выборки.
К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.
Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.
Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.
Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.
Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.
Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.
Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.
Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.
На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.
Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.
Методы отбора
В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.
Чтобы этого достичь можно использовать один из методов формирования выборки.
Случайные выборки
Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.
Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.
Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.
Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.
Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.
При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.
Неслучайные выборки
Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.
Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.
Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.
«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.
«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.
Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.
Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).
Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.
При проведении научных экспериментов невозможно проводить исследования по всей совокупности значений (генеральной совокупности), применение выборочных данных дает возможность экономии средств и затрат труда на получение и обработку информации. Объективную гарантию репрезентативности (представительности) полученной выборочной совокупности дает применение соответствующих научно обоснованных способов отбора подлежащих обследованию единиц.
Система правил отбора единиц и способов характеристики изучаемой совокупности исследуемых единиц составляет содержание выборочного метода.
Все единицы совокупности, обладающие интересующими исследователя признаками, составляют генеральную совокупность.
Число единиц (элементов) статистической совокупности называется ее объемом. Объем генеральной совокупности обозначается N, а объем выборочной совокупности – n.
Выборку называют репрезентативной (представительной), если она достаточно полно представляет изучаемые признаки и параметры генеральной совокупности. Для репрезентативности выборки важно обеспечить случайность отбора, с тем, чтобы все объекты генеральной совокупности имели равные вероятности попасть в выборку. Для обеспечения репрезентативности выборки применяют следующие способы отбора: простой отбор (последовательно отбирается первый, случайно попавшийся объект), типический отбор (объекты отбираются пропорционально представительству различных типов объектов в генеральной совокупности), случайный отбор – например, с помощью таблицы случайных чисел и т. п.
В эконометрике всегда известна только выборка из некоторого количества наблюдений случайной величины и по данным выборки можно рассчитать только выборочные, а не теоретические характеристики этой случайной величины
Проблема использования данных выборки для определения характеристик распределения может рассматриваться под разными углами зрения. Один из подходов называется оцениванием.
Пусть из генеральной совокупности извлекается выборка объемом п, причем значение признака х1 наблюдается т1 раз, х2 т2 раз. хк наблюдается тк раз, Мы можем сопоставить каждому значению хi относительную частоту тi/п.
Статистическим распределением выборки называется перечень возможных значений признака хi и соответствующих ему частот или относительных частот (частостей) mi (wi).
Числовые характеристики генеральной совокупости, как правило, неизвестные (средняя, дисперсия и др.), называются параметрами генеральной совокупности (обозначают, например, или
, у2 ген). Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долей и обозначается р.
По данным выборки рассчитывают числовые характеристики, которые называют статистиками (обозначают , или
, S2, выборочная доля обозначается w). Статистики, получаемые по различным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из выборки, является только оценкой неизвестного параметра генеральной совокупности. Оценка параметра — определенная числовая характеристика, полученная из выборки. Когда оценка определяется одним числом, ее называют точечной оценкой.
В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обоснование возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чисел и центральная предельная теорема Ляпунова.
4.1 Несмещенные, эффективные, состоятельные оценки
До сих пор мы предполагали, что имеется точная информация о рассматриваемой случайной переменной, в частности — об ее распределении вероятностей (в случае дискретной переменной) или о функции плотности распределения (в случае непрерывной переменной). С помощью этой информации можно рассчитать теоретическое математическое ожидание, дисперсию и любые другие характеристики, в которых мы можем быть заинтересованы.
Однако на практике, за исключением искусственно простых случайных величин (таких, как число выпавших очков при бросании игральной кости), мы не знаем точного вероятностного распределения или плотности распределения вероятностей. Это означает, что неизвестны также и теоретическое математическое ожидание, и дисперсия. Мы, тем не менее, можем нуждаться в оценках этих или других теоретических характеристик генеральной совокупности.
Процедура оценивания всегда одинакова. Берется выборка из п наблюдений, и с помощью подходящей формулы рассчитывается оценка нужной характеристики. Нужно следить за терминами, делая важное различие между способом или формулой оценивания и рассчитанным по ней для данной выборки числом, являющимся значением оценки.
Поскольку оценки являются случайными переменными, их значения лишь по случайному совпадению могут в точности равняться характеристикам генеральной совокупности. Обычно будет присутствовать определенная ошибка, которая может быть большой или малой, положительной или отрицательной, в зависимости от чисто случайных составляющих величин х в выборке.
Хотя это и неизбежно, на интуитивном уровне желательно, тем не менее, чтобы оценка в среднем за достаточно длительный период была аккуратной. Выражаясь формально, мы хотели бы, чтобы математическое ожидание оценки равнялось бы соответствующей характеристике генеральной совокупности. Если это так, то оценка называется несмещенной. Если это не так, то оценка называется смещенной.
Для начала рассмотрим простейший случай, а именно когда нашей целью является применение выборки данных для оценивания средней распределения. Чтобы конкретизировать задачу, предположим, что оценивается средний коэффициент умственного развития школьников. Мы получим выборку, состоящую из 5 значений коэффициента умственного развития: 90, 100, 105, 145, 100. Наша цель состоит в том, чтобы с помощью этих значений получить наилучшую оценку средней. Все возможные сведения сосредоточены в этих 5 числах. Возникает вопрос: а можем ли мы в этих условиях получить наилучшую оценку? Другими словами, какие процедуры мы должны произвести для оценивания среднего коэффициента умственного развития?
Мы получим ответ на этот вопрос, если вычислим средний коэффициент умственного развития как арифметическую среднюю всей выборки. Он равен 108 ( = 108). Отметим, что эта оценка является лишь приближением, полученным по данной выборке. При наличии другой выборки можно было бы получить иное приближение.
Следующий вопрос сложнее: почему мы используем в качестве оценки арифметическую среднюю, не лучше ли было бы вычислить, например, среднее значение между максимальным и минимальным элементами выборки? В этом случае оценка средней распределения равнялась бы 117,5.
Один из способов «выбора оценки» состоит в сравнении оценок, полученных на основе разных выборок из одной и той же совокупности (конечно, если мы в состоянии произвести такой эксперимент). Итак, предположим, что имеется 5 различных выборок значений коэффициента умственного развития. Наша цель состоит в том, чтобы, исходя из этих 5 выборок, оценить неизвестную среднюю распределения. В таблице 4.1 приводятся все 5 выборок и оценки их средних, вычисленные как арифметические средние значений выборки.
Среднее значение выборки ()
Предположим теперь, что мы должны ограничиться данными только первой выборки. Мы получим оценку для средней распределения, равную 108. Если бы мы имели только вторую выборку, то получили бы оценку средней, равную 107, для третьей — 113 и т. д. Средняя всех этих оценок средних равна 109, 6.
Рассмотрим, что произойдет, если мы будем увеличивать число выборок. С увеличением их числа будет расти число оценок средних и средняя этих оценок будет приближаться к истинной средней распределения. Предположим, например, что нами получено 5000 выборок; в этом случае средняя 5000 выборочных оценок средних отличалась бы от истинной средней не больше чем на 1/2 стандартного отклонения распределения.
Суммируя все вышесказанное, предположим, что средняя распределения оценена и что процедура оценивания представляет собой вычисление арифметической средней по всем случайным выборкам. Выборочная оценка средней, выведенная из одной выборки, может быть близка или не близка к истинному значению средней. Однако, чем больше мы имеем оценок для разных выборок, тем ближе средняя этих оценок к истинной средней распределения. Поэтому говорят, что арифметическая средняя дает оценку средней распределения, обладающую свойством несмещенности.
Более общее определение несмещенности формулируется так: оператор оценивания параметра обладает свойством несмещенности, если средняя выборочных оценок, получаемых из независимых случайных выборок, приближается к истинному значению параметра, когда число выборок неограниченно возрастает. Это определение, конечно, не предполагает, что каждая новая оценка будет все меньше отличаться от истинного значения параметра. Однако из определения следует, что при увеличении числа выборочных оценок их средняя имеет тенденцию приближаться к истинному значению параметра.
Теперь мы вернемся к проблеме вычисления несмещенной выборочной оценки для дисперсии распределения. Рассмотрим случай, когда средняя распределения также неизвестна. Воспользуемся данными предыдущего примера. Итак, мы изучаем распределение коэффициентов умственного развития для школьников. Теоретически это означает, что мы в состоянии перечислить значения коэффициента умственного развития из их неограниченной совокупности. Тогда мы скажем, что одно из возможных значений показателя из этого распределения равно 90, другое —100, третье — 105 и т. д. Первые 15 значений распределения приводятся в первом столбце таблице 4.2.
Вариацию для каждого значения распределения мы можем получить, вычитая из него величину истинной средней распределения. Предположим, что нам известна величина средней и что она равна 110 (м = 110). Разность между 15 выборочными значениями показателя и этой средней приводятся во втором столбце таблицы 4.2. Если бы мы были в состоянии вычислить аналогичные разности для всех возможных значений распределения, то сумма всех этих разностей равнялась бы нулю. Однако нас интересуют квадраты разностей, так как их средняя дает значение дисперсии. Квадраты разностей для 15 элементов рассматриваемого распределения приводятся в третьем столбце таблицы 4.2.
Таблица 4.2 – Вариации, вычисленные с помощью известной средней
Сумма квадратических отклонений для каждой выборки из пяти значений
Оценка статистических параметров по выборочным данным
Представление средней арифметической выборки приводится обязательно с ее ошибкой.
Ошибка дисперсии вычисляется путем возведения в квадрат ошибки среднеквадратической.
Каждому значению доверительной вероятности соответствует свой уровень значимости (α). Он выражает вероятность нулевой гипотезы: вероятность того, что выборочная и генеральная средние не отличаются друг от друга. Иначе говоря, чем выше уровень значимости, тем меньше можно доверять утверждению, что различия существуют, т. е., он показывает, какой процент вариант совокупности (выборок) отвергают искомую статистическую закономерность. Уровень значимости 5 % (0,05) дополняет доверительную вероятность 95 % (0,95). В сумме они составляют 100 % (1). Если доказано подобие между выборками при α = 5 % (0,05), то из этого следует, что до 5 % вариант выборки подобие не подтверждают. В таблицах приложения приводятся численные значения для Р или α соответственно 0,95 и 0,99; 0,05 и 0,01. В этих случаях при интерпретации мы можем утверждать нулевую гипотезу (Н0). При более высоких уровне вероятности 0,99 и уровне значимости 0,01 мы получаем сильный довод для утверждения нулевой гипотезы.
Проверка статистических гипотез. Методологической основой любого исследования является формулировка рабочей гипотезы. В ходе исследования рабочая гипотеза либо принимается, либо отвергается. Статистической называют гипотезу о виде неизвестного распределения или о параметре распределения. Примеры гипотез:
· генеральная совокупность распределяется по закону Пуассона;
· средние арифметические двух совокупностей не равны между собой;
· дисперсии двух совокупностей равны между собой.
Выдвинутую гипотезу называют основной или нулевой (Н0). Гипотезу, которая противоречит нулевой, называют конкурирующей или альтернативной (Н1). Если нулевая гипотеза предполагает, что М = 20, то логическим отрицанием будет М ≠ 15. Простая гипотеза содержит одно предположение, сложная – состоит из конечного или бесконечного множества простых гипотез. Выдвинутую гипотезу проверяют на правильность ее статистическими методами, т. е. проводят статистическую проверку. При проверке могут быть допущены ошибки двух родов.
Ошибка первого рода – отвергается правильная гипотеза. Вероятность совершить ошибку первого рода называют уровнем значимости (α). Это значит, что в 5 случаях из 100 мы рискуем допустить ошибку первого рода.
Ошибка второго рода – принимается неправильная гипотеза, значимость ошибки которой допускается 0,95 и обозначается символом Р. Это значит, что в 95 случаях из 100 мы рискуем допустить ошибку второго рода.
Для проверки нулевых гипотез используют статистические критерии. При сравнении дисперсий используют критерий Фишера. В большинстве исследований для статистической проверки гипотез существенности различий средних арифметических используют параметрический критерий Стьюдента. Если нулевая гипотеза принимается, это не означает ее доказательство. Доказать на основании однократной или косвенной проверки гипотезу нельзя, а опровергнуть можно. Для повышения точности статистических данных необходимо уменьшить вероятности ошибок первого и второго рода, увеличить объем выборок. Область применения того или иного критерия задается законом его распределения.
Оценка точности опыта. При исследованиях методического характера необходимо приводить их оценку по показателю точность опыта (р). Его смысл состоит в установлении величины ошибки среднего арифметического ( mM ) в процентах от величины среднего арифметического (М).
Опыт считается достаточно точным, если р Пример. Среднее арифметическое общей биомассы многолетних трав в луговом ландшафте прирусловой поймы М = 235 ц/г, ошибка средней арифметической m M = ± 4 ц/га, N = 20. Используя формулу (1.15), выполним расчет показателей:
р = (4 / 235) · 100 = 1,7 %.
Полученная величина точности опыта достаточно точная.