Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Часто задаваемые вопросы

 

 
Вопрос: Насколько выборка RLMS-HSE репрезентативна по регионам России?

Ответ: В соответствии с задачами обследования выборка РМЭЗ НИУ ВШЭ репрезентативна для Российской Федерации в целом. Для регионов в силу малого объема выборки в каждом регионе выборка РМЭЗ НИУ ВШЭ репрезентативной не является. Более подробно об этом можно прочитать в разделе описания выборки.

Вопрос: Для чего используется полная выборка? Могу ли я использовать ее для наполнения малопредставленных групп?

Ответ: Вряд ли существует задача, для которой нужно использовать всех опрошенных респондентов. Для получения информации о России в целом на момент проведения опроса нужно использовать данные только репрезентативной выборки. Полный массив нужен для того, чтобы из него дополнять репрезентативные данные какой-либо определенной волны данными строго этих же людей в любые другие волны.

Выборка RLMS-HSE - адресная, а не персональная. В 1994 году был создан перечень адресов, по которым каждый год проводится опрос фактически проживающих в этих жилищах на момент опроса людей. При этом люди, проживающие по адресам репрезентативной выборки (и только они), репрезентируют всё население России на момент каждого опроса.

Кроме жителей адресов репрезентативной выборки, начиная с 1995 года, в каждой волне при наличии такой возможности опрашиваются также и участники предыдущих волн, которые ранее проживали по адресам репрезентативной выборки, но переехали на новое место жительства. Эти люди больше не являются частью выборки, способной характеризовать население России в целом (за них Россию характеризуют те, кто в данный момент проживает по адресу репрезентативной выборки). Но они ценны для нас тем, что позволяют отслеживать изменения, происходящие со временем.

Пример: в 1994 году было опрошено общежитие, в 1996 году эти люди закончили ВУЗ и переехали из этого общежития. В общежитии вместо них опрашиваются другие, вновь поступившие. Но многих ранее опрошенных, которые уже выехали из этого общежития, мы смогли найти по их новым адресам. Так вот, полная выборка включает и тех, кто живет в общежитии в момент опроса, и тех, кто там жил когда-либо в течение всех предыдущих лет опросов (например, в 2015 году - всех за 20 предшествующих лет!).

Поэтому, хотя наполнение репрезентативного массива, несомненно, меньше, чем полного, использовать полный массив с целью последующего обобщения результатов на генеральную совокупность нельзя.

Вопрос: Как сформировать массив для проведения панельного анализа, результаты которого будут репрезентативны?

Ответ: Сначала необходимо определить, какая волна будет для данной панели базовой (чаще всего самая ранняя или самая поздняя). Для проведения панельного анализа следует использовать репрезентативную выборку базовой волны панели. Именно эта волна дополняется информацией о ее респондентах из данных других волн.

Например, для анализа изменений показателя с1995 по 2015 годы можно сформировать такие массивы:

массив "1)" = репрезентативный массив 1995 г. - дополненный данными из полной выборки 2000, 2005, 2010 и 2015 гг. для этих респондентов;
массив "2)" = репрезентативный массив 2000 г. - дополненный данными из полной выборки 2005, 2010 и 2015 гг. для этих респондентов;
массив "3)" = репрезентативный массив 2005 г. - дополненный данными из полной выборки 2010 и 2015 гг. для этих респондентов
массив "4)" = репрезентативный массив 2010 г. - дополненный данными из полной выборки 2015 г. для этих респондентов.

Тогда выводы, полученные на любом из этих 4-х массивов, будут характеризовать население России в целом:

массив "1)" - о том, что происходило с теми, кто был "Россией 1995 г." через каждые 5 лет до 2015 г включительно;
массив "2)" - о том, что происходило с теми, кто был "Россией 2000 г." через каждые 5 лет до 2015 г. включительно; и так далее.

В этом примере в качестве базовой выступает самая ранняя волна. Возможно также формировать массивы в обратную сторону, "назад в прошлое" - тогда базовой будет самая поздняя волна.

Для того, чтобы дополнить индивидуальный массив любой волны данными любой другой волны, у каждого респондента есть номер IDIND- уникальный номер индивида для всех волн. Во всех волнах у одного и того же человека значение в переменной IDIND одно и то же. Отсортировав массив любой волны по IDIND, его можно объединить с массивом любой другой волны, также отсортированным по IDIND. Тогда информация из последующей волны дополнит информацию именно этого человека из предыдущей волны.

Вопрос: Где я могу найти информацию по недостижимости для RLMS-HSE?

Ответ: см. раздел "Качество данных".


Вопрос:
Как можно узнать название регионов под номерами 192 и 193?

Ответ: Территориальные единицы под номерами 192 и 193 являются частью выборки города Москва. Подробнее см. в разделе "Модель выборки".


Вопрос: Почему в данных по индивидам никогда не меняется регион?

Ответ: Если семья – целиком или ее часть, которая отделилась, переехала в пределах региона, и тем более одного населенного пункта, и у нас есть ее адрес, мы всегда стараемся ее найти и опросить. Как раз из таких семей и складывается дополнение репрезентативной выборки для панельного анализа. Если же семья уезжает в другие регионы, которые не входят в состав нашей выборки, мы ее больше не опрашиваем. Это основная причина, по которой все переехавшие семьи имеют тот же номер региона – они по прежнему проживают в том же регионе, чаще всего в том же населенном пункте.


Вопрос:
Встречались ли случаи сноса жилищ, входящих в выборку? Если да, то как при этом адаптировалась выборочная совокупность?

Ответ: В местах сноса старых жилищ, в которых проживали наши респонденты, мы заменяли снесенное здание новым, построенным на его месте, и включали в выборку жильцов нового дома. Для них не создавалось отдельной переменной, поскольку новые домохозяйства отбирались по той же процедуре, что и все остальные домохозяйства, т.е. систематически отбирались из списка жилищ на участке. Участники РМЭЗ НИУ ВШЭ, переехавшие из снесенных домов в другие дома, по возможности также опрашивались, но уже не как часть репрезентативной выборки, а как часть панели.

Вопрос: На основании чего переменной «_origsm» присваивается значение «1»? Может ли быть так, что в одной волне респондент имеет «_origsm =1», а в другой волне – «_origsm =0»? Что это означает?

Ответ: Переменная «*_origsm» получает значение «1» в том случае, если в данной волне семья опрошена по адресу репрезентативной выборки.

Переменная «*_origsm» получает значение «0» в том случае, когда семья переехала с адреса репрезентативной выборки (где была опрошена первоначально) и была опрошена по этому адресу вне репрезентативной выборки. Также «*_origsm=0» получают отделившиеся части ранее опрошенных семей независимо от места их фактического проживания, т.к. в репрезентативной выборке в каждой волне должна быть только 1 семья с каждого адреса.

Наблюдения с «*_origsm=0» не входят в массив репрезентативной выборки данной волны, но дополняют данные репрезентативной выборки при анализе панельных данных.

Для получения репрезентативной информации по любой из волн необходимо проводить анализ только среди наблюдений с «*_origsm=1». 

Если в массиве данных один и тот же человек (т.е. имеющий один IDIND) сменил значение переменной «*_origsm» с 1 на 0 в разные волны, это означает, что он переехал с первоначального адреса репрезентативной выборки и был опрошен по другому адресу (вне репрезентативной выборки).Иногда люди возвращаются на адрес репрезентативной выборки. Тогда «*_origsm» у них снова станет равен «1».

Стоит отметить, что в 2001 году большое количество респондентов Москвы и Санкт-Петербурга поменяли значение «*_origsm» с «1» на «0» НЕ из-за переезда или раздела домохозяйств, а в связи с ремонтом репрезентативной выборки путём полной замены адресов для этих регионов в 10 волне.

Необходимость ремонта выборки была связана с тем, что к 2001 году достижимость в этих регионах существенно ухудшилась: объём опрошенных по адресам репрезентативной выборки стал категорически недостаточным, а количества запасных адресов заведомо не хватало для обеспечения нужного целевого объема респондентов. Поэтому все ранее опрошенные по репрезентативной выборке семьи этих регионов были выведены из репрезентативной выборки. Они продолжали участвовать в RLMS и в последующие волны, но уже только как панельная часть массива с «origsm=0». Вместо них по той же процедуре отбора, что и в 1994 году, были отобраны новые адреса, составляющие репрезентативную выборку этих регионов с 2001 года и до сих пор.

В других регионах при ремонте выборки в репрезентативную выборку только добавлялись новые адреса. При этом все ранее опрошенные по репрезентативной выборке не выводились из неё, а оставались там наравне с опрошенными по добавленным в ходе ремонта выборки новым адресам.

 

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.