Часто задаваемые вопросы
- Существует ли уникальный для всех волн идентификатор семей?
- Идентификаторы семей и идентификаторы адресов - это одно и то же?
- Почему многие домохозяйства получают новый ID после того, как пропустили волну?
- Как распознать домохозяйства, которые выехали из обследуемого жилища и были опрошены по новому месту жительства и новые домохозяйства, которые въехали в жилище из выборки?
- Почему в одном и том же году в одном и том же регионе при одном и том же номере семьи А3 может существовать сразу несколько ID_H?
- Верно ли, что номер индивида, заполняющего вопросник домохозяйства (XID_I), формируется путем добавления 01 к номеру семьи (XID_H), и так далее для каждого члена семьи?
Вопрос: Существует ли уникальный для всех волн идентификатор семей?
Ответ: В отличие от индивидов, семьи могут неоднократно делиться и объединяться. Поэтому говорить о том, что семья, опрошенная в данной волне, и семья, опрошенная несколькими годами ранее, одна и та же, можно лишь отдавая себе отчет в том, что состав семьи мог измениться как угодно значительно. Одни люди выбывают, другие появляются, и, пока в ней есть есть хотя бы 1 опрошенный ранее человек, семья в РМЭЗ НИУ ВШЭ считается "той же".
Например, в 1994 году была опрошена семья, состоящая из пожилых супруга и супруги. Через некоторое время к ним приехала дочь, затем дочь вышла замуж. В какой-то момент у дочери родились дети, а бабушка и дедушка умерли, и сейчас мы опрашиваем семью дочери с ее детьми как "ту же" семью.
Поэтому мы не создаем уникального идентификатора семьи. Но в каждой волне для каждой семьи, где есть хотя бы 1 ранее участвовавший человек, указаны все идентификаторы всех прошлых волн, в которых участвовали члены этой семьи - это переменные AID_H, BID_H, CID_H, и так далее. Именно их нужно использовать для объединения семейных данных из разных волн.
Вопрос: Идентификаторы семей и идентификаторы адресов - это одно и то же?
Ответ: Идентификаторы семей действительно часто совпадают с идентификаторами адресов, по которым проживают семьи, но ими не являются! Так, например, когда семья переезжает, она может сохранить свой номер, сменив адрес, и наоборот, на том же адресе одна и та же семья может оказаться под новым номером (см. ответ на следующий вопрос).
Вопрос: Почему многие домохозяйства получают новый ID после того, как пропустили волну?
Ответ: Когда интервьюер приходит по старому адресу и встречает новую семью, он старается выяснить, что случилось со старой. Если семья переехала в пределах региона и ее можно найти и опросить, интервьюер может оставить за ней ее старый номер, а новой семье (которая теперь стала частью репрезентативной выборки, см. раздел "Модель выборки") присвоить новый номер. Если выясняется, что старая семья больше недоступна (например, переехала в другой регион, все умерли, нет доступной информации), интервьюер может присвоить новой семье номер старой семьи. В этом случае при объединении двух волн у новой семьи значение идентификатора в предыдущей волне будет пропущено (поскольку она не участвовала), а у старой семьи пропущенное значение будет в волне текущей. Если впоследствии такая старая семья найдется или вернется на прежний адрес, в следующей волне ей придется дать новый номер (или отнять номер у новой семьи прошлого года). До 2005 года у нас было правило: ничего не исправлять в старых волнах, поэтому номер "нашедшейся" семьи менялся.
Пример: Семья под номером 10002 участвовала в 5 и 6 волнах РМЭЗ НИУ ВШЭ. В 7 волне интервьюер застал по этому адресу другую семью, сообщившую, что "старая" переехала в другой регион. Поэтому номер 10002 был присвоен новой семье (см. вторую строку таблицы ниже). Однако, в 9 волне "старая" семья вернулась в прежнее жилище и ей был присвоен номер 10034. Таким образом, в идентификаторах 7 и 8 волн значения для "старой" семьи будут пропущены, а в идентификаторах 5 и 6 волн будет стоять ее первоначальный номер. Поэтому, если при объединении файлов пользоваться идентификационными переменными именно тех волн, которые объединяются, обе семьи будут приливаться туда, куда нужно, и никакой путаницы не возникнет.
Пример 1. Идентификаторы семей, въезжавших и выезжавших с выборочного адреса
|
Aid_h
|
Bid_h
|
Cid_h
|
Did_h
|
Eid_h
|
Старая семья
|
1002
|
10102
|
.
|
.
|
10034
|
Новая семья
|
.
|
.
|
10102
|
10102
|
10102
|
Вопрос: Как распознать домохозяйства, которые выехали из обследуемого жилища и были опрошены по новому месту жительства и новые домохозяйства, которые въехали в жилище из выборки?
Ответ: Пожалуйста, перед прочтением ответа, ознакомьтесь с ответом на предыдущий вопрос.
Распознать семью, которая выехала и была опрошена по новому адресу всегда можно по ее принадлежности к репрезентативной выборке. Поскольку выборка РМЭЗ НИУ ВШЭ адресная, то домохозяйство, покидая выборочный адрес, перестает быть частью репрезентативного массива (только панельного), и даже при сохранении прежнего номера семьи, значение переменной X_ORIGSM будет равно 0.
Новую же семью, независимо от ее номера, всегда можно узнать по наличию идентификаторов в прошлых волнах. Если семья ранее не участвовала в обследовании, идентификаторы семьи в предыдущих волнах будут пропущенными значениями.
Помимо описанных в предыдущем вопросе ситуаций, часто происходит так называемое разделение семей - когда один или несколько членов домохозяйства переезжают на новой место жительства, а по старому адресу остается хотя бы один член "старой" семьи. В таком случае идентификаторы семьи в прошлых волнах для всех частей разделившейся семьи будут совпадать. В текущей волне старый номер остается за той частью семьи, которая проживает по прежнему адресу. Переехавшая же часть семьи получает новый номер, кроме того, покинув выборочный адрес, значение переменной X_ORIGSM изменится на 0.
Пример 2. Идентификаторы семей при разделении
|
Bid_h
|
Cid_h
|
Did_h
|
Eid_h
|
Часть семьи, оставшаяся по выборочному адресу
|
10083
|
10083
|
10083
|
10083
|
Переехавшая часть семьи
|
10083
|
10083
|
10099
|
10099
|
Вопрос: Почему в одном и том же году в одном и том же регионе при одном и том же номере семьи А3 может существовать сразу несколько ID_H?
Ответ: Каждый XID_H относится именно к той волне, с какой именно буквы начинается название этой переменной. За годы проведения RLMS-HSE алгоритм формирования XID_H несколько раз менялся,поэтому для одной и той же семьи в разных волнах XID_H может быть представлен разными комбинациями цифр.Это идентификатор данной семьи только в одной отдельной волне.В одном и том же регионе внутри одной волны не может быть двух семей с одинаковым номером. Например, в 24 волне номер TID_H – уникальный. При этом номер данной семьи в прошлых волнах может отличаться, или даже принадлежать другой семье. Кроме того, в случае когда семья разделилась, но все ее бывшие члены продолжают жить в том же регионе, в текущей волне их номер будет отличаться, а в прошлых волнах – совпадать.
Вопрос: Верно ли, что номер индивида, заполняющего вопросник домохозяйства (XID_I), формируется путем добавления 01 к номеру семьи (XID_H), и так далее для каждого члена семьи?
Ответ: Не совсем так. Семейный вопросник может заполнять не только первый член семьи, а любой. Следует смотреть распределение вопроса H8.
Индивидуальный номер человека получается путем прибавления его номера в карточке семьи к номеру семьи.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.