поделился событием

Вопрос топика не случаен. Как Вы уже могли догадаться, я считаю, что использование фиктивных переменных (их ещё называют качественными или индикаторными) в уравнении регрессии - абсолютно бесполезное дело для оценки. Другими словами, их включение в модель абсолютно не улучшает точность и достоверность полученных оценок. Почему я так думаю? Давайте по-порядку.

Что же такое фиктивная (индикаторная) переменная? 
Это количественная переменная, которая принимает только два значения, 0 и 1,  и используется для представления качественных категориальных данных. Например, у Вас может быть переменная, представляющая количество комнат в квартире, которая равна 1 для двухкомнатной квартиры и 0 для однокомнатной, в модели для определения стоимости квартиры.

Почему же использование фиктивных (индикаторных) переменных абсолютно ничего не дает оценщику в плане точности и достоверности полученных оценок?
Чтобы понять это, рассмотрим упрощенный, но наглядный пример. Допустим, что нам нужно оценить стоимость однокомнатной квартиры. У нас имеются следующие данные по 4 объектам-аналогам (3 двухкомнатные квартиры и 1 однокомнатная).

Таблица с фиктивными индикаторными переменными 1

Построим уравнение регрессии по этим данным с помощью пакета анализа данных Excel. График уравнения регрессии представлен ниже.<.p>

График с фиктивными индикаторными переменными 1

Розовые точки - значения, определяемые уравнением регрессии, синие точки - значения из приведенного выше набора данных.

Теперь допустим нам удалось найти ещё один аналог - двухкомнатную квартиру. Мы расширяем исходную выборку (добавляем сведения о новом аналоге). Теперь наша выборка выглядит так.

Таблица с фиктивными индикаторными переменными 2

И снова мы строим уравнение регрессии, но уже по расширенной выборке с помощью пакета анализа данных Excel. Новый график уравнения регрессии представлен ниже.

График с фиктивными индикаторными переменными 2

Теперь, глядя на оба графика, мы можем попробовать сделать вывод о том, помогло ли нам добавление нового аналога (двухкомнатной квартиры), отличающегося от объекта оценки качественно (напомню, мы пытаемся оценить однокомнатную квартиру) повлиять на точность нашей оценки.

Если Вы внимательно посмотрите оба графика, то увидите, что при значении фиктивной переменной, равном 0 (т.е. для однокомнатной квартиры) уравнение регрессии и на исходной, и на расширенной выборке - дает один и тот же результат!

Если Вы тщательно проанализируете данную ситуацию, то прийдете к следующем простому, но при этом очень важному выводу!

Качество и достоверность оценки объекта оценки, принадлежащего к определенной качественной категории, определяется только аналогами такой же категории.

Другими словами, возвращаясь к нашему примеру, на оценку стоимости нашей однокомнатной квартиры никак не влияет количество подобранных нами в качестве аналогов двухкомнатных квартир. Если б мы использовали только наш единственный аналог той же качественной категории (единственную однокомнатную квартиру в списке) мы получили бы такие же результаты.

Этот маленький пример имеет сильные последствия. Отталкиваясь от него, для более сложных случаев с несколькими фиктивными (индикаторными) переменными (качественные корректировки в сравнительном подходе по сути являются такими же фиктивными переменными) можно также доказать, что качество и точность оценок определяется самым узким местом в имеющихся данных, а именно количеством аналогов, сходных по всем качественным категориям с объектом оценки.

Поделиться:
Читать далее
Зачастую в обсуждениях среди оценщиков, да и в отчетах об оценке находит своё отражение мнение части практикующих специалистов о том, что распределение цен сделок на различных рынках, как правило, ...
« C 1 сентября 2013 года в Федеральный закон «Об оценочной деятельности» внесены изменения в части  «Требования к членству в саморегулируемой организации оценщиков» (статья 24)....
Комментарии0
Нет комментариев