Фрагмент для ознакомления
2
Вопрос 1. Парная линейная регрессия: оценка параметров МНК-методом; оценка качества модели; оценка погрешности модели
Ответ:
В парной линейной регрессии параметры оцениваются с использованием метода наименьших квадратов (МНК). Этот метод минимизирует сумму квадратов отклонений между наблюдаемыми значениями зависимой переменной и значениями, предсказанными по модели. Оценки параметров получаем в результате решения системы нормальных уравнений.
Для оценки параметров в МНК-методе используется следующая формула:
(1)
где - оценка параметра наклона прямой (slope), - оценка параметра сдвига прямой (intercept), (n) - количество наблюдений, (xi) и (yi) - значения переменных (x) и (y) соответственно для каждого наблюдения, - среднее значение переменной (x), - среднее значение переменной (y).
Оцененные параметры и позволяют построить уравнение регрессии:
= + (2)
где - предсказанное значение переменной (y).
МНК-метод позволяет найти наилучшую прямую, которая минимизирует сумму квадратов ошибок между предсказанными значениями и фактическими значениями переменной (y).
Оценка качества модели в парной линейной регрессии может быть выполнена с помощью различных статистических метрик. Некоторые из них включают коэффициент детерминации (R-квадрат), который показывает, какую долю дисперсии объясняет модель, и F-статистику, которая проверяет значимость регрессионной модели в целом. Другие метрики включают среднеквадратическую ошибку (MSE) и корень среднеквадратической ошибки (RMSE), которые показывают среднюю ошибку предсказания модели.
1. Сумма квадратов отклонений (SSE):
SSE = SST + SSR
2. Общая сумма квадратов (SST):
где (yi) - наблюдаемые значения зависимой переменной, - среднее значение зависимой переменной.
3. Сумма квадратов регрессии (SSR):
4. Коэффициент детерминации ( ):
где (SSE) - сумма квадратов отклонений, (SST) - общая сумма квадратов.
5. Средняя ошибка (MSE):
где (yi) - наблюдаемые значения зависимой переменной, - предсказанные значения зависимой переменной, (n) - количество наблюдений.
6. Корень среднеквадратической ошибки (RMSE):
Оценка погрешности модели в парной линейной регрессии связана с остатками модели (те же формула что и для качества модели). Остатки представляют собой разницу между наблюдаемыми значениями зависимой переменной и значениями, предсказанными моделью. Остатки могут быть использованы для проверки выполнения условий Гаусса-Маркова, оценки гомоскедастичности и автокорреляции ошибок, а также для идентификации выбросов или необычных наблюдений в данных. Оценка погрешности модели также может быть выполнена с помощью статистических метрик, таких как среднеквадратическое отклонение (SD) или коэффициент вариации (CV), которые показывают стандартное отклонение или относительную вариабельность остатков.
Вопрос 2. Проверка выполнимости условий Гаусса–Маркова
Ответ:
Проверка выполнимости условий Гаусса-Маркова - это процесс, в ходе которого мы анализируем данные и проводим тесты, чтобы убедиться, что эти условия выполняются. Вот основные шаги для проверки выполнимости условий Гаусса-Маркова:
1. Линейность: Построить диаграмму рассеяния между объясняющей переменной и зависимой переменной. Если точки на диаграмме располагаются примерно по прямой линии, то линейность условия выполняется. Если нет, то модель может требовать более сложной спецификации.
Фрагмент для ознакомления
3
1. Введение в эконометрику [Электронный ресурс]: учебное пособие / В. В. Домбровский; М-во образования и науки Российской Федерации, Томский гос. ун-т, Ин-т дистанционного образования. - Томск: ТГУ, 2010.
2. Знаенко Н.С. Основы эконометрики в схемах и таблицах: учеб. пособие / Н.С. Знаенко. – Ульяновск: УВАУ ГА(И), 2011.
3. Миронов Е. Метрика RMSE Квадратный корень из среднеквадратичной ошибки – [Электронный ресурс]. – Режим доступа: https://forecast.nanoquant.ru/metric/rmse.htm (дата обращения 22.12.2023)
4. Эконометрика [Электронный ресурс]: учебно-методический комплекс / Е. Г. Носова; Саратовский гос. социально-экономический ун-т, Каф. прикладной математики. - Версия 1.0. - Иваново: ИвГМА Росздрава, 2008.