Проверка статистической значимости уравнения регрессии

Самое важное по теме: "проверка статистической значимости уравнения регрессии" с профессиональной точки зрения. Мы собрали, агрегировали и представили в доступном виде всю имеющуюся по теме информацию и предлагаем ее к прочтению.

Использование критерия Стьюдента для проверки значимости параметров регрессионной модели

Проверка статистической значимости параметров регрессионного уравнения (коэффициентов регрессии) выполняется по t-критерию Стьюдента, который рассчитывается по формуле:

где P — значение параметра;
Sp — стандартное отклонение параметра.

Рассчитанное значение критерия Стьюдента сравнивают с его табличным значением при выбранной доверительной вероятности (как правило, 0.95) и числе степеней свободы Nk-1, где N-число точек, k-число переменных в регрессионном уравнении (например, для линейной модели Y=A*X+B подставляем k=1).

Если вычисленное значение tp выше, чем табличное, то коэффициент регрессии является значимым с данной доверительной вероятностью. В противном случае есть основания для исключения соответствующей переменной из регрессионной модели.

Величины параметров и их стандартные отклонения обычно рассчитываются в алгоритмах, реализующих метод наименьших квадратов.

§ 5. Проверка статистической значимости коэффициентов парной линейной регрессии

подчиняются центральному распределению Стьюдента (©распределению) с (n-2) степенями свободы.

При выполнении исходных предпосылок модели эти дроби имеют распределение Стьюдента с числом степеней свободы v = n — 2, где n — число наблюдений. Рассчитанное значение 7-статистики сравнивается с критическим значением 7рит = 7n—2, где а — требуемый уровень значимости. Напомним, что в данном случае рассматривается двухсторонняя критическая область. Коэффициент полагески значимым, если его 7-статистика превос
ходит

Крити
ческое значение при уровне значимостиа = 0,05 и числе степеней свободы v = 20 — 2 = 18 равно

.
Следовательно, коэффициент b1 статистически значим. Гипотеза о статистической незначимости коэффициента b0 не отклоняется. Это означает, что в данном случае свободным членом уравнения регрессии можно пренебречь и рассматривать регрессию как у = b1x .

Оценка значимости уравнения множественной регрессии

Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа. Первое же построенное по выборке уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей задачей эконометрического анализа является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки.

Итак, проверка статистического качества оцененного уравнения регрессии проводится по следующим направлениям:

· проверка значимости уравнения регрессии;

· проверка статистической значимости коэффициентов уравнения регрессии;

· проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК).

Проверка значимости уравнения множественной регрессии, так же как и парной регрессии, осуществляется с помощью критерия Фишера. В данном случае (в отличие от парной регрессии) выдвигается нулевая гипотеза Но том, что все коэффициенты регрессии равны нулю (b1=0, b2=0, … , bm=0). Критерий Фишера определяется по следующей формуле:

где Dфакт — факторная дисперсия, объясненная регрессией, на одну степень свободы; Dост— остаточная дисперсия на одну степень свободы; R 2 — коэффициент множественной детерминации; т — число параметров при факторах х в уравнении регрессии (в парной линейной регрессии т = 1); п — число наблюдений.

Полученное значение F-критерия сравнивается с табличным при определенном уровне значимости. Если его фактическое значение больше табличного, тогда гипотеза Но о незначимости уравнения регрессии отвергается, и принимается альтернативная гипотеза о его статистической значимости.

С помощью критерия Фишера можно оценить значимость не только уравнения регрессии в целом, но и значимость дополнительного включения в модель каждого фактора. Такая оценка необходима для того, чтобы не загружать модель факторами, не оказывающими существенного влияния на результат. Кроме того, поскольку модель состоит из несколько факторов, то они могут вводиться в нее в различной последовательности, а так как между факторами существует корреляция, значимость включения в модель одного и того же фактора может различаться в зависимости от последовательности введения в нее факторов.

Для оценки значимости включения дополнительного фактора в модель рассчитывается частный критерий Фишера Fxi. Он построен на сравнении прироста факторной дисперсии, обусловленного включением в модель дополнительного фактора, с остаточной дисперсией на одну степень свободы по регрессии в целом. Следовательно, формула расчета частного F-критерия для фактора будет иметь следующий вид:

где R 2 yx1x2…xixp коэффициент множественной детерминации для модели с полным набором п факторов; R 2 yx1x2…xi-1xi+1…xp— коэффициент множественной детерминации для модели, не включающей фактор xi; п — число наблюдений; т — число параметров при факторах x в уравнении регрессии.

Фактическое значение частного критерия Фишера сравнивается с табличным при уровне значимости 0,05 или 0,1 и соответствующих числах степеней свободы. Если фактическое значение Fxiпревышает Fтабл , то дополнительное включение фактора xi в модель статистически оправдано, и коэффициент «чистой» регрессии biпри факторе xiстатистически значим. Если же Fxiменьше Fтабл , то дополнительное включение в модель фактора существенно не увеличивает долю объясненной вариации результата у, и, следовательно, его включение в модель не имеет смысла, коэффициент регрессии при данном факторе в этом случае статистически незначим.

Читайте так же:  Любовь с первого взгляда ведущие

С помощью частного критерия Фишера можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xiвводится в уравнение множественной регрессии последним, а все остальные факторы были уже включены в модель раньше.

Оценка значимости коэффициентов «чистой» регрессии bi по критерию Стьюдента t может быть проведена и без расчета частных F-критериев. В этом случае, как и при парной регрессии, для каждого фактора применяется формула

где bi — коэффициент «чистой» регрессии при факторе xi ; mbi— стандартная ошибка коэффициента регрессии bi .

Для множественной линейной регрессии стандартная ошибка коэффициента регрессии рассчитывается по следующей формуле:

где σy , σxi — среднее квадратическое отклонение соответственно для результата у и xi ; R 2 yx1x2…xixp— коэффициент множественной детерминации для множественной регрессии с набором из р факторов; R 2 xix1x2…xi-1xi+1…xp— коэффициент детерминации для зависимости фактора xi с остальными факторами множественной регрессии.

Полученные значения t-критериев сравниваются с табличными, и на основе этого сравнения принимается или отвергается гипотеза о значимости каждого коэффициента регрессии в отдельности.

Дата добавления: 2015-10-05 ; просмотров: 3691 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Оценка параметров уравнения регреcсии. Пример

Задание:
По группе предприятий, выпускающих один и тот же вид продукции, рассматриваются функции издержек:
y = α + βx;
y = α x β ;
y = α β x ;
y = α + β / x;
где y – затраты на производство, тыс. д. е.
x – выпуск продукции, тыс. ед.

Требуется:
1. Построить уравнения парной регрессии y от x :

  • линейное;
  • степенное;
  • показательное;
  • равносторонней гиперболы.

2. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации. Сделать выводы.
3. Оценить статистическую значимость уравнения регрессии в целом.
4. Оценить статистическую значимость параметров регрессии и корреляции.
5. Выполнить прогноз затрат на производство при прогнозном выпуске продукции, составляющем 195 % от среднего уровня.
6. Оценить точность прогноза, рассчитать ошибку прогноза и его доверительный интервал.
7. Оценить модель через среднюю ошибку аппроксимации.

1. Уравнение имеет вид y = α + βx
1. Параметры уравнения регрессии.
Средние значения

Связь между признаком Y фактором X сильная и прямая
Уравнение регрессии

Коэффициент детерминации
R 2 = 0.94 2 = 0.89, т.е. в 88.9774 % случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

x y x 2 y 2 x ∙ y y(x) (y-y cp ) 2 (y-y(x)) 2 (x-x p ) 2
78 133 6084 17689 10374 142.16 115.98 83.83 1
82 148 6724 21904 12136 148.61 17.9 0.37 9
87 134 7569 17956 11658 156.68 95.44 514.26 64
79 154 6241 23716 12166 143.77 104.67 104.67
89 162 7921 26244 14418 159.9 332.36 4.39 100
106 195 11236 38025 20670 187.33 2624.59 58.76 729
67 139 4489 19321 9313 124.41 22.75 212.95 144
88 158 7744 24964 13904 158.29 202.51 0.08 81
73 152 5329 23104 11096 134.09 67.75 320.84 36
87 162 7569 26244 14094 156.68 332.36 28.33 64
76 159 5776 25281 12084 138.93 231.98 402.86 9
115 173 13225 29929 19895 201.86 854.44 832.66 1296
16.3 20669.59 265.73 6241
1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

Примечание: значения y(x) находятся из полученного уравнения регрессии:
y(1) = 4.01*1 + 99.18 = 103.19
y(2) = 4.01*2 + 99.18 = 107.2
. . .

2. Оценка параметров уравнения регрессии
Значимость коэффициента корреляции

По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;α/2) = (11;0.05/2) = 1.796
Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим.

Анализ точности определения оценок коэффициентов регрессии

S a = 0.1712
Доверительные интервалы для зависимой переменной

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
(-20.41;56.24)
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика

Статистическая значимость коэффициента регрессии a подтверждается

Статистическая значимость коэффициента регрессии b не подтверждается
Доверительный интервал для коэффициентов уравнения регрессии
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(a — t S a; a + t S a)
(1.306;1.921)
(b — t b S b; b + t bS b)
(-9.2733;41.876)
где t = 1.796
2) F-статистики

Fkp = 4.84
Поскольку F > Fkp, то коэффициент детерминации статистически значим

§ 6. Проверка общего качества уравнения регрессии

Суть данного коэффициента как доли общего разброса значений зависимой переменной Y, объясненного уравнением регрессии,
подробно рассмотрена ранее. Как отмечалось, в общем случае 0lt;R2 lt; 1. Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Поэтому естественно желание построить регрессию с наибольшим R2.
Для множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение R2. Действительно, каждая следующая объясняющая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведение зависимой переменной. Это уменьшает (в худшем случае не увеличивает) область неопределенности в поведении переменной Y.
Иногда при расчете коэффициента детерминации для получения несмещенных оценок в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы. Вводится так называемый скорректированный (исправленный) коэффициент детерминации:

где n — количество наблюдений, m — число объясняющих переменных.
Такая поправка учитывает соответствующие степени свободы RSS и TSS. Выражение (3.15) можно также представить в виде:

Читайте так же:  Первый любовь называется любовью

где k = (m + 1) — число параметров уравнения регрессии.
—2 2
Из (3.15) очевидно, что R lt; R для т gt; 1. С ростом значения m скорректированный коэффициент детерминации растет медленнее, чем (обычный) коэффициент детерминации. Другими словами, он
корректируется в сторону уменьшения с ростом числа объясняющих переменных. Нетрудно заметить, что R2 = R2 только при R2=1. R2 может принимать отрицательные значения (например,
при R2=0). Обычно полагают

Доказано, что R2 увеличивается при добавлении новой объясняющей переменной тогда и только тогда, когда t-статистика для этой переменной по модулю больше единицы. Поэтому добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации. Обычно приводятся данные как по R2, так и по R2 являющиеся суммарными мерами общего качества уравнения регрессии. Однако не следует абсолютизировать значимость коэффициентов детерминации. Существует достаточно примеров неправильно специфицированных моделей, имеющих высокие коэффициенты детерминации. Поэтому коэффициент детерминации рассматривается лишь как один из ряда показателей, который нужно проанализировать, чтобы уточнить строящуюся модель.
После оценки индивидуальной статистической значимости каждого из коэффициентов регрессии обычно анализируется совокупная значимость коэффициентов.

Если данная гипотеза не отклоняется, то делается вывод о том, что совокупное влияние всех т объясняющих переменных X 1,X2, . Хт модели на зависимую переменную Y можно считать статистически несущественным, а общее качество уравнения регрессии — невысоким.
Проверка данной гипотезы осуществляется на основе дисперсионного анализа сравнения объясненной и остаточной дисперсий.
H 0 •’ (объясненная дисперсия) = (остаточная дисперсия),
H1: (объясненная дисперсия) gt; (остаточная дисперсия).
Строится ©’-статистика:

— объясненная сумма квадратов в
расчете на одну независимую переменную;

— остаточная сумма
квадратов в расчете на одну степень свободы.
При выполнении предпосылок МНК построенная ©-статистика имеет распределение Фишера с числами степеней свободы v1 = m, v2 = n — m — 1. Поэтому, если при требуемом уровне значимости а, Fнабл gt; Fа; m; n—m—1, где ©a;m; n—m—1 — критическая точка распределения Фишера, то Н0 отклоняется в пользу H1. Это означает, что объясненная дисперсия существенно больше остаточной дисперсии, следовательно, уравнение регрессии достаточно качественно отражает динамику изменения зависимой переменной Y. Если Fнабл lt; Fa;m;n—m—1, то нет оснований для отклонения Н0. Значит объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами. Это дает основание считать, что совокупное влияние объясняющих переменных модели несущественно, следовательно, общее качество модели невысоко.
Однако на практике чаще вместо указанной гипотезы проверяют тесно связанную с ней гипотезу о статистической значимости коэффициента детерминации R2:

Для проверки данной гипотезы используется следующая F- статистика:

Выражение (3.17) следует из (3.16), если числитель и знаменатель разделить на TSS.
Величина F при выполнении предпосылок МНК и при справедливости Н0 имеет распределение Фишера, аналогичное распределению F-статистики (3.16). Показатели F и R2 равны или не равны нулю одновременно. Для проверки нулевой гипотезы H0:F = 0, R2 = 0 при заданном уровне значимости а по таблицам критических точек распределения Фишера находится критическое значение Fкрит = Fа:m;n—m—1. Нулевая гипотеза отклоняется, если
Fнабл gt; Fкрит. Это равносильно тому, что R2 gt; 0, т. е. R2 статистически значим.
Анализ статистики F позволяет сделать вывод о том, что для принятия гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии коэффициент детерминации R2 не должен существенно отличаться от нуля. Его критическое значение уменьшается при росте числа наблюдений и может стать сколь

тических точек распределения Фишера найдем F005.2.7 = 4,74;
F0,01;2;27 = 9,55 . Поскольку Кабл = 51,2 gt; Крит как при так и
при 1%-м уровне значимости, то нулевая гипотеза Н0 в обоих случаях отклоняется в пользу Н1. Это означает, что объясненная дисперсия существенно больше остаточной, следовательно, уравнение регрессии достаточно качественно отражает динамику изменения зависимой переменной Y.
Отметим, что в случае парной регрессии проверка нулевой гипотезы для F-статистики равносильна проверке нулевой гипотезы
для t-статистики

коэффициента корреляции. В этом
случае F-статистика равна квадрату t-статистики. Самостоятельную значимость коэффициент R2 приобретает в случае множественной линейной регрессии.

Проверка качества уравнения регрессии. F-критерий Фишера

Как и в случае парной регрессии для оценки качества полученного множественной уравнения регрессии (3.6) можно использовать коэффициентмножественной детерминации, представляющий собой отношение факторной суммы квадратов остатков к их общей сумме квадратов:

(3.35)

— остаточная сумма квадратов.

Коэффициент множественной корреляции равен корню из коэффициента множественной детерминации:

(3.36)

Оба показателя изменяются от нуля до единицы.

показывает, какая часть вариации результативного признака y объяснена уравнением регрессии. Чем выше значение , тем лучше данная модель согласуется с данными наблюдений.

Коэффициент множественной корреляции R используется для оценки тесноты связи факторов с исследуемым признаком. Чем ближе величина R к единице, тем теснее данная связь, тем лучше теоретическая зависимость согласуется с эмпирическими данными.

Введём понятие дисперсии на одну степень свободы (df).

, (3.37)

где (n-1) — количество степеней свободы для общей дисперсии;

p–для факторнойдисперсии (количество независимых переменных в уравнении регрессии);

(n-p-1) – для остаточной дисперсии.

Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации

) осуществляется с помощью F-критерия Фишера

(3.38)

Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии отвергается при выполнении условия F >Fкрит, где Fкрит определяется по таблицам F-критерия Фишера по двум степеням свободы k1 = p, k2 = n-p-1 и заданному уровню значимости α.

Читайте так же:  Как покорить девушку стрельца

Величина коэффициента множественной корреляции R не может быть меньше максимального парного индекса корреляции max

.

В случае линейной зависимости (3.6) коэффициент корреляции R связан с парными коэффициентами корреляции

соотношением

(3.39)

Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину

.

Поэтому при большом количестве факторов предпочтительнее использовать, так называемый, скорректированный, улучшенный (adjusted) коэффициент множественной детерминации

, определяемый соотношением

(3.40)

Чем больше величина p, тем сильнее различия

и .

При использовании

для оценки целесообразности включения фактора в уравнение регрессии следует учитывать, что увеличение при включении нового фактора не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t — статистика по модулю больше единицы.

При заданном объеме наблюдений и при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации

имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Отметим, что низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации

может быть обусловлено следующими причинами:

– в регрессионную модель не включены существенные факторы;

Видео (кликните для воспроизведения).

– неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель.

Дата добавления: 2016-03-22 ; просмотров: 1550 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Проверка статистической значимости уравнения множественной регрессии в целом с помощью F-критерия Фишера

4.2. Проверить статистическую значимость уравнения множественной регрессии в целом с помощью F-критерия Фишера. Сделать выводы.

Для проверки значимости уравнения в целом выдвинем гипотезу Н о статистической незначимости коэффициента детерминации и противоположную ей гипотезу Н1 о статистической значимости коэффициента детерминации:

Н: R 2 = 0

Н1: R 2

Проверим гипотезы с помощью F-критерия Фишера.

Возьмём значение Fнаблиз таблицы «Дисперсионный анализ», выполненной с помощью пакета анализа «Анализ данных→Регрессия» в MS Excel:

df SS MS F Значимость F F_крит
Регрессия 454,8140702 227,4070351 7,075454535 0,001968701 3,182609852
Остаток 1607,013613 32,14027226
Итого 2061,827683

Рассчитаем Fкритс помощью функции =FРАСПОБР(б;p;n-p-1) в MS Excel:

Вывод:Fнабл > Fкрит – принимается гипотеза Н1 о статистической значимости коэффициента детерминации: уравнение признаётся статистически значимым в целом на уровне значимости 0,05.

Проверка статистической значимости параметров уравнения множественной регрессии. Интервальные оценки параметров

4.3. Проверить статистическую значимость параметров уравнения множественной регрессии. Построить интервальные оценки параметров. Сделать выводы.

Для проверки значимости коэффициентов уравнения выдвинем гипотезы Н k о статистической незначимости параметров bk и противоположные им соответствующие гипотезы Н1 j о статистической значимости параметров bk:

Н1 k : bk

Проверим гипотезы с помощью t- критерия Стьюдента.

Возьмём наблюдаемые значения критерия из столбца «t-статистика» таблицы, полученной с помощью пакета анализа «Анализ данных→Регрессия» в MS Excel:

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y -20,7163 11,3304 -1,8284 0,0735 -43,4741 2,0414
X 10 5,7169 1,9284 2,9645 0,0046 1,8435 9,5902
X 5 34,9321 14,7728 2,3646 0,0220 5,2600 64,6042
t_b0 -1,8284
t_b10 2,9645
t_b5 2,3646
t_табл 2,0086

|t_b0| t_табл, |t_b5|>t_табл

Следоветельно, b10 и b5 — статистически значимы, а b0 — статистически незначим.

Для интервальных оценок параметров регрессии воспользуемся таблицей, полученной с помощью пакета анализа «Анализ данных→Регрессия» в MS Excel:

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y -20,7163 11,3304 -1,8284 0,0735 -43,4741 2,0414
X 10 5,7169 1,9284 2,9645 0,0046 1,8435 9,5902
X 5 34,9321 14,7728 2,3646 0,0220 5,2600 64,6042

95%-ые доверительные интервалы для параметров регрессии выглядят следующим образом:

Применение регрессионной модели

5. Применение регрессионной модели:

Точечный прогноз

5.1. Используя построенное уравнение, дать точечный прогноз. Найти значение исследуемого параметра y, если значение первого фактора (наиболее тесно связанного с у) составит 110% от его среднего значения, значение второго фактора составит 80% от его среднего значения. Дать экономическую интерпретацию результата.

Рассчитаем средние значения х1 , х2 и

:

ср = 13,6994

Найдём 110% от

и 80% от :

Подставим полученные прогнозные значения факторов в уравнение регрессии:

Вывод: При увеличении среднего по предприятиям значения фондоотдачи на 10% и уменьшении среднего по предприятиям значения среднегодового удельного веса рабочих в составе ППП на 20%, значение рентабельности будет составлять 9,4335. Это на 4 меньше среднего значения рентабельности.

Проверка статистической значимости коэффициентов уравнения множественной регрессии

Построение эмпирического уравнения регрессии — начальный этап эконометрического анализа. Первое же построенное по выборке уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей задачей эконометрики анализа будет проверка качества уравнения регрессии. Проверка качества уравнения регрессии проводится по следующим параметрам:

  • проверка статистической значимости коэффициентов регрессионного уравнения;
  • проверка качества уравнения регрессии в целом;
  • проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполняемости предпосылок МНК).

Как и в случае парной регрессии, статистическая значимость коэффициентов множественной линейной регрессии с m объясняющими переменными проверяется на основе t-статистики:

Читайте так же:  Этапы адаптации ребенка

имеющей в данной ситуации распределение Стьюдента с числом степеней свободы α = n — m — 1 (n — объем выборки, m — количество объясняющих переменных в модели). При требуемом уровне значимости наблюдаемое α значение t-статистики сравнивается с критической точкой t α/2;n-m-1 распределения Стьюдента.

Если | t | > t α/2;n-m-1, то коэффициент bj считается статистически значимым. В противном случае коэффициент bj считается статистически незначимым статистически близким к нулю. Это означает, что фактор Xj линейно не связан с зависимой переменной Y. Наличие этого фактора среди объясняющих переменных не оправдано со статистической точки зрения. Он не оказывает сколько-нибудь серьезного влияния на зависимую переменную, а лишь искажает реальную картину взаимосвязи. Если коэффициент bj статистически незначим, рекомендуется исключить из уравнения регрессии переменную Xj. Это не приведет к существенной потере качества модели, но сделает ее более конкретной.

Стандартную задачу по эконометрике на проверку значимости можете заказать на этой странице.

Оценка значимости коэффициента регрессии и уравнения связи.

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.

Анализ качестваэмпирического уравнения парной и множественной линейной регрессииначинаютс построения эмпирического уравнения регрессии, которое является начальным этапом эконометрического анализа. Первое же, построенное по выборке уравнение регрессии, очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей оценкой является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:

  • проверка статистической значимости коэффициентовуравнения регрессии
  • проверка общего качества уравнения регрессии
  • проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК)

Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ, как правило, проводится для ограниченной по объёму совокупности.

Поэтому параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Чтобы проверить, на сколько эти показатели характерны для всей генеральной совокупности и не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:

1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессиизначимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.

2. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.

3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.

Проверить значимость(качество) уравнения регрессии–значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации. Проверка адекватностиуравнения регрессии (модели) осуществляется с помощью средней ошибки аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).

[3]

Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели. Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной (y) от среднего значения (yср.) раскладывается на две части: «объясненную» и «необъясненную»:

Схема дисперсионного анализа имеет следующий вид:

(n –число наблюдений, m–число параметров при переменной x)

Вопрос 21. Понятие временного ряда. Виды прогнозов. Общая характеристика методов прогнозирования.

Понятие временного ряда.

Временные ряды ряд последовательных значений, характеризующих изменение показателей во времени. В.р разделяются на:

моментные— ряд, уровни которого характеризуют значение показателя на определенные моменты времени.

[2]

интервальные – ряд, уровни которого характеризуют значение показателя,достигнутое за определенный период времени.

[1]

Более удобными явл. интервальные в.р, т.к они позволяют переходить от меньшего интервала к большему интервалу.

Числовые значения статистического показателя, называют уровнями рядаи обозначаются через у. Моменты или периоды времени, к которым относятся уровни, обозначаются через t.

Задачи в.р— выявить основную закономерность в изменении уровней ряда, называемую трендом.

В зависимости от вида показателей уровней ряда в.р делятся на ряды абсолютных, относительных и средних величин. Ряды абсолютных величин рассматриваются как исходные,а ряды относительных и средних величин – как производные.

Виды прогнозов.

Прогнозирование –предсказание поведения явления или объекта в будущем, на основе изучения его развития в прошлом и настоящем.

Различают прогнозы по времени:

1. Сроком не более 1 месяца ( оперативный).

2. Краткосрочные прогнозы (сроком до 1 года).

3. Среднесрочные прогнозы (сроком до 5 лет).

4. Долговременные прогнозы (сроком свыше 5 лет).

По форме составления прогнозирования различают прогнозы:

а) Поисковые. Основаны на изучении временного и динамического ряда.

б) Нормативно- целевые. При составлении н.-ц. прогнозов учитываются определенные рамки изменения признаков, которые влияют на прогнозируемую величину. Например: потребительская корзина, уровень жизни.

Читайте так же:  Адаптация датчика холостого хода

При составлении прогноза необходимо учесть факторы:

— Продолжительность временного ряда, на основе которого строится прогноз (чем более длительный период изучения явления, тем более надежный прогноз).

— Сопоставимость значений временного и динамического рядов.

Статистическая совокупность изменяется с течением времени и сами по себе значения признака не всегда объективно отражают изменения совокупности. Важно учитывать развитие других признаков, которые влияют на значение прогнозируемого признака.

Для составления прогноза используется сглаживание временного или динамического ряда. Сглаживание позволяет выявить тенденцию совокупности. Изменения динамического или временного ряда. Под трендом понимают тенденцию развития совокупности (рост, падение, стационарность и насыщение).

Общая характеристика методов прогнозирования.

Метод наименьших квадратов в простейшем случае (линейная функция от одного фактора) был разработан К. Гауссом в 1794—1795 гг. Могут оказаться полезными предварительные преобразования переменных, например, логарифмирование. Наиболее часто используется метод наименьших квадратов при нескольких факторах.

Метод наименьших модулей, сплайны и другие методы экстраполяции применяются реже, хотя их статистические свойства зачастую лучше. Накоплен опыт прогнозирования индекса инфляции и стоимости потребительской корзины. Оказалось полезным преобразование (логарифмирование) переменной — текущего индекса инфляции. Оценивание точности прогноза (в частности, с помощью доверительных интервалов) — необходимая часть процедуры прогнозирования.

Непараметрические методы доверительного оценивания точки наложения (встречи) двух временных рядов для оценки динамики технического уровня собственной продукции и продукции конкурентов, представленной на мировом рынке. Применяются также эвристические приемы, не основанные на вероятностно статистической теории: метод скользящих средних, метод экспоненциального сглаживания.

Многомерная регрессия, в том числе с использованием непараметрических оценок плотности распределения, — основной на настоящий момент статистический аппарат прогнозирования.

Прогнозирование на основе данных, имеющих нечисловую природу, например, прогнозирование качественных признаков основано на результатах статистики нечисловых данных.

Вопрос 22. Аналитические показатели динамики временных рядов.

Чтобы проследить за направлением и размером изменений уровней динамического ряда рассчитываются такие показатели, как:

абсолютные приросты ( изменения уровней);

темпы роста;

темпы прироста ( снижения) уровней.

В зависимости от базы сравнения эти показатели могут рассчитываться как цепные и базисные. Цепные – сравниваются уровни ряда за текущий и предыдущий периоды. Базисные – производится сравнение уровней ряда с некоторым уровнем, обычно начальным (уровень, с которым сравниваются другие уровни).

Абсолютный прирост уровней – это разность текущего и предыдущего уровней ряда( цепной) или текущего и базисного уровней (базисный):

1 , уi – у0 .

А. п показывает, на сколько уровень одного периода больше или меньше уровня предыдущего или базисного периода.

Темпы роста – относительный показатель, рассчитывается как процентное соотношение двух уровней ряда: текущего и предыдущего – цепной, а текущего и базисного – базисный.

Трц =

*100; Трб = *100

Темпы роста могут выражаться в виде коэффициентов (Кр), т. е. простого кратного отношения.

Выраженные в коэффициентах темпы роста показывают, во сколько раз уровень данного периода больше уровня базы сравнения или какую часть его составляет. При процентном выражении темп роста показывает, сколько процентов составляет уровень данного периода от уровня базы сравнения.

Темп прироста – относительный показатель, показывающий, на сколько процентов данный уровень больше ( или меньше) другого, принимаемого за базу сравнения ( предыдущего или базисного). Показатель можно рассчитать двояко:

Тр ц = Т р ц — 100 , р б = Т р б – 100, или

р ц = , р б= .

Иногда для анализа рассчитывается такой показатель, как абсолютное значение% прироста— отношение абсолютного прироста уровня к темпу прироста уровня к темпу прироста ( за соответствующий период):

А=

= yi-1.

Относительным ускорением – наз-ся разность следующих друг за другом темпов роста и прироста:

% = Т рi — Т рi-1 или % = ТрiТрi-1.

Коэффициент опережения – это отношение текущего темпа роста к предыдущему:

Копер =

.

Иногда коэффициентом опережения называют отношение темпов роста или прироста по двум динамическим рядам в одинаковые отрезки времени.

Видео (кликните для воспроизведения).

Последнее изменение этой страницы: 2016-04-20; Нарушение авторского права страницы

Источники


  1. А. Пятина Я верю в любовь / А. Пятина. — М.: Эксмо, 2012. — 992 c.

  2. CD-ROM (MP3). Гипнотизм и психология общения. — Москва: РГГУ, 2018. — 179 c.

  3. Перри, Дэнаан Воины сердца. Руководство по разрешению конфликта / Дэнаан Перри. — М.: ПЕРО, 2014. — 190 c.
  4. Вагин Психология выживания в современной России / Вагин, Игорь. — М.: АСТ, 2016. — 352 c.
  5. Рюриков, Юрий Яд и мед семьи. Семья и любовь на сломе времен / Юрий Рюриков. — М.: Молодая Гвардия, 2016. — 466 c.
Проверка статистической значимости уравнения регрессии
Оценка 5 проголосовавших: 1

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here