Оценки коэффициентов регрессии

Самое важное по теме: "оценки коэффициентов регрессии" с профессиональной точки зрения. Мы собрали, агрегировали и представили в доступном виде всю имеющуюся по теме информацию и предлагаем ее к прочтению.

Оценки коэффициентов регрессии

При наличии корреляционной связи между факторными и результативными признаками врачам нередко приходится устанавливать, на какую величину может измениться значение одного признака при изменении другого на общепринятую или установленную самим исследователем единицу измерения.

Например, как изменится масса тела школьников 1-го класса (девочек или мальчиков), если рост их увеличится на 1 см. В этих целях применяется метод регрессионного анализа.

Наиболее часто метод регрессионного анализа применяется для разработки нормативных шкал и стандартов физического развития.

    Определение регрессии. Регрессия — функция, позволяющая по средней величине одного признака определить среднюю величину другого признака, корреляционно связанного с первым.

С этой целью применяется коэффициент регрессии и целый ряд других параметров. Например, можно рассчитать число простудных заболеваний в среднем при определенных значениях среднемесячной температуры воздуха в осенне-зимний период.

Определение коэффициента регрессии. Коэффициент регрессии — абсолютная величина, на которую в среднем изменяется величина одного признака при изменении другого связанного с ним признака на установленную единицу измерения.

Формула коэффициента регрессии. Rу/х = rху x (σу / σx)
где Rу/х — коэффициент регрессии;
rху — коэффициент корреляции между признаками х и у;
у и σx) — среднеквадратические отклонения признаков x и у.

В нашем примере [rху = — 0,96 коэффициент корреляции между изменениями среднемесячной температуры в осенне-зимний период (х) и средним числом инфекционно-простудных заболеваний (у)];
σх = 4,6 (среднеквадратическое отклонение температуры воздуха в осенне-зимний период;
σу = 8,65 (среднеквадратическое отклонение числа инфекционно-простудных заболеваний).
Таким образом, Rу/х — коэффициент регрессии.
Rу/х = -0,96 х (4,6 / 8,65) = 1,8, т.е. при снижении среднемесячной температуры воздуха (x) на 1 градус среднее число инфекционно-простудных заболеваний (у) в осенне-зимний период будет изменяться на 1,8 случаев.

[2]

Уравнение регрессии. у = Му + Ry/x (х — Мx)
где у — средняя величина признака, которую следует определять при изменении средней величины другого признака (х);
х — известная средняя величина другого признака;
Ry/x — коэффициент регрессии;
Мх, Му — известные средние величины признаков x и у.

Например, среднее число инфекционно-простудных заболеваний (у) можно определить без специальных измерений при любом среднем значении среднемесячной температуры воздуха (х). Так, если х = — 9°, Rу/х = 1,8 заболеваний, Мх = -7°, Му = 20 заболеваний, то у = 20 + 1,8 х (9-7) = 20 + 3,6 = 23,6 заболеваний.
Данное уравнение применяется в случае прямолинейной связи между двумя признаками (х и у).

Назначение уравнения регрессии. Уравнение регрессии используется для построения линии регрессии. Последняя позволяет без специальных измерений определить любую среднюю величину (у) одного признака, если меняется величина (х) другого признака. По этим данным строится график — линия регрессии, по которой можно определить среднее число простудных заболеваний при любом значении среднемесячной температуры в пределах между расчетными значениями числа простудных заболеваний.

Сигма регрессии (формула).

где σRу/х — сигма (среднеквадратическое отклонение) регрессии;
σу— среднеквадратическое отклонение признака у;
rху — коэффициент корреляции между признаками х и у.

Так, если σу — среднеквадратическое отклонение числа простудных заболеваний = 8,65; rху — коэффициент корреляции между числом простудных заболеваний (у) и среднемесячной температурой воздуха в осенне-зимний период (х) равен — 0,96, то

Назначение сигмы регрессии. Дает характеристику меры разнообразия результативного признака (у).

Например, характеризует разнообразие числа простудных заболеваний при определенном значении среднемесячной температуры воздуха в осеннне-зимний период. Так, среднее число простудных заболеваний при температуре воздуха х1 = -6° может колебаться в пределах от 15,78 заболеваний до 20,62 заболеваний.
При х2 = -9° среднее число простудных заболеваний может колебаться в пределах от 21,18 заболеваний до 26,02 заболеваний и т.д.

Сигма регрессии используется при построении шкалы регрессии, которая отражает отклонение величин результативного признака от среднего его значения, отложенного на линии регрессии.

  • Данные, необходимые для расчета и графического изображения шкалы регрессии
    • коэффициент регрессии — Rу/х;
    • уравнение регрессии — у = Му + Rу/х (х-Мx);
    • сигма регрессии — σRx/y
  • Последовательность расчетов и графического изображения шкалы регрессии.
    • определить коэффициент регрессии по формуле (см. п. 3). Например, следует определить, насколько в среднем будет меняться масса тела (в определенном возрасте в зависимости от пола), если средний рост изменится на 1 см.
    • по формуле уравнения регрессии (см п. 4) определить, какой будет в среднем, например, масса тела (у, у2, у3. )* для определеного значения роста (х, х2, х3. ).
      ________________
      * Величину «у» следует рассчитывать не менее чем для трех известных значений «х».
  • При этом средние значения массы тела и роста (Мх, и Му) для определенного возраста и пола известны

  • вычислить сигму регрессии, зная соответствующие величины σу и rху и подставляя их значения в формулу (см. п. 6).
  • на основании известных значений х1, х2, х3 и соответствующих им средних значений у1, у2 у3, а также наименьших (у — σrу/х)и наибольших (у + σrу/х) значений (у) построить шкалу регрессии.
  • Читайте так же:  Найти женщина любовь

    Для графического изображения шкалы регрессии на графике сначала отмечаются значения х, х2, х3 (ось ординат), т.е. строится линия регрессии, например зависимости массы тела (у) от роста (х).

    Затем в соответствующих точках у1, y2, y3 отмечаются числовые значения сигмы регрессии, т.е. на графике находят наименьшее и наибольшее значения у1, y2, y3.

    Практическое использование шкалы регрессии. Разрабатываются нормативные шкалы и стандарты, в частности по физическому развитию. По стандартной шкале можно дать индивидуальную оценку развития детей. При этом физическое развитие оценивается как гармоничное, если, например, при определенном росте масса тела ребенка находится в пределах одной сигмы регрессии к средней расчетной единице массы тела — (у) для данного роста (x) (у ± 1 σRy/x).

    Физическое развитие считается дисгармоничным по массе тела, если масса тела ребенка для определенного роста находится в пределах второй сигмы регрессии: (у ± 2 σRy/x)

    Физическое развитие будет резко дисгармоничным как за счет избыточной, так и за счет недостаточной массы тела, если масса тела для определенного роста находится в пределах третьей сигмы регрессии (у ± 3 σRy/x).

    По результатам статистического исследования физического развития мальчиков 5 лет известно, что их средний рост (х) равен 109 см, а средняя масса тела (у) равна 19 кг. Коэффициент корреляции между ростом и массой тела составляет +0,9, средние квадратические отклонения представлены в таблице.

    Требуется:

    • рассчитать коэффициент регрессии;
    • по уравнению регрессии определить, какой будет ожидаемая масса тела мальчиков 5 лет при росте, равном х1 = 100 см, х2 = 110 см, х3= 120 см;
    • рассчитать сигму регрессии, построить шкалу регрессии, результаты ее решения представить графически;
    • сделать соответствующие выводы.

    Условие задачи и результаты ее решения представлены в сводной таблице.

    Условия задачи Pезультаты решения задачи
    уравнение регрессии сигма регрессии шкала регрессии (ожидаемая масса тела (в кг))
    М σ rху Rу/x х У σ Rx/y y — σRу/х y + σRу/х
    1 2 3 4 5 6 7 8 9 10
    Рост (х) 109 см ± 4,4см +0,9 0,16 100см 17,56 кг ± 0,35 кг 17,21 кг 17,91 кг
    Масса тела (y) 19 кг ± 0,8 кг 110 см 19,16 кг 18,81 кг 19,51 кг
    120 см 20,76 кг 20,41 кг 21,11 кг

    Решение.

      Коэффициент регрессии:
      Rу/х = rху х (σу / σх) = +0,9 х (0,8 / 4,4) = 0,16 кг/см.

    Таким образом, при увеличении роста мальчиков 5 лет на 1 см масса тела увеличивается на 0,16 кг.

    х1 = 100 см у1 = 19 + 0,16 (100-109) = 17,56 кг
    х2 = 110 см у2 = 19 + 0,16 (110-109) = 19,16 кг
    х3 = 120 см У3 = 19 + 0,16 (120-109) = 20, 76 кг

    Рост и его значения Среднее значение массы тела Наименьшее значение массы тела Наибольшее значение массы тела
    х У У — σRy/x У — σRy/x
    100 см (1) 17,56 кг 17,21 кг 17,91 кг
    110 см (2) 19,16 кг 18,81 кг 19,51 кг
    120 см (3) 20,76 кг 20,41 кг 21,11 кг

    Графическое изображение регрессии. Шкала регрессии массы тела по росту 5-летних мальчиков

    Вывод. Таким образом, шкала регрессии в пределах расчетных величин массы тела позволяет определить ее при любом другом значении роста или оценить индивидуальное развитие ребенка. Для этого следует восстановить перпендикуляр к линии регрессии.

    Применение методов статистического анализа для изучения общественного здоровья и здравоохранения. Под ред. чл.-корр. РАМН, проф. В.З.Кучеренко. М., «Гэотар-Медиа», 2007, учебное пособие для вузов

    1. Власов В.В. Эпидемиология. — М.: ГЭОТАР-МЕД, 2004. — 464 с.
    2. Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. — М.: ГЭОТАР-МЕД, 2007. — 512 с.
    3. Медик В.А., Юрьев В.К. Курс лекций по общественному здоровью и здравоохранению: Часть 1. Общественное здоровье. — М.: Медицина, 2003. — 368 с.
    4. Миняев В.А., Вишняков Н.И. и др. Социальная медицина и организация здравоохранения (Руководство в 2 томах). — СПб, 1998. -528 с.
    5. Кучеренко В.З., Агарков Н.М. и др.Социальная гигиена и организация здравоохранения (Учебное пособие) — Москва, 2000. — 432 с.
    6. С. Гланц. Медико-биологическая статистика. Пер с англ. — М., Практика, 1998. — 459 с.

    Корреляция и регрессия

    Линейное уравнение регрессии имеет вид y = bx + a + ε
    Здесь ε — случайная ошибка (отклонение, возмущение).
    Причины существования случайной ошибки:
    1. Невключение в регрессионную модель значимых объясняющих переменных;
    2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
    3. Неправильное описание структуры модели;
    4. Неправильная функциональная спецификация;
    5. Ошибки измерения.
    Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
    1) по наблюдениям xi и yi можно получить только оценки параметров α и β
    2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
    Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
    Для оценки параметров α и β — используют МНК (метод наименьших квадратов).
    Система нормальных уравнений.

    Читайте так же:  Муж бросил любовницу с ребенком

    Для наших данных система уравнений имеет вид:

    10a + 356b = 49
    356a + 2135b = 9485

    Из первого уравнения выражаем а и подставим во второе уравнение
    Получаем b = 68.16, a = 11.17

    Уравнение регрессии:
    y = 68.16 x — 11.17

    1. Параметры уравнения регрессии.
    Выборочные средние.

    1.1. Коэффициент корреляции
    Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

    Линейный коэффициент корреляции принимает значения от –1 до +1.
    Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
    0.1 Y фактором X весьма высокая и прямая.

    1.2. Уравнение регрессии (оценка уравнения регрессии).

    Линейное уравнение регрессии имеет вид y = 68.16 x -11.17
    Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент уравнения регрессии показывает, на сколько ед. изменится результат при изменении фактора на 1 ед.
    Коэффициент b = 68.16 показывает среднее изменение результативного показателя (в единицах измерения у ) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 68.16.
    Коэффициент a = -11.17 формально показывает прогнозируемый уровень у , но только в том случае, если х=0 находится близко с выборочными значениями.
    Но если х=0 находится далеко от выборочных значений x , то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
    Подставив в уравнение регрессии соответствующие значения x , можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
    Связь между у и x определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе — обратная). В нашем примере связь прямая.

    1.3. Коэффициент эластичности.
    Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
    Для этих целей вычисляются коэффициенты эластичности и бета — коэффициенты. Коэффициент эластичности находится по формуле:

    Он показывает, на сколько процентов в среднем изменяется результативный признак у при изменении факторного признака х на 1%. Он не учитывает степень колеблемости факторов.
    В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами — Х существенно влияет на Y.
    Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

    Т.е. увеличение x на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего Y на 0.9796 среднеквадратичного отклонения этого показателя.

    1.4. Ошибка аппроксимации.
    Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

    Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве регрессии.

    1.6. Коэффициент детерминации.
    Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
    Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
    R 2 = 0.98 2 = 0.9596
    т.е. в 95.96 % случаев изменения x приводят к изменению у . Другими словами — точность подбора уравнения регрессии — высокая. Остальные 4.04 % изменения Y объясняются факторами, не учтенными в модели.

    x y x 2 y 2 x • y y(x) (yi-ycp) 2 (y-y(x)) 2 (xi-xcp) 2 |y — yx|:y
    0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
    0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
    0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
    0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
    0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
    0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
    0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
    0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
    2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
    7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81

    2. Оценка параметров уравнения регрессии.
    2.1. Значимость коэффициента корреляции.

    По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=7 находим tкрит:
    tкрит = (7;0.05) = 1.895
    где m = 1 — количество объясняющих переменных.
    Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
    Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически — значим
    В парной линейной регрессии t 2 r = t 2 b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

    2.3. Анализ точности определения оценок коэффициентов регрессии.
    Несмещенной оценкой дисперсии возмущений является величина:

    S 2 y = 94.6484 — необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
    Sy = 9.7287 — стандартная ошибка оценки (стандартная ошибка регрессии).
    S a — стандартное отклонение случайной величины a.

    Sb — стандартное отклонение случайной величины b.

    Читайте так же:  Что включает в себя понятие личность

    2.4. Доверительные интервалы для зависимой переменной.
    Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения.
    Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.
    Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя. (a + bxp ± ε)
    где

    Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X p = 1 (-11.17 + 68.16*1 ± 6.4554)
    (50.53;63.44)
    С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

    Индивидуальные доверительные интервалы для Y при данном значении X.
    (a + bx i ± ε)
    где

    xi y = -11.17 + 68.16xi εi ymin ymax
    0.371 14.11 19.91 -5.8 34.02
    0.399 16.02 19.85 -3.83 35.87
    0.502 23.04 19.67 3.38 42.71
    0.572 27.81 19.57 8.24 47.38
    0.607 30.2 19.53 10.67 49.73
    0.655 33.47 19.49 13.98 52.96
    0.763 40.83 19.44 21.4 60.27
    0.873 48.33 19.45 28.88 67.78
    2.48 158.07 25.72 132.36 183.79

    С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

    2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
    1) t-статистика. Критерий Стьюдента.
    Проверим гипотезу H о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
    tкрит = (7;0.05) = 1.895

    Поскольку 12.8866 > 1.895, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

    Поскольку 2.0914 > 1.895, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

    [3]

    Видео удалено.
    Видео (кликните для воспроизведения).

    Доверительный интервал для коэффициентов уравнения регрессии.
    Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
    (b — tкрит Sb; b + tкрит Sb)
    (68.1618 — 1.895 • 5.2894; 68.1618 + 1.895 • 5.2894)
    (58.1385;78.1852)
    С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
    (a — ta)
    (-11.1744 — 1.895 • 5.3429; -11.1744 + 1.895 • 5.3429)
    (-21.2992;-1.0496)
    С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

    2) F-статистики. Критерий Фишера.
    Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
    Если расчетное значение с lang=EN-US>n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

    где m – число факторов в модели.
    Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
    1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H: R 2 =0 на уровне значимости α.
    2. Далее определяют фактическое значение F-критерия:

    где m=1 для парной регрессии.
    3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
    4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
    В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
    Табличное значение критерия со степенями свободы k1=1 и k2=7, Fkp = 5.59
    Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим (Найденная оценка уравнения регрессии статистически надежна).

    [1]

    Обнаружение автокорреляции

    1. Графический метод
    Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения ei с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения ei (либо оценки отклонений).
    Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скоре всего будет свидетельствовать об отсутствии автокорреляции.
    Автокорреляция становится более наглядной, если построить график зависимости ei от ei-1.

    Оценка параметров уравнения регреcсии. Пример

    Задание:
    По группе предприятий, выпускающих один и тот же вид продукции, рассматриваются функции издержек:
    y = α + βx;
    y = α x β ;
    y = α β x ;
    y = α + β / x;
    где y – затраты на производство, тыс. д. е.
    x – выпуск продукции, тыс. ед.

    Требуется:
    1. Построить уравнения парной регрессии y от x :

    • линейное;
    • степенное;
    • показательное;
    • равносторонней гиперболы.

    2. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации. Сделать выводы.
    3. Оценить статистическую значимость уравнения регрессии в целом.
    4. Оценить статистическую значимость параметров регрессии и корреляции.
    5. Выполнить прогноз затрат на производство при прогнозном выпуске продукции, составляющем 195 % от среднего уровня.
    6. Оценить точность прогноза, рассчитать ошибку прогноза и его доверительный интервал.
    7. Оценить модель через среднюю ошибку аппроксимации.

    1. Уравнение имеет вид y = α + βx
    1. Параметры уравнения регрессии.
    Средние значения

    Связь между признаком Y фактором X сильная и прямая
    Уравнение регрессии

    Коэффициент детерминации
    R 2 = 0.94 2 = 0.89, т.е. в 88.9774 % случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая

    Читайте так же:  Что написать причиной развода
    x y x 2 y 2 x ∙ y y(x) (y-y cp ) 2 (y-y(x)) 2 (x-x p ) 2
    78 133 6084 17689 10374 142.16 115.98 83.83 1
    82 148 6724 21904 12136 148.61 17.9 0.37 9
    87 134 7569 17956 11658 156.68 95.44 514.26 64
    79 154 6241 23716 12166 143.77 104.67 104.67
    89 162 7921 26244 14418 159.9 332.36 4.39 100
    106 195 11236 38025 20670 187.33 2624.59 58.76 729
    67 139 4489 19321 9313 124.41 22.75 212.95 144
    88 158 7744 24964 13904 158.29 202.51 0.08 81
    73 152 5329 23104 11096 134.09 67.75 320.84 36
    87 162 7569 26244 14094 156.68 332.36 28.33 64
    76 159 5776 25281 12084 138.93 231.98 402.86 9
    115 173 13225 29929 19895 201.86 854.44 832.66 1296
    16.3 20669.59 265.73 6241
    1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

    Примечание: значения y(x) находятся из полученного уравнения регрессии:
    y(1) = 4.01*1 + 99.18 = 103.19
    y(2) = 4.01*2 + 99.18 = 107.2
    . . .

    2. Оценка параметров уравнения регрессии
    Значимость коэффициента корреляции

    По таблице Стьюдента находим Tтабл
    Tтабл (n-m-1;α/2) = (11;0.05/2) = 1.796
    Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически — значим.

    Анализ точности определения оценок коэффициентов регрессии

    S a = 0.1712
    Доверительные интервалы для зависимой переменной

    Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
    (-20.41;56.24)
    Проверка гипотез относительно коэффициентов линейного уравнения регрессии
    1) t-статистика

    Статистическая значимость коэффициента регрессии a подтверждается

    Статистическая значимость коэффициента регрессии b не подтверждается
    Доверительный интервал для коэффициентов уравнения регрессии
    Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
    (a — t S a; a + t S a)
    (1.306;1.921)
    (b — t b S b; b + t bS b)
    (-9.2733;41.876)
    где t = 1.796
    2) F-статистики

    Fkp = 4.84
    Поскольку F > Fkp, то коэффициент детерминации статистически значим

    Проверка значимости коэффициентов простой линейной регрессии и адекватности регрессионной модели. — Билеты — Эконометрика

    1. F-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

    где n – число единиц совокупности;

    m – число параметров при переменных x.

    Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Уровень значимости a – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно a принимается равной 0,05 или 0,01.

    Если Fтабл Fфакт, то H0 – гипотеза не отклоняется и признается статистическая незначимость, надежность уравнения регрессии.

    2. t-критерий Стьюдента используется для оценки статистической значимости коэффициентов регрессии и коэффициента корреляции.

    В качестве основной гипотезы выдвигают гипотезу H0 о незначимом отличии от нуля параметра регрессии или коэффициента корреляции. Альтернативной гипотезой, при этом является гипотеза обратная, т.е. о неравенстве нулю параметра или коэффициента корреляции.

    Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).

    Табличное значение определяется в зависимости от уровня значимости (a) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2) , n — число наблюдений.

    Если фактическое значение t-критерия больше табличного (по модулю), то считают, что с вероятностью (1-a) параметр регрессии (коэффициент корреляции) значимо отличается от нуля.

    Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр регрессии (коэффициент корреляции) незначимо отличается от нуля при уровне значимости a.

    Фактические значения t-критерия определяются по формулам:

    где

    Для проверки гипотезы о незначимом отличии от нуля коэффициента линейной парной корреляции используют критерий:

    где r — оценка коэффициента корреляции, полученная по наблюдаемым данным. tтабл остается прежним.

    3. Адекватность регрессионной модели оценим с помощью средней ошибки аппроксимации – среднее отклонение расчетных значений от фактических:

    Допустимый предел значений

    – не более 8-10%.

    Оценка коэффициентов регрессии

    Теоретическое введение

    Обработка данных методами регрессионного анализа

    Литература

    Оформление отчета

    В отчете по типовому расчету должны быть представлены все проведенные расчеты, уравнения выборочных прямых регрессии. На чертеже должны быть представлены уравнения прямых регрессии, там же должны быть проставлены все экспериментальные точки. В выводах сформулировать полученный результат проверки гипотезы о наличии (отсутствии) линейной взаимосвязи между случайными величинами. Если принята гипотеза о наличии линейной взаимосвязи, сделать вывод о силе и характере связи между величинами Х и Y.
    Точность расчетов оценок математического ожидания – запасной знак по сравнению с исходными данными, оценок дисперсий, средних квадратических отклонений, ковариации – три значащие цифры, оценки коэффициента корреляции – три знака после запятой.

    1. В.А. Карасев, С.Н. Богданов, Г.Д. Лёвшина. Теория вероятностей и математическая статистика. Раздел 2. Математическая статистика. Учебно-методическое пособие. // М.: Изд-во «Учеба» (МИСиС). – 2006. – 116 с.

    Важной задачей математической статистики является получение функциональной зависимости одной величины (y) от другой (x) по результатам эксперимента. Будем считать, что функциональная зависимость между величинами, называемая в дальнейшем моделью, известна из предварительных сведений с точностью до параметров β1, β2, . βm и имеет вид

    Читайте так же:  Цыганское гадание любовный треугольник
    y = f (x, β1, β2, . βm ). (4.1)

    Для отыскания неизвестных параметров проведено n наблюдений (xi, Yi ), i = 1, 2, . n. Но так как результаты наблюдений не свободны от погрешностей измерений, которые мы будем рассматривать как случайные ошибки, то по ним нельзя точно найти искомые параметры. Поэтому приходится ставить задачу об отыскании не значений параметров, а их оценок по результатам эксперимента.
    Будем предполагать, что значения аргументов xi известны точно, а значения функции Yi – взаимно независимые случайные величины, включающие случайные ошибки Zi , ­ ­т.е. Yi = f(xi, β1, β2, . βm ) + Zi , ­ ­где
    M (Zi ) = 0; ­ ­ ­ ­ ­D(Zi ) = D(Yi ) = σ 2 .
    Здесь мы предполагаем, что измерения равноточны. В дальнейшем будет рассмотрен более общий случай.
    Для оценок параметров β1, β2, . βm используется метод наименьших квадратов. В качестве оценок этих параметров принимаются значения

    , при которых имеет минимум функция
    (Yif (xi, β1, β2, . βm )) 2 . (4.2)

    Уравнение (4.1) называется уравнением регрессии, а отыскание оценок параметров и исследование получаемых моделей – регрессионным анализом.
    Будем рассматривать уравнения регрессии, линейные относительно оцениваемых параметров β1, β2, . βm :

    f (x, β1, β2, . βm ) = β1φ1(x) + β2φ2(x) + . + βmφm(x). (4.3)

    Функции φ1(x), φ2(x), . , φm(x) называются базисными функциями, их рассматривают на множестве точек (x1, x2, . xn ), где n – число экспериментов.
    Формулы для оценки параметров регрессионной модели (4.3) значительно упрощаются, если базисные функции ортогональны, т.е. их скалярные произведенияj , φk ) =

    φj(xik(xi) равны нулю для любых ­ jk.
    Обозначим ортогональные базисные функции T1(x), T2(x), . Tm(x) и функцию регрессии в ортогональном базисе:
    y = B1T1(x) + B2T2(x) + . + BmTm(x). (4.4)

    Тогда оценки параметров регрессии определяются по формуле

    . (4.5)

    Оценки параметров регрессии в ортогональном базисе обладают следующими свойствами.
    1. Каждая оценка

    находится только по «своей» базисной функции Tj и не зависит от остальных, что создает удобства при «достраивании» регрессионных моделей.
    2. Каждая оценка является несмещенной оценкой истинного значения параметра Bj , т.е. M() = Bj .
    3. Отклонения ΔYi = Yi(xi) экспериментальных результатов Yi от рассчитанных по оценкам (1.63) значений ортогональны всем базисным функциям T1(x), . Tm(x), использованным в регрессионной модели:
    Y, Tj ) = ΔYi·Tj(xi ) = 0, (4.6)
    λ2 = – (φ2, T1 ) / (T1, T1 ). (4.7)
    λ3 = – (φ3, T1) / (T1, T1), ­ ­ ­ μ3 = – (φ3, T2) / (T2, T2). (4.8)

    Рассмотрим более общий случай, когда результаты измерений Yi неравноточны, т.е. дисперсии величин Yi различны. Будем полагать в (4.2):

    D (Yi) = D (Zi) = σ 2 / Wi , (4.9)

    где Wi – известные веса измерений. В этом случае в методе наименьших квадратов (1.60) минимизируется функция:

    (Yif (xi, β1, β2, . βm )) 2 Wi , (4.10)

    скалярное произведения функций определяется следующим образом:
    j , φk ) =

    φj (xi ), φk (xi) Wi ,
    и оценки параметров регрессии в ортогональном базисе находят по формуле
    . (4.11)

    Линейную и квадратичную регрессионные модели будем записывать в разложении по ортогональным многочленам для множества точек x1, x2, . xn с весами W1, W2, . Wn ; ортогональные многочлены степеней 0, 1, 2 рассчитываются по формулам
    T1 = 1; ­ ­ ­ T2 = X; ­ ­ ­ T3 = X 2 + μX + ν,
    где Х – кодированное значение аргумента :

    , (4.12)

    а коэффициенты μ и ν вычисляются по следующим формулам соответственно:

    . (4.13)

    Веса измерений используются и в том случае, когда экспериментальные значения y являются независимыми и равноточными, но для некоторых значений аргумента xi измерения проводятся несколько раз, т.е. дублируются. Пусть в точке xi эксперимент дублируется ni раз, результаты этого дублирования обозначим Yij ( j = 1, 2, . ni ). Среднее арифметическое результатов эксперимента в точке xi обозначим Yi =

    Yij / ni . Если измерения Yij равноточны, т.е. D(Yij ) = σ 2 , то дисперсии средних арифметических равны
    D(Yi ) = σ 2 / ni . (4.14)

    В этом случае построение регрессионных моделей производим по средним значениям Yi для каждого значения xi . Значения Yi в этом случае неравноточны. Сравнивая формулы (4.9) и (4.14), делаем вывод, что весами измерений в этом случае являются числа измерений ni , т.е. Wi = ni.

    Не нашли то, что искали? Воспользуйтесь поиском:

    Лучшие изречения: Для студента самое главное не сдать экзамен, а вовремя вспомнить про него. 9783 —

    | 7396 — или читать все.

    185.189.13.12 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам | Обратная связь.

    Видео удалено.
    Видео (кликните для воспроизведения).

    Отключите adBlock!
    и обновите страницу (F5)

    очень нужно

    Источники


    1. Хорсанд, Диана 20 самых глупых ошибок, которые совершают семейные пары / Диана Хорсанд. — М.: АСТ, Харвест, 2017. — 224 c.

    2. Стивенс, Хозе От Дао – Земле. Учение Михаила, психология общения и духовный рост / Хозе Стивенс. — М.: Гелиос, София, 2013. — 320 c.

    3. Старшенбаум, Г. В. Как стать семейным психологом / Г.В. Старшенбаум. — М.: Психотерапия, 2013. — 480 c.
    4. Невис, Э. Организационное консультирование. Методики и рабочие модели для консультантов организаций / Э. Невис. — М.: СПб: Пирожкова, 2013. — 224 c.
    5. Иванников, В. А. Общая психология. Учебник / В.А. Иванников. — М.: Юрайт, 2014. — 482 c.
    Оценки коэффициентов регрессии
    Оценка 5 проголосовавших: 1

    ОСТАВЬТЕ ОТВЕТ

    Please enter your comment!
    Please enter your name here