<<
>>

2.6 Регрессионный анализ

  В экологических исследованиях, и особенно в обработке экспериментальных данных, обычно используется регрессионный анализ, который тесно связан с корреляционным анализом и является его логическим продолжением, углубляя представления о корреляционной связи.

Под регрессией подразумевается зависимость изменений одного признака от изменений другого или нескольких признаков (множественная регрессия). В отличие от строгой функциональной зависимости y = f(x) в регрессионной модели одному и тому же значению величины x могут соответствовать несколько значений величины y, иными словами, при фиксированном значении x величина y имеет некоторое случайное распределение. В соответствии с этим регрессия, подобно корреляции, может быть парной (простой) или множественной, а в зависимости от формы связи – линейной или нелинейной. Здесь мы рассмотрим только самый простой случай линейной регрессии.

В случае простого линейного регрессионного анализа целесообразно придерживаться следующей схемы исследования. Пусть имеется две переменные – X (независимая) и Y (зависимая). Случайным образом отбираем n индивидов из генеральной совокупности и измеряем для них обе переменные. Далее строим диаграмму рассеяния признаков. Анализируя её, мы можем эмпирически оценить допустимо ли предположение о линейной зависимости между переменными. При большом числе переменных точки графика образуют «облако» характерной формы.

Рисунок 2.1. Типы диаграмм рассеяния.

По форме «облака» можно сделать некоторые выводы (рис. 2.1): А) положительная линейная корреляция (r gt; 0) (например, связь между ростом и весом); Б) отрицательная линейная корреляция (r lt; 0) (например, связь между возрастом и весом монеты); В) отсутствие связи (r = 0); Г) отрицательная нелинейная корреляция (r lt; 0) (например, связь между спросом и ценой на товар).

Теперь рассчитываем таблицу коэффициентов корреляции Пирсона. В отличие от корреляционного анализа, требующего достаточно большого объема выборки, анализ регрессии возможен и при наличии всего нескольких пар сопряженных наблюдений, однако его имеет смысл проводить лишь при обнаружении достоверных и достаточно сильных (порядка r ? 0,7) связей между признаками.

После того как мы определились с характером связи, строим модель в виде линейной функции:

,

где значения b это некоторый параметр, указывающий на связь двух выборок. Например, b0 – это значение Y, полученное при X = 0, тогда b1 – прирост Y при увеличении X на единицу (скорость изменения).

Рассчитываются коэффициенты модели весьма просто:

,

.

Полученные данные подставляем в формулу линейной регрессии и строим график линейной регрессии. Далее требуется оценить степень связности двух линий регрессии – эмпирической и теоретической. Для этих целей оценивают дисперсии. Обычно используют уже вам известную таблицу дисперсионного анализа.

Таблица 2.6

Таблица дисперсионного комплекса для простой линейной регрессии

Компоненты дисперсии Сумма квадратов Степени свободы Средний квадрат F-отношение
Регрессия

Отклонение от регрессии
Полная (общая)

Обусловленная регрессией сумма квадратов SSD получила своё название потому, что её можно записать как функцию оценённого коэффициента регрессии b1:

.

Итак, чем больше коэффициент регрессии, тем больше сумма квадратов регрессии, «обусловленная регрессией». F-отношение может быть использовано для проверки гипотез.

 

<< | >>
Источник: Горшков М.В.. Экологический мониторинг. Учеб. пособие. 2010

Еще по теме 2.6 Регрессионный анализ:

  1. § 1. Анализ ритмичности производства буровых работ на воду
  2. 2. МЕТОДИКА ЭКОНОМИЧЕСКОГО АНАЛИЗА
  3. 3. Опыт пассивного и активного прогнозирования и анализ прогнозных параметров социально-экономического развития Грузинской ССР
  4. 2.6. Анализ вариации зависимой переменной в регрессии. Коэффициент детерминации R2 Анализ вариации зависимой переменной в регрессии
  5. 3.4. Анализ вариации зависимой переменной в регрессии. Коэффициенты R2 и скорректированный
  6. 6.2. Корреляция по времени Авторегрессионный процесс первого порядка
  7. Мультивариантный дисперсионный анализ
  8. Общие принципы
  9. Устойчивость распределения суммарных баллов и корреляционный анализ шкал и утверждений опросника
  10. 4.3.4. Математические методы анализа международных конфликтов
  11. Сбор, обработка, анализ информации об экзогенных геологических процессах и основных изменяющихся факторах
  12. ПАТ-АНАЛИЗ*
  13. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
  14. Эмпирическая оценка. Заключение
  15. 2.6 Регрессионный анализ
  16. Приложение 3. Об измерениях и анализе эмпирических данных
  17. 4.1.3 Содержание и последовательность проведения анализа
  18. 4.2.3 Корреляционный, регрессионный и дисперсионный анализ