Элементы теории корреляции

График теоретической зависимости YT(х), полученный по найденной эмпирической формуле, называется кривой регрессии. Для проверки согласия (справедливости) построенной кривой регрессии с результатами эксперимента, как правило, используют следующие числовые характеристики: коэффициент корреляции и коэффициент детерминированности.

Коэффициент корреляции является мерой линейной связи между зависимыми величинами. Он показывает, насколько хорошо, в среднем, может быть представлена (вычислена) одна из величин в виде линейной функции от другой.

Коэффициент корреляции вычисляется по формуле:

(18)

где - среднеарифметические значения по x и y соответственно.

Коэффициент корреляции по абсолютной величине не превосходит 1. Чем ближе |r| к 1, тем теснее линейная связь между х и у, и тем более целесообразна аппроксимация таблично заданной функции линейной зависимостью.

Особо подчеркнём, что если модуль коэффициента корреляции существенно меньше 1, это не означает отсутствия зависимости между х и у. Это означает только, что в таком случае не применима линейная аппроксимация, но можно искать аппроксимирующую зависимость среди степенных, экспоненциальных, квадратичных и других видов функций.

Чтобы определить, насколько хорошо построенная зависимость отображает эмпирические данные, водится ещё одна характеристика - коэффициент детерминированности R2.

Пусть Socm - сумма квадратов отклонений теоретических значений функции от эмпирических данных:

(19)

Полученная величина характеризует отклонение теоретических результатов от экспериментальных данных. Чем больше Socm, тем хуже выбранная теоретическая функция описывает экспериментальные данные и, наоборот, чем меньше Socm, тем лучше выбранная теоретическая функция описывает экспериментальные данные.

Введём понятие регрессионной суммы квадратов:

(20)

Эта величина характеризует разброс теоретических данных относительно среднего значения.

Для линейной зависимости справедливо следующее соотношение:

(21)

Обозначим: , тогда для линейной зависимости справедливо следующее равенство:

(22)

Коэффициент детерминированности R2 определяют по формуле:

(23)

Поскольку Snoлн ≥ 0, Socm ≥0, и из формулы (23) следует, Snoлн ≥ Socm, то из формулы (15) следует

0≤R2≤1. (24)

Чем меньше остаточная сумма квадратов Socm по сравнению с общей суммой квадратов Snom, тем больше значение коэффициента детерминированности R2. Коэффициент детерминированности R2 показывает, насколько хорошо полученная теоретическая функция описывает взаимосвязь между эмпирическими данными. Если этот коэффициент равен 1, то имеет место полное совпадение выбранной теоретической модели с фактическими данными. В противоположном случае, если коэффициент детерминированности близок к нулю, то выбранная эмпирическая формула неудачна, и она не может использоваться для вычисления значений функции.

Перейти на страницу:
1 2