Построение линий и уравнений регрессий

Метод наименьших квадратов в двумерном пространстве. Уравнение регрессии

Процедура линейного парного регрессионного анализа выполняется на ЭВМ. Для графического изображения пар наблюдений в виде экспериментальных точек с координатами х;у на плоскости применяется система декартовых координат.

Задача линейного регрессионного анализа (метода наименьших квадратов) состоит в том, чтобы, зная положение точек на плоскости, так провести линию регрессии, чтобы сумма квадратов отклонений Д вдоль оси Оу (ординаты) этих точек U от проведенной прямой была минимальной.

Для проведения вычислений по классическому методу наименьших квадратов (для проведения регрессионного анализа) к выдвигаемой гипотезе (к форме уравнения регрессии) предъявляется такое требование: это уравнение должно быть линейным по параметрам или допускать возможность линеаризации.

Уравнение прямой на плоскости в декартовых координатах:

где b ,a - постоянные числа, геометрическая интерпретация которых дана ниже. Учитывая это, задачу метода наименьших квадратов аналитически можно выразить следующим образом:

Эти формулы можно выразить так: сумма квадратов отклонений вдоль оси Оу должна быть минимальной (принцип Лежандра).

Для решения задачи, поставленной в формуле, необходимо в каждом конкретном случае вычислить значения коэффициентов a и b , минимизирующие сумму отклонений U. Для этого, как известно из математического анализа, необходимо вычислить частные производные функции U по коэффициентам a и b и приравнять их к нулю.

Получаем формулы b и a:

Геометрическая интерпретация коэффициентов регрессии.

Коэффициент b (свободный член уравнения регрессии) геометрически представляет собой расстояние от начала координат до точки пересечения линии регрессии с ординатой или, это отрезок, отсекаемый на ординате линией регрессии.

Коэффициент b1 представляет собой тангенс угла наклона линии регрессии к оси абсцисс: tga = 0,53; a = 27є55ґ. Линия регрессии проводится через «облако» точек, соблюдая принцип Лежандра. Положение линии в системе координат на плоскости полностью определяется коэффициентами a и b.

Различают два вида связи: функциональная и стохастическая. Линейная функциональная связь в данном случае имела бы место, если бы все точки располагались на прямой регрессии. При наличие погрешностей измерения связь между у и х является стохастической (вероятностной).

Парная корреляция. Статистическое оценивание парной корреляции и регрессии

Существует две модели регрессии. Условно можно модель назвать прямой регрессией, а модель - обратной. Это означает, что уравнение не является алгебраическим, из которого непосредственно можно найти х, так как эта модель получена минимизацией суммы квадратов отклонений вдоль оси Оу.

Формулы для вычисления коэффициентов a и b в случае обратной регрессии:

Коэффициент парной корреляции:

3.1 Линейная зависимость между минерализацией и хлоридом

Построим линии и уравнения регрессий для графика зависимости минерализации от содержания хлоридов

Строим линию регрессий зависимости минерализации от содержания хлоридов.

Рис.7 Линия регрессии зависимости минерализации от содержания хлоридов

Зависимость между минерализацией и содержания хлоридов в ш.Юбилейная, отображена в виде линии, представленной уравнением y=-1,773*x+1092,54. Также построено обратное уравнение x=-0,3952*y=169,73, линия отображена на графике (Рис. 7).

3.2 Линейная зависимость между минерализацией и содержанием сульфатов

Построим линии и уравнения регрессий для графика зависимости минерализации от содержания сульфатов.

Строим линию регрессий зависимости минерализации от содержания хлоридов.

Рис.8 Линия регрессии зависимости минерализации от содержания сульфатов

Зависимость между минерализацией и содержания сульфатов в ш.Юбилейная, отображена в виде линии, представленной уравнением y=2,418*x+977,30. Также построено обратное уравнение x=0,1719*y+232,37, линия отображена на графике (Рис. 8).

3.4 Линейная зависимость между минерализацией и содержанием кальция

Рис.9 Линия регрессии зависимости минерализации от содержания кальция

Зависимость между минерализацией и содержания кальция в ш.Юбилейная, отображена в виде линии, представленной уравнением y=-5,376*x+3843,60. Также построено обратное уравнение x=-0,030*y+302,66, линия отображена на графике (Рис. 9).

3.5 Линейная зависимость между минерализацией и содержанием магния

Рис.10 Линия регрессии зависимости минерализации от содержания магния

Зависимость между минерализацией и содержания кальция в ш.Юбилейная, отображена в виде линии, представленной уравнением y=0,4976*x+2582,40. Также построено обратное уравнение x=0,0032*+y128,64, линия отображена на графике (Рис. 10).

3.7 Линейная зависимость между минерализацией и содержанием Na+K.

Рис.11 Линия регрессии зависимости минерализации от содержания Na+K.

Зависимость между минерализацией и содержания кальция в ш.Юбилейная, отображена в виде линии, представленной уравнением y=0,7333*x+2179,004. Также построено обратное уравнение x=0,3252*y+263,43, линия отображена на графике (Рис. 11).

3.9 Линейная зависимость между минерализацией и содержанием HCO3.

Рис.12 Линия регрессии зависимости минерализации от содержания HCO3.

Зависимость между минерализацией и содержания HCO3 в ш.Юбилейная, отображена в виде линии, представленной уравнением y=14,873*x+1557,7. Также построено обратное уравнение x=0,0173*y+239,1, линия отображена на графике (Рис. 11).



Скалярное произведение векторов