Эксперт
Сергей
Сергей
Задать вопрос
Мы готовы помочь Вам.

Условимся обозначить через Х независимую переменную, а через Y
зависимую переменную.
В экономике в большинстве случаев между переменными величинами
существуют зависимости, когда каждому значению одной переменной
соответствует не какое-то определенное, а множество значений другой
переменной, причем сказать заранее, какое именно значение примет
зависимая величина Y , нельзя. Такая зависимость получила название
статистической (или стохастической, вероятностной). Более часто
появление такой зависимости объясняется действием на
результирующую переменную не только контролируемого или
контролируемых факторов (в данном случае таким контролируемым
фактором является переменная Х), а и многочисленных
неконтролируемых случайных факторов. Примером статистической связи
является зависимость урожайности от количества внесенных удобрений,
стоимость одного экземпляра книги от тиража, выработки рабочего за
смену от его квалификации и т.д.
Допустим, что существует стохастическая зависимость случайной
переменной Y от Х. Зафиксируем некоторое значение х переменной Х.
При Х=х переменная Y в силу ее стохастической зависимости от Х может
принять любое значение из некоторого множества, причем какое именно
– заранее не известно. Поэтому, прежде всего, стараются выяснить,
изменяются или нет при изменении х условные математические
ожидания М(Y/Х=х). Если при изменении х условные математические
ожидания М(Y/Х=х) изменяются, то говорят, что имеет место
корреляционная зависимость величины Y от Х.
Функция φ(х)=М(Y/Х=х), описывающая изменение условного
математического ожидания случайной переменной Y при изменении
значений х переменной Х, называется функцией регрессии, а ее
график – линией регрессии.
Для отыскания функции регрессии, вообще говоря, необходимо знать
закон распределения случайной двумерной величины (Х,Y). В нашем
распоряжении лишь выборка ограниченного объема. Поэтому в этом
случае речь может идти об оценке (приближенном выражении) функции.
В качестве оценок условных математических ожиданий принимают
условные средние, которые находят по данным наблюдений (по
выборке).
Условным средним`ухназывают среднее арифметическое
наблюдавшихся значений Y, соответствующих Х=х.
Условное математическое ожидание М(Y/х) является функцией от х,
следовательно, его оценка, т.е. условное среднее `ух, также функция от
х; обозначив эту функцию через φ*(х), получим уравнение
`ух = φ*(х).
Это уравнение называют выборочным уравнением регрессии;
функцию φ*(х) называют выборочной регрессией, а ее график –
выборочной линией регрессии.
Как найти по данным наблюдений параметры функции φ*(х), если вид
ее известен? Как оценить силу (тесноту) связи между величинами Х и Y и
установить, коррелированы ли эти величины? Ответы на эти вопросы
изложены ниже.
1.1. Линейная парная регрессия
Пусть функция регрессии линейная, т.е. М(Y/Х=х)=α+βх. Найдем оценки
а и b параметров α и β.
Предположим, что в результате n независимых опытов получены n пар
чисел (х1,у1), (х2,у2),…, (х n, yn). Рассмотрим случай, когда различные
значения х признака Х и соответствующие им значения у признака Y
наблюдались по одному разу. Тогда выборочное уравнение можно
записать так: .
Для нахождения оценок а и b применим метод наименьших квадратов.
Суть этого метода в том, что отыскиваются такие значения а и b,
которые обеспечивают минимум суммы квадратов отклонений
измеренных значений уi от прямой линии, задаваемой параметрами а и
b, т.е.
screenshot 64 3
Обычно b называют коэффициентом регрессии. Коэффициент регрессии
показывает, на сколько единиц в среднем изменяется переменная Y при
увеличении переменной Х на одну единицу.
Пример 1.1. Найти выборочное уравнение прямой линии регрессии по
данным n=8 наблюдений, которые получены при изучении зависимости

количества продаж товара у от затрат на рекламу этого товара х:

screenshot 65 4

 

Прямая, построенная по этому уравнению, показана на рис. 4.2 вместе с
исходными данными. Эта прямая является наилучшей линейной оценкой
уравнения регрессии, полученной по имеющимся данным. Но это не
означает, что нельзя построить оценку регрессии в виде какой-то другой
зависимости (нелинейной), которая будет лучше соответствовать
экспериментальным данным, чем прямая линия.

screenshot 66 4 screenshot 67 4

Была ли полезна данная статья?
Да
67.47%
Нет
32.53%
Проголосовало: 83

или напишите нам прямо сейчас:

Написать в WhatsApp Написать в Telegram