КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Метод наименьших квадратов
Пусть проводится n однородных испытаний или экспериментов, и результатом каждого испытания является пара чисел – значений некоторых переменных x и y. Испытание с номером i приводит к числам xi, yi. В качестве испытания можно, например, рассматривать выбор определенного предприятия в данной отрасли промышленности, величиной x считать объем производства продукции (например, в миллионах рублей), величиной y – объем экспорта этого вида продукции (в миллионах рублей), и обследовать n предприятий отрасли. Итогом этих испытаний является таблица:
где каждому числу xi (величину В качестве значений
называется временным рядом. Нас интересует вопрос, как найти приближенную формулу для функции y = f(x), которая “наилучшим образом” описывала бы данные таблицы. Пусть точки с координатами (xi, yi) группируются на плоскости вдоль некоторой прямой. Задача заключается в том, чтобы найти параметры a 0 и a 1 этой прямой: y = a 0 + a 1 x, (1) причем это нужно сделать так, чтобы она лучше любой другой прямой соответствовала расположению на плоскости экспериментальных точек (xi, yi). Признаком наилучшей прямой считается минимум суммы квадратов отклонений фактических значений y, полученных из таблицы, от вычисленных по формуле (1). Эта сумма квадратов рассчитывается по формуле S 2 = (y 1 – (a 0 + a 1 x 1))2 + (y 2 – (a 0 + a 1 x 2))2 +...+ (yn – (a 0 + a 1 xn))2 =
Обратим внимание на то, что все xi и yi — известные из таблицы числа, а S 2 есть функция двух переменных a 0 и a 1. S 2 = S 2(a 0, a 1)
Можно показать, что график функции S 2 выглядит примерно так, как изображено на рисунке. Единственная точка, в которой обе частные производные
Отсюда следует, что точку минимума можно искать, используя лишь необходимые условия экстремума:
На самом деле для функции S 2 = S 2(a 0, a 1) достаточно легко проверить выполнение достаточных условия экстремума, тогда не нужно обращаться к графику функции. Уравнения (2) и (3) можно преобразовать:
Получилась так называемая система нормальных уравнений относительно неизвестных величин a0 и a1. Формула (1) с параметрами a 0, a 1 определенными из системы (4), называется уравнением регрессии. Прямая линия, описываемая этим уравнением, называется линией регрессии. Для временных рядов обычно вместо слова “регрессия” употребляется слово тренд. Если экспериментальные точки в плоскости
Дата добавления: 2013-12-13; Просмотров: 205; Нарушение авторских прав?; Мы поможем в написании вашей работы! |