КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Статистическая обработка случайной величины Х - стаж работы
1. Статистическая обработка результатов эксперимента в случае выборки большого объема (n≥50) начинается с группировки выборочных значений, то есть с разбиения наблюдаемых значений СВ на к частичных интервалов равной длины и подсчета частот попадания значений СВ в частичные интервалы. Сделаем группировку наблюдаемых значений. Оптимальную длину интервала определим по формуле Стэрджеса: h= , где Хmax,Хmin – соответственно максимальное и минимальное выборочные значения СВ Х- стаж работы, n-объем выборки. Если h окажется дробным, то за величину интервала нужно взять, либо ближайшее целое число, либо ближайшую несложную дробь. Для СВ Х- стаж работы n=100, Хmax=90, Хmin=15 h= В качестве левого конца первого интервала возьмем величину, равную а1= Хmin- . Если аi – начало i-ого интервала, тогда а2= а1+ h=10+10=20 а3= а2+ h=20+10=30 а4= а3+ h=30+10=40 а5= а4+ h=40+10=50 а6= а5+ h=50+10=60 а7= а6+ h=60+10=70 а8= а7+ h=70+10=80 а9= а8+ h=80+10=90
Составим таблицу.
Вспомогательная таблица для расчета числовых характеристик выборки. Таблица 1
2. Первый и пятый столбцы таблицы 1 составляют интервальный статистический ряд относительных частот, графическое изображение которого – гистограмма относительных частот (ступенчатая фигура на рисунке 1). Дискретный статистический ряд относительных частот задается вторым и пятым столбцами, графическое изображение которого – полигон относительных частот (изображен на рисунке 1 ломаной линией).
3. Эмпирическая функция распределения F*(x) выборки служит для оценки функции распределения F(x) генеральной совокупности. Функция F*(x) определяет для каждого значения x относительную частоту события X<x: F*(x) = где nx –число выборочных значений, меньших х; n- объем выборки. Шестой столбец таблицы 1 содержит накопленные частоты, то есть значения эмпирической функции распределения F*(x), они относятся к верхней границе частотного интервала. Эмпирическая функция распределения F*(x) имеет вид: F*(x) =
График эмпирической функции распределения F*(х) изображен на рисунке 2 (для непрерывных распределений значения F*(х) распространяются на интервалы линейным интерполированием).
4. Для вычисления числовых характеристик выборки (, Дв, Sx, Ax*, Эx*) удобно использовать таблицу 2, где в первых двух столбцах приведены сгруппированные исходные данные, а остальные столбцы служат для вычисления числовых характеристик. Выборочное среднее вычисляют по формуле: , где m – число интервалов, xi-середины интервалов(шт). =(15*5+25*10+35*17+45*20+55*18+65*15+75*12+85*3)/100=4940/100=49.4 Выборочное среднее дает усредненное значение количества деталей для данной выборки.
Таблица для расчета числовых характеристик выборки. Таблица 2
Выборочную дисперсию для сгруппированных данных вычисляют по формуле:
Дв(х)= , Дв(х)=31664/100=316.64
Выборочное среднее квадратическое отклонение находят по формуле: Sx= Для случайной величины Х Sx= (годов). Оно показывает разброс выборочных значений хi относительно выборочного среднего =49.4. Выборочные коэффициенты асимметрии и эксцесса вычисляют по формулам: Ax*= , Эx*= ; Используя суммы из последних строк шестого и седьмого столбцов таблицы 2, получим: Ax*= -4483.2/100*(17.8)3 = -4483.2/563975.2= -0.00795 Эx*= 22163333.1/100*(17.8)4= 22163333.1/10038758.56= -0.7922 Ax*≠0 говорит о несимметричности полигона (гистограммы) относительно выборочного среднего . Отрицательный знак выборочного коэффициента эксцесса показывает, что полигон менее крут чем нормальная кривая.
5. Мы предварительно предполагаем, что СВ Х – стаж работы, распределена нормально по совокупности следующих признаков. Вид полигона и гистограммы относительных частот напоминает нормальную кривую (кривую Гаусса). Выборочные коэффициенты асимметрии Ax*= -0.00795 и Эx*= - 0.7922отличаются от значений асимметрии и эксцесса для нормального распределения (которые равны нулю) не более, чем на утроенные средние квадратические ошибки их определения. |Ax*|=|-0.00795|<0,7161=3*SА, |Эx*|=|-0.7922|<1,3917=3*Sэ, где SА= Sэ= Можно предположить, что стаж работы (СВ Х) изменяется под действием большого числа факторов, примерно равнозначных по количеству. Итак, по совокупности указанных признаков, можно предположить, что распределение СВ Х- стаж работы является нормальным.
6. Функция плотности нормального распределения имеет вид: В качестве неизвестных параметров α и σ возьмем их точечные оценки =49.4 и Sx=17.8 соответственно. Тогда дифференциальная f(x) и интегральная F(x) предполагаемого нормального закона распределения примут вид: ; F(x)=
7. Гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по предполагаемому нормальному закону, назовем нулевой (Н0:Х N(α,σ)), тогда На:Х N (α,σ). Проверим ее с помощью критерия согласия Пирсона. Согласно критерию Пирсона сравниваются эмпирические ni(наблюдаемые) и теоретические n*pi(вычисленные в предположении нормального распределения) частоты. В качестве критерия проверки нулевой гипотезы принимается случайная величина:
набл= по таблице критических точек распределения по заданному уровню значимости α и числу степеней свободы v=S-r-1 (S- число интервалов, r-число параметров предполагаемого распределения СВ Х) находится критическое значение (α,v). Если набл≤ кр, то считается, что данный критерий не дают оснований для отклонения гипотезы при данном уровне значимости α=0,05. в противном случае считается, что гипотеза не согласуется с экспериментальными данными и ее надо отвергнуть. Если проверяется гипотеза о нормальном распределении, то вероятности рi рассчитываются с помощью функции Лапласа Ф(х): рi=Р(xi<X≤xi+1)=Ф где х=49.4 – выборочное среднее; Sх=17.8 – выборочное среднее квадратическое отклонение.
p1=P(-∞<x≤20)=Ф -Ф(1.65)+Ф(∞)=-0.4505+0,5=0,0495 p2=P(20<x≤30)=Ф -Ф(1.1)+Ф(1.65)= -0.36433+0,4505=0,08617 p3=P(30<x≤40)=Ф -Ф(0.53)+Ф(1.1)= -0.2019+0.36433=0.16243 p4=P(40<x≤50)=Ф Ф(0.03)+Ф(0.5)=0,0120+0,2019=0.2139 p5=P(50<x≤60)=Ф Ф(0.59)-Ф(0.03)=0.2224-0.01197=0,21043 p6=P(60<x≤70)=Ф 0,3770-0,2224=0,1546 P7=P(70<x≤80)=Ф 0,4573-0,3770=0,0803 P8=P(80<x<∞)=Ф 0,5-0,4573=0,0427
Вычисления сведем в таблицу 3. количество интервалов S=8. Так как предполагается нормальное распределение имеющее два параметра (математическое ожидание α и среднее квадратическое отклонение σ), поэтому r=2, тогда число степеней свободы v=S-r-1=8-2-1=5
Таблица 3 Расчетная таблица для вычисления набл
Значение набл=0,03987 В таблице критических точек распределения по уровню значимости α=0,05 и числу степеней свободы v=5 найдем критическое значение кр(0,05;)=11,07. Так как набл > кр, то считаем, что есть основания для отклонения нулевой гипотезы при заданном уровне значимости α=0,05. Построим график эмпирической функции f(x). Для этого из середины частичных интервалов восстановим перпендикуляры высотой равной pi-вероятностям попадания СВ Х-стаж работы в соответствующий частичный интервал. На рисунке 3 концы перпендикуляров отмечены точками, полученные точки соединены плавной кривой.
Сравнение полигона относительных частот и нормальной кривой показывает, что построенная нормальная кривая удовлетворительно сглаживает полигон.
8. Найдем интервальные оценки параметров нормального закона распределения. Для нахождения доверительного интервала, покрывающего математическое ожидание СВ Х- стаж работы, найдем по таблицам квантилей распределения Стьюдента по заданной доверительной вероятности 1-α=γ=0,95 и числу степеней свободы v=n-1=100-1=99 число tγ=1,984. Вычислим предельную погрешность интервального оценивания: εх= tγ* =1,984 Запишем искомый доверительный интервал для математического ожидания α:
- εх<α< + εх, 49.4-3.5<α<49.4+3,5 45.9<α<52.9. Если будет произведено достаточно большое число выборок объема n СВ Х-стаж работы, из одной и той же генеральной совокупности, то в 95% выборок доверительный интервал (45.9;52.9)покроет математическое ожидание α, и только в 5% выборок математическое ожидание может выйти за границы доверительного интервала. Для нахождения доверительного интервала, покрывающего неизвестное среднее квадратическое отклонение σ с заданной вероятностью 1-α=γ=0,95, найдем по γ=0,95 и числу степеней свободы v=n-1=100-1=99 два числа γ1=0,878 и γ2=1,161. Искомый доверительный интервал равен:
γ1*Sx<σ< γ2*Sx, 0,878*17.8<σ<1,161*17.8, 15.6<σ<20.7 Если будет произведено достаточно большое число выборок объема n СВ Х- стаж работы, из одной и той же генеральной совокупности, то в 95 % выборок доверительный интервал (0,827;1,094) покроет среднее квадратическое отклонение σ, и только в 5% среднее квадратическое отклонение σ может выйти за границы доверительного интервала (15.6;,20.7).
ВЫВОД
Была проведена исследовательская работа над случайной двумерной величиной Х- кол-во обработанных деталей, шт.; У- время непрерывной работы станков, ч.Были построены интервальный и дискретный статистически ряды распределения частот и относительных частот, гистограммы и полигоны относительных частот, эмпирические функции распределения. Были вычислены числовые характеристики выборки: выборочную среднюю, выборочную дисперсию, выборочные коэффициенты асимметрии и эксцесса. Для Х- кол-во обработанных деталей и для У- время непрерывной работы станков, ч. несимметричный полигон (гистограмма) Правосторонняя асимметрия данного распределения, и полигон менее крут чем нормальная кривая. Х- кол-во обработанных деталей, шт.; У- время непрерывной работы станков, ч. распределены по нормальному закону, это видно исходя из механизма их образования, по виду гистограммы и полигона относительных частот и по значениям выборочных коэффициентов асимметрии и эксцесса. Далее были найдены точечные оценки параметров нормального закона распределения, и записаны функции плотности распределения вероятностей для Х- кол-во обработанных деталей, шт.; и для У- время непрерывной работы станков, ч. Проверила с помощью критерия согласия Пирсона гипотезу о том, что выборка извлечена из генеральной совокупности с предполагаемым нормальным законом распределения. Была приняты гипотезы и найдены интервальные оценки параметров нормального закона распределения И теперь проанализировав значения Х- кол-во обработанных деталей, шт.; У- время непрерывной работы станков, ч. провела корреляционный анализ: составила корреляционную таблицу; нашла выборочный коэффициент корреляции; проверила значимость выборочного коэффициента корреляции rв ;построила корреляционное поле и по характеру расположения точек на нем подобрать общий вид функции регрессии; нашла эмпирические функции регрессии У- время непрерывной работы станков, ч.на Х- кол-во обработанных деталей, шт.;, X на Y и построила их графики. В результате было выявлено, что математическая статистика основана на теории вероятности, изучающая методы сбора и обработки результатов наблюдений, с целью выявления закономерностей. Я рассматривала методы, позволяющие делать научно обоснованные выводы о числовых значениях параметров распределения генеральной совокупности по случайной выборке, о неизвестной функции распределения и плотности распределения, о корреляционной зависимости одной случайной величины Х от другой У по случайным выборкам, проверять статистические гипотезы на основе выборочных данных.
Заключение.
В результате проведенной работы мной установлено, что случайные величины Х-количество обработанных деталей и У- время непрерывной работы станков, распределены по нормальному закону распределения и между ними существует корреляционная зависимость. Список используемой литературы. 1. Гмурман В.Е. Теория вероятностей и математическая статистика. Учеб. пособие для вузов. - М.:Высш. школа, 1997.-479с. 2. Сборник задач по математике для вузов. – Ч.З. Теория вероятностей и математическая статистика: Учеб. пособие для вузов/Под ред. А.В. Ефимова. – М.:Наука, 1990.-348с. 3. Шушерина О.А. Математическая обработка экспериментальных данных: Методические указания к лабораторной работе. – Красноярск: СТИ, 1982.-36с.
Дата добавления: 2015-08-31; Просмотров: 640; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |