Зарегистрироваться
Seekland Info сообщество взаимопомощи студентов и школьников. / Seekland Info спільнота взаємодопомоги студентів і школярів.

Интервальное расспределение, эмпирическая функция


0 Голосов
Nick_m1
Posted Февраль 25, 2015 by Nick_m1
Категория: Математическая статистика
Всего просмотров: 13964

Для данной выборки прибыли предприятия (млн. Грн.):


 1) составить интервальное статистическое распределение;


 2) найти эмпирическую функцию и построить ее график;


 3) построить гистограмму частот;


 4) найти средний доход предприятия (выборочную среднюю), отклонения от среднего значения прибыли (дисперсию и среднее квадратическое отклонение).


Данные: 9 7 8 7 5 8 9 6 10 7 10 10 9 10 5 9 7 8 10 6 

Теги: интервальный ряд распределения для выборки, эмпирическая функция, выборочная средняя, дисперсия

Лучший ответ


0 Голосов
Вячеслав Морг
Posted Февраль 25, 2015 by Вячеслав Моргун

Решение


1. Составим интервальный ряд распределения для выборки :
 а) упорядочим значения выборки по возрастанию:
     5 5 6 6 7 7 7 7 8 8 8 9 9 9 9 10 10 10 10 10  
 - найдем диапазон изменения признака x (размах выборки) 
Пусть \(x_{min}\) и \(x_{max}\) − соответственно наименьшее и наибольшее значения вариант выборки. Величина
\(R = x_{max} - x_{min} = 10-5=5\) называется размахом выборки


 б)  определение количество интервалов
количество интервалов можно вычислить по одной из следующих формул
\(K \approx \sqrt{n} \approx \sqrt{20} => K = 5 \). 
\(K < 5\lg(20) => K < 6.5 \). 
Можно пользоваться и другими эмпирическими формулами, например, формулой Стерджеса
\(K \approx 1 + 3.322 \ln(n) => K \approx 1 + 3.322 \lg(20) => K =  5 \).
Округляем результат до целого числа.
Эти формулы дают приблизительно равные результаты.


Обычно предполагают, что количество интервалов должно удовлетворять условию \(5 \leq K \leq 20 \).


 в) найдем ширину интервала 
\(d = \frac{R}{K} = \frac{5}{5}=1\) 
 г) Составим таблицу интервальной группировки, которая будет выглядеть следующим образом:


После разбиения на интервалы определяют:



  • абсолютные частоты \(m_i\) , i=1,..,K , где \(m_i\) − количество элементов выборки, попавших в i − й интервал (элемент, попавший на границу интервала, относят к какому-нибудь выбранному интервалу, например, левому, или правому; если на границу интервала попадает много элементов выборки, то их делят пополам между левым и правым интервалами);

  • относительные частоты \(h_i = \frac{m_i}{n}\)

  • относительные накопленные частоты \( \sum_{j=1}^i\frac{m_j}{n} = \sum_{j=1}^ih_j, \quad i = 1,2,...K\)

  • середины интервалов \(u_i\) 
    $$\begin{array}{|c|c|}Интервалы & 5-6 & 6-7 & 7-8 & 8-9 & 9-10 & 10-11\\ частоты(m_i) & 2 & 2 & 4 & 3 & 4 & 5 \\ относ. частоты(h_i) & 0.1 & 0.1 & 0.2 & 0.15 & 0.2 & 0.25 \\ относ.накоп.част & 0.1 & 0.2 & 0.4 & 0.55 & 0.75 & 1\\ u_i & 5.5 & 6.5 & 7.5 & 8.5 & 9.5 & 10.5\end{array}$$ 

  • При этом  \( \sum_{i=1}^Km_i =n; \quad \sum_{i=1}^Kh_i=1\) 


2. найти эмпирическую функцию и построить ее график:


Эмпирической функцией распределения (функцией распределения выборки) называют функцию \(F(x)\), определяющую для каждого значения \(x\) относительную частоту события \(X < x\): $$F(x) = \frac{n_x}{n}$$
\(n_x\) — число вариант, меньших \(x\); \(n\) — объем выборки.


Эмпирическую функцию распределения \(F_n(x)\) получают построением ступенчатой кривой относительных накопленных частот; \(F_n(x)\) имеет скачки в точках, соответствующих серединам интервалов \(u_i\) . 
Найдем эмпирическую функцию
Наименьшая варианта равна 5, следовательно F(x)=0 при \( x \leq 5\) . Значение \( х < 6\) , а именно \( F(x)=h_1= 0.1\), при \(x < 6; h_1=0.1;h_2=0.1 => F(x) = h_1+h_2=0.2\) и т.д. $$F(x) = \begin{cases} 0 & x < 5\\ 0.1 & 5 \leq x < 6 \\ 0.2 & 6 \leq x < 7 \\ 0.4 & 7 \leq x < 8 \\ 0.55 & 8 \leq x < 9 \\ 0.75 & 9 \leq x < 10 \\ 1 & 10 \leq x \end{cases}$$эмпирическая функция, график эмпирической функции


3. построить гистограмму частот:
данные берем из таблицы
 гистограмма частот


4. найти средний доход предприятия (выборочную среднюю), отклонения от среднего значения прибыли (дисперсию и среднее квадратическое отклонение).


 - Выборочная средняя, если сделана дискретная группировка рассчитывается по формуле $$\overline{x} = \frac{1}{n}\sum_{i=1}^Km_ix_i = \sum_{i=1}^Kh_ix_i$$
Считаем $$\overline{x} = 5*0.1+6*0.1+7*0.2+8*0.15+9*0.2+10*0.25 = 8$$ 
Можно было рассчитать по формуле $$\overline{x} = \frac{1}{n}\sum_{i=1}^nx_i$$ $$ \overline{x} = \frac{1}{20}(5+ 5+ 6+ 6+ 7+ 7+ 7+ 7+ 8+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 10+ 10) = \frac{160}{20}=8$$


− выборочная (эмпирическая) дисперсия 
$$ \sigma = S^2 = \frac{1}{n-1}\sum_{i=1}^Km_i(x_i-\overline{x})^2 = $$$$ \sigma= \frac{1}{20-1}[2(5-8)^2+2(6-8)^2+4(7-8)^2+3(8-8)^2+4(9-8)^2+5(10-8)^2] \approx 2.84$$ 


 - среднее квадратическое отклонение 
$$S = \sqrt{\sigma} = \sqrt{2.84} = 1.69$$