Решение:
1. Составим интервальный ряд распределения для выборки :
а) упорядочим значения выборки по возрастанию:
5 5 6 6 7 7 7 7 8 8 8 9 9 9 9 10 10 10 10 10
- найдем диапазон изменения признака x (размах выборки)
Пусть \(x_{min}\) и \(x_{max}\) − соответственно наименьшее и наибольшее значения вариант выборки. Величина
\(R = x_{max} - x_{min} = 10-5=5\) называется размахом выборки
б) определение количество интервалов
количество интервалов можно вычислить по одной из следующих формул
\(K \approx \sqrt{n} \approx \sqrt{20} => K = 5 \).
\(K < 5\lg(20) => K < 6.5 \).
Можно пользоваться и другими эмпирическими формулами, например, формулой Стерджеса
\(K \approx 1 + 3.322 \ln(n) => K \approx 1 + 3.322 \lg(20) => K = 5 \).
Округляем результат до целого числа.
Эти формулы дают приблизительно равные результаты.
Обычно предполагают, что количество интервалов должно удовлетворять условию \(5 \leq K \leq 20 \).
в) найдем ширину интервала
\(d = \frac{R}{K} = \frac{5}{5}=1\)
г) Составим таблицу интервальной группировки, которая будет выглядеть следующим образом:
После разбиения на интервалы определяют:
- абсолютные частоты \(m_i\) , i=1,..,K , где \(m_i\) − количество элементов выборки, попавших в i − й интервал (элемент, попавший на границу интервала, относят к какому-нибудь выбранному интервалу, например, левому, или правому; если на границу интервала попадает много элементов выборки, то их делят пополам между левым и правым интервалами);
- относительные частоты \(h_i = \frac{m_i}{n}\)
- относительные накопленные частоты \( \sum_{j=1}^i\frac{m_j}{n} = \sum_{j=1}^ih_j, \quad i = 1,2,...K\)
- середины интервалов \(u_i\)
$$\begin{array}{|c|c|}Интервалы & 5-6 & 6-7 & 7-8 & 8-9 & 9-10 & 10-11\\ частоты(m_i) & 2 & 2 & 4 & 3 & 4 & 5 \\ относ. частоты(h_i) & 0.1 & 0.1 & 0.2 & 0.15 & 0.2 & 0.25 \\ относ.накоп.част & 0.1 & 0.2 & 0.4 & 0.55 & 0.75 & 1\\ u_i & 5.5 & 6.5 & 7.5 & 8.5 & 9.5 & 10.5\end{array}$$
- При этом \( \sum_{i=1}^Km_i =n; \quad \sum_{i=1}^Kh_i=1\)
2. найти эмпирическую функцию и построить ее график:
Эмпирической функцией распределения (функцией распределения выборки) называют функцию \(F(x)\), определяющую для каждого значения \(x\) относительную частоту события \(X < x\): $$F(x) = \frac{n_x}{n}$$
\(n_x\) — число вариант, меньших \(x\); \(n\) — объем выборки.
Эмпирическую функцию распределения \(F_n(x)\) получают построением ступенчатой кривой относительных накопленных частот; \(F_n(x)\) имеет скачки в точках, соответствующих серединам интервалов \(u_i\) .
Найдем эмпирическую функцию
Наименьшая варианта равна 5, следовательно F(x)=0 при \( x \leq 5\) . Значение \( х < 6\) , а именно \( F(x)=h_1= 0.1\), при \(x < 6; h_1=0.1;h_2=0.1 => F(x) = h_1+h_2=0.2\) и т.д. $$F(x) = \begin{cases} 0 & x < 5\\ 0.1 & 5 \leq x < 6 \\ 0.2 & 6 \leq x < 7 \\ 0.4 & 7 \leq x < 8 \\ 0.55 & 8 \leq x < 9 \\ 0.75 & 9 \leq x < 10 \\ 1 & 10 \leq x \end{cases}$$
3. построить гистограмму частот:
данные берем из таблицы
4. найти средний доход предприятия (выборочную среднюю), отклонения от среднего значения прибыли (дисперсию и среднее квадратическое отклонение).
- Выборочная средняя, если сделана дискретная группировка рассчитывается по формуле $$\overline{x} = \frac{1}{n}\sum_{i=1}^Km_ix_i = \sum_{i=1}^Kh_ix_i$$
Считаем $$\overline{x} = 5*0.1+6*0.1+7*0.2+8*0.15+9*0.2+10*0.25 = 8$$
Можно было рассчитать по формуле $$\overline{x} = \frac{1}{n}\sum_{i=1}^nx_i$$ $$ \overline{x} = \frac{1}{20}(5+ 5+ 6+ 6+ 7+ 7+ 7+ 7+ 8+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 10+ 10) = \frac{160}{20}=8$$
− выборочная (эмпирическая) дисперсия
$$ \sigma = S^2 = \frac{1}{n-1}\sum_{i=1}^Km_i(x_i-\overline{x})^2 = $$$$ \sigma= \frac{1}{20-1}[2(5-8)^2+2(6-8)^2+4(7-8)^2+3(8-8)^2+4(9-8)^2+5(10-8)^2] \approx 2.84$$
- среднее квадратическое отклонение
$$S = \sqrt{\sigma} = \sqrt{2.84} = 1.69$$