Интервальное расспределение, эмпирическая функция Seekland INFO Сообщество взаимопомощи студентов и школьников / Спільнота взаємодопомоги студентів і школярів.

0 Голосов

Posted Февраль 25, 2015 by Nick_m1

Категория: Математическая статистика

Всего просмотров: 14183

Для данной выборки прибыли предприятия (млн. Грн.):

1) составить интервальное статистическое распределение;

2) найти эмпирическую функцию и построить ее график;

3) построить гистограмму частот;

4) найти средний доход предприятия (выборочную среднюю), отклонения от среднего значения прибыли (дисперсию и среднее квадратическое отклонение).

Данные: 9 7 8 7 5 8 9 6 10 7 10 10 9 10 5 9 7 8 10 6

Теги: интервальный ряд распределения для выборки, эмпирическая функция, выборочная средняя, дисперсия

Лучший ответ

0 Голосов

Posted Февраль 25, 2015 by Вячеслав Моргун

Решение:

1. Составим интервальный ряд распределения для выборки :
а) упорядочим значения выборки по возрастанию:
5 5 6 6 7 7 7 7 8 8 8 9 9 9 9 10 10 10 10 10
- найдем диапазон изменения признака x (размах выборки)
Пусть $x_{min}$ и $x_{max}$ − соответственно наименьшее и наибольшее значения вариант выборки. Величина
$R = x_{max} - x_{min} = 10-5=5$ называется размахом выборки

б) определение количество интервалов
количество интервалов можно вычислить по одной из следующих формул
$K \approx \sqrt{n} \approx \sqrt{20} => K = 5 $.
$K < 5\lg(20) => K < 6.5 $.
Можно пользоваться и другими эмпирическими формулами, например, формулой Стерджеса
$K \approx 1 + 3.322 \ln(n) => K \approx 1 + 3.322 \lg(20) => K = 5 $.
Округляем результат до целого числа.
Эти формулы дают приблизительно равные результаты.

Обычно предполагают, что количество интервалов должно удовлетворять условию $5 \leq K \leq 20 $.

в) найдем ширину интервала
$d = \frac{R}{K} = \frac{5}{5}=1$
г) Составим таблицу интервальной группировки, которая будет выглядеть следующим образом:

После разбиения на интервалы определяют:

абсолютные частоты $m_i$ , i=1,..,K , где $m_i$ − количество элементов выборки, попавших в i − й интервал (элемент, попавший на границу интервала, относят к какому-нибудь выбранному интервалу, например, левому, или правому; если на границу интервала попадает много элементов выборки, то их делят пополам между левым и правым интервалами);

относительные частоты $h_i = \frac{m_i}{n}$

относительные накопленные частоты $ \sum_{j=1}^i\frac{m_j}{n} = \sum_{j=1}^ih_j, \quad i = 1,2,...K$

середины интервалов $u_i$
$$\begin{array}{|c|c|}Интервалы & 5-6 & 6-7 & 7-8 & 8-9 & 9-10 & 10-11\\ частоты(m_i) & 2 & 2 & 4 & 3 & 4 & 5 \\ относ. частоты(h_i) & 0.1 & 0.1 & 0.2 & 0.15 & 0.2 & 0.25 \\ относ.накоп.част & 0.1 & 0.2 & 0.4 & 0.55 & 0.75 & 1\\ u_i & 5.5 & 6.5 & 7.5 & 8.5 & 9.5 & 10.5\end{array}$$

При этом $ \sum_{i=1}^Km_i =n; \quad \sum_{i=1}^Kh_i=1$

2. найти эмпирическую функцию и построить ее график:

Эмпирической функцией распределения (функцией распределения выборки) называют функцию $F(x)$, определяющую для каждого значения $x$ относительную частоту события $X < x$: $$F(x) = \frac{n_x}{n}$$
$n_x$ — число вариант, меньших $x$; $n$ — объем выборки.

Эмпирическую функцию распределения $F_n(x)$ получают построением ступенчатой кривой относительных накопленных частот; $F_n(x)$ имеет скачки в точках, соответствующих серединам интервалов $u_i$ .
Найдем эмпирическую функцию
Наименьшая варианта равна 5, следовательно F(x)=0 при $ x \leq 5$ . Значение $ х < 6$ , а именно $ F(x)=h_1= 0.1$, при $x < 6; h_1=0.1;h_2=0.1 => F(x) = h_1+h_2=0.2$ и т.д. $$F(x) = \begin{cases} 0 & x < 5\\ 0.1 & 5 \leq x < 6 \\ 0.2 & 6 \leq x < 7 \\ 0.4 & 7 \leq x < 8 \\ 0.55 & 8 \leq x < 9 \\ 0.75 & 9 \leq x < 10 \\ 1 & 10 \leq x \end{cases}$$ эмпирическая функция, график эмпирической функции

3. построить гистограмму частот:
данные берем из таблицы
гистограмма частот

4. найти средний доход предприятия (выборочную среднюю), отклонения от среднего значения прибыли (дисперсию и среднее квадратическое отклонение).

- Выборочная средняя, если сделана дискретная группировка рассчитывается по формуле $$\overline{x} = \frac{1}{n}\sum_{i=1}^Km_ix_i = \sum_{i=1}^Kh_ix_i$$
Считаем $$\overline{x} = 5*0.1+6*0.1+7*0.2+8*0.15+9*0.2+10*0.25 = 8$$
Можно было рассчитать по формуле $$\overline{x} = \frac{1}{n}\sum_{i=1}^nx_i$$ $$ \overline{x} = \frac{1}{20}(5+ 5+ 6+ 6+ 7+ 7+ 7+ 7+ 8+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 10+ 10) = \frac{160}{20}=8$$

− выборочная (эмпирическая) дисперсия
$$ \sigma = S^2 = \frac{1}{n-1}\sum_{i=1}^Km_i(x_i-\overline{x})^2 = $$$$ \sigma= \frac{1}{20-1}[2(5-8)^2+2(6-8)^2+4(7-8)^2+3(8-8)^2+4(9-8)^2+5(10-8)^2] \approx 2.84$$

- среднее квадратическое отклонение
$$S = \sqrt{\sigma} = \sqrt{2.84} = 1.69$$