Имя: Пароль:
IT
 
Количество выборок и нормальный закон распределения.
0 Stim
 
13.05.10
13:42
Помогите, уже недели 2 мучаюсь. Данные для задачи:
Происходит измерение параметров видеосигнала - размах полезной составляющей. Её значение определено по ГОСТу 0,7+-0,02 В.
Т.е. проще говоря дана выборка с разбросом значений, среднее значение стремится к 0,7В (при количестве измерений, стремящихся к бесконечности)Процесс подчинен нормальному закону распределения.
Выборка большая - порядка 10 000 значений. Необходимо найти такое количество значений из неё, чтобы среднее значение всех выбранных амплитуд было не больше 0,72 или не меньше 0,68. Т.е. если выбрать 1000 амплитуд из 10 000, то среднее будет 0,73, значит нужно брать больше.
http://ru.wikipedia.org/wiki/Нормальное_распределение
Помогите, плз
1 Denp
 
13.05.10
13:47
а дисперсия какая?
2 Denp
 
13.05.10
13:48
"если выбрать 1000 амплитуд из 10 000, то среднее будет 0,73" - и это еще на основании чего?
3 Stim
 
13.05.10
13:52
(1)Диперсия - хз. выбирать надо по правилу 3 сигм, плотность распределения вероятности при этом составит 99,7%
(2) ну на основании экспериментально полученных данных.. не рассчитанных, а реально измеренных. это я для примера..
4 Stim
 
13.05.10
13:53
5 Denp
 
13.05.10
13:57
(3) что-то ты не так сформулировал.
в чем задача? найти при каком количестве наблюдений среднее на 100% попадет в заданный интервал?

нипоняяяятна (С)
переформулируй

ЗЫ а при чем тут три сигмы?
6 Stim
 
13.05.10
14:00
(5) да. Имеется огромное число выборок, необходимо из них выбрать число поменьше, но такое, чтобы среднее значение этой уменьшенной выборки не выходило за пределы 0,7+-0,02. А само значение измеряемого сигнала может быть любым - тому виной случайные помехи.
7 Mikeware
 
13.05.10
14:00
Бред какой-то
8 Mikeware
 
13.05.10
14:01
(6) А ПРВ помех каково?
9 Stim
 
13.05.10
14:02
(8) плотность распределеления вероятности 99,7% , по уровню 3 сигма
http://upload.wikimedia.org/wikipedia/commons/8/8c/Standard_deviation_diagram.svg
10 Лодырь
 
13.05.10
14:03
Строго говоря нет никакой гарантии, что среднее попадет в этот интервал. Всегда есть вероятность отличная от нуля, что искомый результат не достигнется. Задачу можно решить лишь с некоторой точностью.
11 Jstunner
 
13.05.10
14:06
надо найти "максимальное" количество значений?
12 Mikeware
 
13.05.10
14:06
(9) Нифига не понял, что ты хотел сказать этим постом.
Т.е помехи тоже нормальны?
13 Stim
 
13.05.10
14:08
(11) да, максимальное количество значений
(12) да, помехи случайные, распределены по нормальному закону
14 Mikeware
 
13.05.10
14:09
(13) ПРВ помех?
15 Жан Пердежон
 
13.05.10
14:10
тоже не втыкаю...
отсортировать результаты выборки и набрать сколько надо... не?
16 Mikeware
 
13.05.10
14:10
(11)(13) Не максимальное, а минимальное
17 zak555
 
13.05.10
14:12
это какой курс ?
18 Stim
 
13.05.10
14:13
(15) не. значений будет 100 000 в секунду. Аппаратура не успеет столько обработать. Нужно обработать только часть, но рассчитать, чтобы среднее значение всей этой части не выходило за допуск по ГОСТу 0,7+-0,02В
19 Jstunner
 
13.05.10
14:13
я бы разбил весь этот массив на блоки, для них вычислил бы средние. Из них нашел самую длинную последовательность. К найденой последовательности блоков, добавил бы соседние, невошедшие. Получившуюся последовательно, разеделил бы yf субблоки и по новой..
20 Stim
 
13.05.10
14:13
(17) это часть диплома :)
21 Жан Пердежон
 
13.05.10
14:15
(18) и как же эту часть рассчитать, если ее аппаратура не успеет обработь?
22 Denp
 
13.05.10
14:17
(14) я так понял, что помехи - это отклонение сигнала от среднего.

кароче.
это уже не тервер, это матстат

нужно вспоминать зависимость выборочного среднего и дисперсии от эн

ЗЫ но 100% результата все равно не будет, только с заданной точностью.
23 Mikeware
 
13.05.10
14:19
(20) Помеха аддитивна, распределение сигнала и помехи нормальные. Складывай ПРВ сигнала и ПРВ помехи, и считай от них функцию распределения. Ну и границы знаешь, отсюда вычислишь оба количества.
24 Mikeware
 
13.05.10
14:20
(22) Не с заданой точностью, а с заданной вероятностью
25 Mikeware
 
13.05.10
14:22
(18) А вообще, во-первых, надо подумать (забыл уже все за столько лет), а во-вторых, если не решишь - стучись в аську. Уехать надо.
26 Denp
 
13.05.10
14:22
(24) хорошо-хорошо)

только с чего ты взял, что тут будут и помехи, и сигнал? я так понял из (0), речь идет уже о результирующем сигнале, он распределен нормально.
27 Stim
 
13.05.10
14:23
(21) нужно рассчитать такую часть(например это будет 1/10 от общего числа выборок), которую и аппаратура успеет обработать и среднее значение будет оставаться в допустимых рамках.

(23)эмм..поподробнее, если не сложно..
28 Stim
 
13.05.10
14:25
(26) я как понимаю - сигнал должен быть в идеале 0,7В. Но идеальных случаев не бывает, всегда накладываются какие-то помехи на результат измерения. Поэтому в ГОСТе и принят допуск на измерение - 0,02В. Необходимо найти такое минимальное количество измерений, чтобы среднее значение не выходило за этот допуск..
29 Denp
 
13.05.10
14:28
(28) то есть сигнал является постоянным и равен 0,7В? тогда забудь про (23)

и все-таки, откуда будешь брать дисперсию (или сигму, не суть важно)? Считать по факту прошлых секунд?

потому что 0,02 - это явно меньше 3 сигм, раз секундное среднее может выскочить за этот интервал.
30 Stim
 
13.05.10
14:32
(29) честно - у меня уже голова кругом идет..
31 Лодырь
 
13.05.10
14:43
(30) Еще раз напишу в понятной форме того что ты не учитываешь. Допустим у тебя среднее 999 значений укладывается в 0.68-0.72. Тогда всегда с вероятностью отличной от нуля найдется 1000ное значение Х, такое что среднее тысячи значений не уложится в заданный диапазон (банально берем Х=1000). Следовательно, задача имеет решение лишь с некоторой вероятностью. Следовательно, надо изначально зафиксировать допуски к вероятности, а лишь потом решать.
32 Stim
 
13.05.10
14:45
(31) плотность распределения вероятности измеряемого параметра должна быть 99,7% - этого не достаточно?
33 Denp
 
13.05.10
14:47
(32) а это из условия задачи? или из правила 3 сигм?)
34 Жан Пердежон
 
13.05.10
14:48
(0) Верна ли грубая аналогия:
В черном ящике лежат черные и белые шары. Тебе нужно найти такое число шаров N, что если их вытащить количество черных и белых окажется (примерно) одинаковым?))
35 Stim
 
13.05.10
14:48
(33) это условие задачи.
36 Stim
 
13.05.10
14:50
(34) немножно не так. в ящике лежит бесконечно много шаров, примерно 50/50 белых и черных. Нужно вытащить такое минимальное количество шаров, чтобы соотношение белых/черных в них было - 55/45. Примерно так.
37 Denp
 
13.05.10
14:50
(32) задача у тебя будет сводится к следующему.
найти кол-во наблюдений Эн, при котором выборочное среднее, подчиняющееся нормальному закону (неизвестному), будет попадать в заданный интервал с вероятностью 99,7%.
то есть найти зависимость дисперсии выборочного среднего от размера выборки. Вроде простая задача. Учебник матстата в зубы и вперед.

(34) почти
38 Жан Пердежон
 
13.05.10
14:52
(36) ну тогда решения она не имеет, вдруг не та масть попрет...
39 Stim
 
13.05.10
14:53
(37)эххх.. я уже пол интернета перекопал..забил в свое время в универе на тервер, теперь вот мучаюсь..
40 Stim
 
13.05.10
14:53
(36)масть рассчитывается по нормальному закону распределения..
41 Жан Пердежон
 
13.05.10
14:54
(40) и что из этого следует?)
42 Denp
 
13.05.10
14:55
(39) в интернете ты нормального по терверу не найдешь. Максимум - скан учебника.
Дойди до радиковской библиотеки. Возьми учебник матстата.
Можно Коршунова "Математическая кибернетика", тервер там понятен, не помню, есть ли там матстат.
43 Жан Пердежон
 
13.05.10
14:58
(37) 99,7% - это, я полагаю, он взял из (1 - 0,02/7)*100%
44 Stim
 
13.05.10
14:58
(42) спс..только нужно уже завтра сделать, а в радик сегодня поздновато идти..эхх..
45 Denp
 
13.05.10
14:59
(43) 99,7% - это святое число) три сигмы нормального.
(44) ниче не поздно. уж доехать до абонемента успеешь точно, а матстат на абонемент легко дается.
46 Stim
 
13.05.10
15:00
(45)хотел к преподу какому подойти в радике.. мож успею сегодня еще, хоть Анатолия Ивановича найду:) мы с ним в хороших отношениях..)
47 Denp
 
13.05.10
15:01
Анатолий Иваныч - как фамилия?
48 Stim
 
13.05.10
15:02
Новиков, завкаф:) сейчас не знаю, правда, как он..
49 Denp
 
13.05.10
15:05
знакомое, но не помню) не Новичков - уже хорошо) учебник на ночь все же возьми
50 Жан Пердежон
 
13.05.10
15:18
подытожим:
есть некая генеральная совокупность объектов распределенных нормально со средним значением 0.7 (с неизвестной дисперсией). Нужно найти такой размер выборки, чтобы среднее её значение попадало в диапазон [0.68,0.72] с вероятностью 99,7%.

Так?
51 Stim
 
13.05.10
15:20
(50) да-да-да
52 Denp
 
13.05.10
15:20
(50) я так понял
53 Жан Пердежон
 
13.05.10
15:27
по (5) и (6) сложилось совсем другое условие задачи, да и сейчас похоже, что
решения всё равно нет
54 Denp
 
13.05.10
15:38
(53) почему нет?) дайте мне учебник, и я решу) навверно)
55 Stim
 
13.05.10
21:55
во нашел:

5.5. Определение необходимого объема выборки для получения оценок заданной точности

Обычно исследователя интересует вопрос: какой минимальный объем выборки необходим для того, чтобы оценка (чаще всего выборочное среднее арифметическое ) отличалась от истинного значения среднего значения генеральной совокупности не более чем на заданную величину?

Ответить на этот вопрос можно, если ввести доверительную вероятность и выбрать объем выборки n таким образом, чтобы доверительный интервал имел заданный размер.

Если генеральная совокупность предполагается нормально распределенной и ее дисперсия  известна, то доверительный интервал для среднего значения  записывается следующим образом:



где uа для стандартных доверительных вероятностей определены в табл. 5.2.

Пусть требуется, чтобы выборочное среднее  отличалось от генерального , не более чем на заданную величину d. Это означает, что половина ширины доверительного интервала должна быть равна d, т. е. половина от



должна равняться d:



Отсюда требуемый объем выборки определяется следующим образом:

                                                                                                                                   (5.5)

Истинное значение параметра  генеральной совокупности обычно неизвестно, но при больших объемах выборки (n  30) можно использовать его выборочную оценку S. Тогда

                                                                                                                                   (5.6)
56 Stim
 
13.05.10
21:55
сорри, http://bars-minsk.narod.ru/stud/VM/lecture3.htm с формулами
57 Михаил Козлов
 
13.05.10
22:17
Нормированное (на выборочную дисперсию) выборочное среднее распределено по Стьюденту (нормированное на истинную - по Гауссу).
Но непонятно, как можно что-то посчитать, если нет значения выборочной дисперсии: результат будет зависеть от ее величины: если маленькая, то и ответ будет меньше. Может в условии задачи что-то про дисперсию сказано?
58 Stim
 
13.05.10
22:28
(57) нету ничего про дисперсию в условии задачи
59 Жан Пердежон
 
14.05.10
10:30
(58) по твоей же ссылке из (56) последняя строка
60 Stim
 
14.05.10
10:36
(56) а как получить значение S ?
61 Михаил Козлов
 
14.05.10
10:46
(58) Что-то ступил вечером: есть же допуск +-0,02. Может это и есть дисперсия? Или это 3 сигма? Что в ГОСТ понимается под допуском?
Если это 3 сигма, то достаточно взять одно значение, т.к. именно так устроен ГОСТ. Если померянное значение выйдет за диапазон, значит ГОСТ не соблюден.
Если это 1 сигма, то в соответствии с Гауссом (или Стьюдентом).
62 Stim
 
14.05.10
10:54
(61) ГОСТ: http://vsegost.com/Catalog/19/19058.shtml   5 страница

Я так понимаю, что это допуск на реальное значение сигнала. А измеряем его мы с ошибками и пограшностями, в том числе и со случайными. Поэтому сигма это другое..
63 Михаил Козлов
 
14.05.10
11:09
Тогда нужно смотреть класс точности измерительного прибора.
64 Stim
 
14.05.10
11:12
(63) это не причем. это другое. Сначала нужно определиться с выборкой. А потом уже рассчитывать погрешности прибора.(Хотя что рассчитывать - АЦП, точность - половина последнего разряда)
65 Ненавижу 1С
 
гуру
14.05.10
12:12
Необходимо найти такое количество значений из неё, чтобы среднее значение всех выбранных амплитуд было не больше 0,72 или не меньше 0,68. Т.е. если выбрать 1000 амплитуд из 10 000, то среднее будет 0,73, значит нужно брать больше.

Сколько нужно брать - это можно сказать только с определенной вероятностью, а не абсолютно.
66 Stim
 
14.05.10
12:34
(65)вот так задача формулируется:
есть некая генеральная совокупность объектов распределенных нормально со средним значением 0.7 (с неизвестной дисперсией). Нужно найти такой размер выборки, чтобы среднее её значение попадало в диапазон [0.68,0.72] с вероятностью 99,7%.
67 Ненавижу 1С
 
гуру
14.05.10
12:45
68 Stim
 
14.05.10
12:52
На основе этих формул может быть рассчитан объем выборки n, требуемый для построения доверительного интервала определенной ширины; также может быть найден уровень значимости. Решение этих задач предполагает, что s2 известна или мы можем оценить её с помощью s или р из первоначальной выборки.

а если они неизвестны? Как их можно оценить?
69 Ненавижу 1С
 
гуру
14.05.10
13:19
пример 5.9 подробно разобран, по-моему твой случай
70 Михаил Козлов
 
14.05.10
17:19
(68) Без дисперсии нельзя.
Представим себе, что есnь 2 ГС: N(0,1) и N(0,0000000001). Ответ будет разным.
71 Denp
 
17.05.10
09:18
(68) еще раз предлагаю дисперсию оценивать по прошлым секундам.
Такой адаптивный механизм получится своеобразный)
72 Mikeware
 
17.05.10
09:31
(71) Ему не надо адаптивный алгоритм. У него процесс установившийся (по крайней мере, таковым считается)
Раз уж ему ожидаемое матожтидание известно и стабильно - значит, и дисперсия стабильна и известна. По крайней мере, по имеюшейся выборке...
73 Stim
 
17.05.10
09:34
(72) можно ли считать 0,02 - дисперсией
74 Stim
 
17.05.10
09:34
+??
75 Жан Пердежон
 
17.05.10
10:56
(73) это у тебя надо спросить, судя по всему - хз )))
76 Mikeware
 
17.05.10
11:03
(73) Разрешаю!
шютка. Ну я ж не знаю твоей выборки...
77 Stim
 
17.05.10
11:04
(76) её никто не знает. Известен лишь интервал в ГОСТе - [0.68, 0.72]
78 Михаил Козлов
 
17.05.10
12:42
(77) Скорее всего, да. Может надо еще добавить ошибку прибора. Попробуйте посчитать в таком предположении.
79 Stim
 
17.05.10
12:44
(78) ошибка прибора известна. Где-то 0,001В.
80 Denp
 
17.05.10
12:47
(73) нет, нельзя
на каком основании? Фактический сигнал может иметь любую дисперсию
даже нельзя считать, что это 3 сигмы, иначе задача в (0) вообще бы не стояла.
81 Михаил Козлов
 
17.05.10
13:00
(79) Можно принебречь.
(80) Если любую, то какой смысл в допуске?
82 Stim
 
17.05.10
13:03
(80) дисперсия - это среднее отклонение от матожидания, т.е. среднего, так?
83 Denp
 
17.05.10
13:04
(82) нет

(81) если сигнал не выходит за пределы допуска, то среднее любой выборки будет внутри допуска, и задача (0) теряет смысл.
84 Stim
 
17.05.10
13:06
(83) во-во. Значит, этот допуск указывает на то, "в каких рамках" нужно получать значение измеренного параметра
85 Denp
 
17.05.10
13:06
(81) а если считать, что величина допуска - это дисперсия, то почему не половина дисперсии? не двойная дисперсия? математического смысла в таком приравнивании нет

Если не приравнивать допуск к трем сигмам, но, повторюсь, тогда задача теряет смысл.
86 Stim
 
17.05.10
13:09
Если следовать последней формуле из  http://bars-minsk.narod.ru/stud/VM/lecture3.htm

то можно дисперсию взять как 0,02, а доверительный интервал взять либо 0,02/3 (3 сигма) либо привязаться к погрешности измерительного прибора..
87 Denp
 
17.05.10
13:10
(86) дисперсия - это сигма квадрат)

а почему дисперсию взять 0,2? почему не 0,3?
88 Stim
 
17.05.10
13:16
(87) я вообще склоняюсь к тому, чтобы экспериментально оценить дисперсию серией тестов и только после использовать её значение в расчетах...
89 Stim
 
17.05.10
13:17
или просто как-то задаться этой величиной...взятой с потолка..
90 Denp
 
17.05.10
13:20
(88) вот и я другого выхода не вижу.
но характеристики потока могут меняться
91 Mikeware
 
17.05.10
14:05
Если известен "интервал в ГОСТе", то он строится из определенной вероятности. Я не помню границы. Но если найти ГОСТ по методикам измерений, то дисперсию ты вычислишь однозначно и моментально :-)
92 Stim
 
17.05.10
14:20
(91) в ГОСТе по системам вещательного ТВ описана методика измерения яркости - с помощью осциллографа. Но там меряются только 2 строки