Главная Численные методы при исследовании физических задач



0,95

0,975

0,990

0,995

0,999

п-\=т-\

Случай п ~т

4052

16 211

4,lxlOs 999

т - 1

Случай п - со

1018

6366

25 465

6,4X105

1000

n - 1

Случай m ~

4. Нахождение стохастической зависимости. Пусть требуется исследовать зависимость z{x), причем обе величины г п х измеряются в одних и тех же экспериментах. Для этого проводят серию экспериментов при разных значениях х, стараясь сохранить прочие условия эксперимента неизменными.

Измерение каждой величины содержит случайные ошибки (систематические ошибки здесь рассматривать не будем); следовательно, эти величины являются случайными. Закономерная

Таблица 25

Коэффициенты Фишера F (п, ,т\ ро)



*) С такой связью мы уже встречались в стохастических задачах нахождения корня уравнения (гл. V, §2, п. 4) и минимума функции (гл. VII, §1, п. 4).

СВЯЗЬ случайных величин называется стохастической*). Будем рассматривать две задачи:

а) установить, существует ли (с определенной вероятностью) зависимость z от л: или величина 2 от х не зависит;

б) если зависимость существует, описа1ть ее количественно. Первую задачу называют дисперсионным анализом, а если

рассматривается функция многих переменных г(х, у, ...) -то многофакторным дисперсионным анализом. Вторую задачу называют анализом регрессии. Если случайные ошибки велики, то они могут маскировать искомую зависимость и выявить ее бывает нелегко.

Без ограничения общности можно считать, что величина х измеряется точно. В самом деле, если г от л; не зависит, то ошибка 6х ни на что Не влияет. Если же зависимость существует, то ошибка Ьх эквивалентна дополнительной ошибке зависимой переменной бг = (dz/dx) Ьх.

Таким образом, достаточно рассмотреть случайную величину 1,{х), зависящую от х как от параметра. Математическое ожидание этой величины {х) = г (х) зависит от х; эта зависимость является искомой и называется законом регрессии.

Дисперсионный анализ. Проведем при каждом значении Xi небольшую серию измерений и определим Zij {ljsni). Рассмотрим два способа обработки этих данных, позволяющих исследовать, имеется ли значимая (т. е. с принятой доверительной вероятностью) зависимость z от х.

При первом способе вычисляют стандарты выборки единичного измерения по каждой серии отдельно и по всей совокупности измерений:

"i

/=1 i, /

где NHi - полное число измерений, а

у = 1 i, /

ЯВЛЯЮТСЯ средними значениями соответственно по каждой серии и по всей совокупности измерений.

Сравним дисперсию совокупности измерений as с дисперсиями отдельных серий aisj. Если окажется, что при выбранном уровне достоверности ро можно считать сг>СТ/ для всех i, то зависимость г от х имеется. Если достоверного превышения



нет, то зависимость не поддается обнаружению (при данной точности эксперимента и принятом способе обработки).

Дисперсии сравнивают по критерию Фишера (30). Поскольку стандарт s определен по полному числу измерений N, которое обычно достаточно велико, то почти всегда можно пользоваться коэффициентами Фишера F (со, т; р), приведенными в таблице 25.

Второй способ анализа заключается в сравнении средних Zj при разных значениях между собой. Величины 2,- являются случайными и независимыми, причем их собственные стандарты выборки равны

Поэтому их сравнивают по схеме независимых измерений, описанной в п. 3. Если различия г,- значимы, т. е. превышают доверительный интервал, то факт зависимости z от х установлен; если различия всех z,- незначимы, то зависимость не поддается обнаружению.

Многофакторный анализ имеет некоторые особенности. Величину z{x, у) целесообразно измерять в узлах прямоугольной сетки (Xi, у If), чтобы удобнее было исследовать зависимость от одного аргумента, фиксируя другой аргумент. Проводить серию измерений в каждом узле многомерной сетки слишком трудоемко. Достаточно провести серии измерений в нескольких узлах сетки, чтобы оценить дисперсию единичного измерения; в остальных узлах можно ограничиться однократными измерениями. Диспер-срюнный анализ при этом проводят по первому способу.

Замечание I. Если измерений много, то в обоих способах отдельные измерения или серии могут с заметной вероятностью довольно сильно отклониться от своего математического ожидания. Это надо учитывать, выбирая доверительную вероятность Ро достаточно близкой к 1 (как это делалось в п.2 при установлении пределов, отделяющих допустимые случайные ошибки от грубых).

Анализ регрессии. Пусть дисперсионный анализ указал, что зависимость z от х есть. Как ее количественно описать?

Для этого аппроксимируем искомую зависимость некоторой функцией z(x)f{x, а), a = {ai, а, а]- Оптимальные значения параметров найдем методом наименьших квадратов, решая задачу

2 W (Xi) [Zi - f (Xi, a)f = min, (34)

i= 1

где w (Xi) - веса измерений, выбираемые обратно пропорционально квадрату погрешности измерения в данной точке (т. е. (Dzi)). Эта задача была разобрана в главе II, § 2. Остановимся здесь лишь на тех особенностях, которые вызваны присутствием больших случайных ошибок.



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 [164] 165 166 167 168 169 170


0.0183