14.1. Логика понятия эффективного эксперимента
В этом разделе будет рассмотрен подход, предложенный В.В. Налимовым и Т.И. Голиковой, позволяющий разрабатывать оптимальные планы выполнения эксперимента.
Задача настоящего раздела—рассказать о тех логических предпосылках, на которых базируется планирование эксперимента, опуская почти все, что непосредственно связано с практикой его применения.
Уже накоплен большой опыт применения планирования эксперимента в самых различных областях деятельности — в научных и научно-технических исследованиях, в практике промышленного эксперимента, осуществляемого непосредственно в заводских цехах, в сельском хозяйстве, в биологии и медицине. Этот опыт нашел отражение в журнальных публикациях, общее число которых достигает нескольких тысяч. В то же время общетеоретические основания планирования эксперимента до сих пор остаются недостаточно разъясненными. Пока еще, на взгляд атора настоящей работы, никому не удалось написать хорошего руководства по планированию эксперимента ни в нашей стране, ни за рубежом. В популярных руководствах, предназначенных для широкого круга читателей, рассматриваются вопросы о том, как применять какие-либо планы в тех или иных конкретных ситуациях, как обрабатывать результаты таких экспериментов и как их интерпретировать. В книгах теоретической направленности рассматриваются специальные математические проблемы, возникающие при построении планов, отвечающих тем или иным критериям оптимальности. При этом сама идеология планирования эксперимента оказывается опущенной в книгах как того, так и другого типа.Это отставание теоретического осмысливания метода от его практического применения объясняется особенностями его исторического развития. За более чем 80 лет существования идеология планирования эксперимента претерпела существенную эволюцию. Развитие основных идей шло, несколькими, почти непересекающимися направлениями.
В каждом из них формулировались свои задачи, излагаемые в свойственной этим задачам терминологии. Впоследствии, однако, обнаружилась общность во многих, казалось бы существенно различных по своей постановке задачах. Появилась возможность осмысливания всего многообразия методов в рамках неких более или менее единых представлений. Развитие теоретических представлений позволило не только построить новые планы эксперимента, но и сделать нечто гораздо большее — дало возможность четко сформулировать логику понимания того, что есть эффективный эксперимент.Внешне планирование эксперимента выглядит как математическая дисциплина — его высказывания формулируются на языке математики. Однако его логическая структура отлична от построений чистой математики. Характерной особенностью математики является четкий аксиоматически-дедуктивный метод построения суждений. Но система постулатов в математике —это отнюдь не пестрая мозаика отдельных исходных высказываний. Особенностью чистой математики является то, что система постулатов образует своеобразные концепции — математические структуры, богатые теми логическими следствиями, которые из них могут быть выведены. Согласно взглядам Бурбаки, наличие таких структур, в которых имплицировано все содержание математики, и есть та основная черта, которая отличает ее от других областей знаний. В планировании эксперимента, как и в других разделах прикладной математики, исчезают из поля зрения целостные математические структуры. Они заменились в одном случае пестрой мозаикой критериев— для этой мозаичной структуры потеряла смысл сама постановка вопроса о непротиворечивости, играющая столь большую роль в структурах чистой математики, в других случаях на математическом языке стали записываться некоторые высказывания, основанные на не очень ясных интуитивных соображениях, и тогда вообще исчезла цепочка силлогизмов, которая является одним из обязательных внешних признаков традиционных математических построений.
Как известно, аксиомой называется предложение, принимаемое без доказательств и рассматриваемое как исходное при построении той или иной математической теории.
В планировании эксперимента роль аксиом играют критерии оптимальности эксперимента. Они принимаются без доказательств — их правомерность основывается на интуитивном представлении о том, что есть эффективный эксперимент. Будучи сформулированными на математическом языке, критерии оптимальности становятся теми исходными высказываниями, на которых строится вся дальнейшая теория. Критерии оптимальности в планировании эксперимента легко разбиваются на две группы. Одна из них — группа статических критериев. Здесь речь идет о высказываниях, формулирующих требования, которым должно удовлетворять некоторое, задаваемое планом эксперимента расположение экспериментальных точек в пространстве факторов (независимых переменных), подлежащих варьированию. Роль теорем здесь играют высказывания о свойствах планов.Под теоремами будем понимать, как принято в логике, высказывания, для которых существуют доказательства. Доказательством называем логическое действие, в процессе которого обосновывается истинность какого-либо утверждения . Истинность высказываний, т. е. соответствие их заранее высказанным утверждениям об оптимальности, проверяется путем доказательств. Вся система суждений здесь носит чисто конструктивный характер—необходимо найти способ построения плана, оптимального в том или ином смысле. Конструктивной деятельности здесь обычно предшествует необходимость доказательства ряда предварительных теорем. Критерии оптимальности планов образуют в общем случае мозаику взаимно несовместимых высказываний, хотя некоторые обобщения здесь возможны; можно, соблюдая некоторые условия, выделить более сильные — иерархически вышестоящие критерии.
В целом, однако, все представление об оптимальности планов не может быть имплицировано в единой системе взаимно непротиворечивых высказываний. И здесь создается новая, не свойственная традиционной математике ситуация — возникает необходимость в сопоставлении друг с другом планов, порожденных разными критериями.
Численными методами можно определить, в какой степени план, порожденный одним критерием, оценивается с позиций других критериев. В практической работе исследователь-экспериментатор не всегда может отдать четкое предпочтение одному из возможных критериев оптимальности. Часто целесообразно остановиться на компромиссном решении, и для этого необходимо иметь сравнительные числовые оценки параметров планов.Ко второй группе критериев оптимальности относят динамические критерии.
Термин «динамические» употребляется здесь в некотором общенаучном смысле для характеристики состояния движения или изменения какого-либо явления под влиянием действующих на него факторов. Такое понимание этого термина отличается от того специфического смысла, который вкладывается в него в теории оптимальною управления.
Здесь речь идет о проблеме выбора оптимальной стратегии в последовательно проводимой серии опытов. Нужны критерии, скажем, для того, чтобы решить, как надо действовать в заводских условиях, когда, варьируя управляемые переменные непосредственно в цехе, мы хотим непрерывно следить за дрейфом экстремума технологического процесса; или другой пример, как надо действовать, когда мы хотим создать программу исследования для изучения биологической активности очень большого числа препаратов, в условиях, когда наложены серьезные ограничения на возможное число опытов.
Во всех случаях речь идет об оптимальности всей последовательности действий, образующей стратегию эксперимента, а не об оптимальности отдельной серии опытов, как это было в первой группе критериев. При формулировке критериев оптимальности здесь на математическом языке записываются те высказывания, которые нам представляются правомерными на уровне наших интуитивных представлений. В этом случае дело с отчетливостью логических построений обстоит еще хуже, чем в предыдущем. При обсуждении проблемы выбора оптимальной стратегии часто даже не удается провести отчетливого разграничения между тем, что здесь является аксиомами и что логическими следствиями из них — теоремами.
Записанное на математическом языке высказывание об оптимальности той или иной стратегии можно рассматривать как аксиому. Но остается не ясным, что считать здесь теоремами. Теряется глубина логических построений. Все сводится к тому, что строится алгоритм, соответствующий исходному высказыванию, удобный для конкретного практического применения. Множество основополагающих утверждений о возможных стратегиях поведения образует мозаику высказываний, а не математическую структуру в смысле Бурбаки.Здесь снова возникает проблема сопоставления эффективности стратегий, порожденных разными высказываниями. Но в отличие от предыдущего случая, эта задача оказывается неразрешимой даже на уровне численного сопоставления. В предыдущем случае задача численного сопоставления различных планов хотя бы частично решалась, поскольку она сводилась к сопоставлению отдельных параметров, характеризующих структуру матрицы планирования эксперимента или как-то зависящих от структуры матрицы. В случае с решением задач, направленных на поиск оптимальных стратегий, нельзя выделить параметры для численного сопоставления. Единственное, что можно здесь сделать — это попытаться построить некую метатеорию, сформулировав аксиомы сравнения стратегий. Но таких аксиом можно придумать достаточно много и они опять-таки будут образовывать только мозаику высказываний. Можно пойти дальше и построить метатеорию для сравнения аксиом сравнения, но вряд ли это имеет смысл.
Предложенная В.В. Налимовым и Т.И. Голиковой и изложенная здесь бинарная система классификации, естественно, не охватывает всего многообразия задач. В некоторых случаях, например при постановке так называемых отсеивающих экспериментов, экспериментаторы сталкиваются с задачами смешанного типа, когда, с одной стороны, нужно оценить параметры модели — это статическая составляющая задачи, а с другой стороны, необходимо выполнить некоторые процедуры движения, скажем, уменьшить размерность пространства независимых переменных.
В задачах смешанного типа экспериментаторы сталкиваются с трудностями, свойственными задачам обоих типов.
Изложенное показывает те принципиальные трудности, с которыми приходится сталкиваться при попытках построения теории оптимального эксперимента. Конечно, здесь построена теория в достаточно полном смысле этого слова. И действительно, здесь невозможно построение теории как некоего исчисления.
Принято считать, что исчисление задается конечным алфавитом его знаков, из которых составляются строчки или «слова в алфавите», и правилами, позволяющими выводить слова из начальных или уже ранее выведенных слов. Начальные слова могут задаваться непосредственно— списком или формулами, в которые могут входить и содержательные переменные, на место которых можно подставлять слова в алфавите.
Всё содержание теории нельзя получить как логический вывод из некоторых начальных утверждений, образующих единую, внутренне непротиворечивую структуру. Единственно, что можно сделать — это провести некоторую умственную атаку («мозговой штурм») на проблему, рассмотрев ее в различных мысленно возможных ракурсах. Такая атака требует существенной формализации наших представлений об эксперименте, хотя весьма очевидно, что все наши представления об эксперименте формализовать нельзя, поскольку любой эксперимент связан в какой-то степени с эвристической деятельностью. Формализуемую часть наших представлений об эксперименте целесообразно осмысливать на языке математики. Математика служит здесь для усиления логики наших суждений об эксперименте. И когда мы говорим о математической теории эксперимента, то это не означает, что здесь строится новая математическая дисциплина. Речь идет о создании формально-логического подхода к изучению проблемы эксперимента, формулируемого на языке математики. Нечто аналогичное имеет место, скажем, в квантовой механике, которая несмотря на всю ее насыщенность математикой, не есть математическая дисциплина. Вслед за работами Фреге, Ресссела и Уайтхеда можно рассматривать математику как часть формальной логики.
Планирование эксперимента имеет свое собственное идейное содержание, связанное с особенностями физического представления об эксперименте; планирование экстремальных экспериментов— это не просто поиск экстремума, а нечто гораздо большее — это поиск эффективного эксперимента для решения экстремальной задачи.
Несмотря на все трудности, связанные с пониманием того, что есть научный эксперимент, не трудно привести примеры как хорошо поставленных (эффективных) экспериментов, так и экспериментов в каком-то смысле явно плохих (неэффективных). Эти примеры сразу покажут, что проблема логического анализа структуры эксперимента существует реально и что она может быть сформулирована на некотором весьма абстрактном уровне вне зависимости от того конкретного содержательного значения, которое тот или иной эксперимент имеет в каждом отдельном его использовании.
Рассмотрим простой и многократно описанный пример — взвешивания трех объектов а, b, с на аналитических весах. Традиционно экспериментатор стал бы взвешивать эти объекты по схеме, приведенной в табл. 14.1.
Вначале он делает холостое взвешивание, определяя нулевую точку весов, затем по очереди взвешивает каждый из объектов. Это пример традиционно используемого однофакторного эксперимента. Здесь исследователь изучает поведение каждого фактора в отдельности. Масса каждого объекта оценивается только по результатам двух опытов: того опыта, в котором на весы был положен изучаемый объект, и холостого опыта. Например, масса объекта а равна
А = у1 — у0.
Дисперсия результатов взвешивания запишется в виде:
где ?{у} — ошибка взвешивания.
Таблица 14.1
Традиционная схема взвешивания трех объектов1
Проведем теперь тот же эксперимент по несколько иной схеме, задаваемой матрицей планирования, приведенной в табл. 14.2.
Таблица 14. 2
Планирование эксперимента при взвешивании трех объектов
Здесь, как и в предыдущем случае, каждая строка задает условия проведения одного опыта.
В первых трех опытах последовательно взвешиваются объекты а, b, с; в последнем опыте взвешиваются все три объекта вместе — «холостое» взвешивание не производится. Легко видеть, что масса каждого объекта будетзадаваться формулами:
Здесь числители получены путем умножения элементов последнего столбца на элементы столбцов а, b, с. Мы видим, что при вычислении массы объекта а она входит в числитель два раза, и потому в знаменателе стоит число 2. Масса объекта а, вычисленная по приведенной выше формуле, оказывается не искаженной массами объектов b и с, так как масса каждого из них входит в формулу для массы а дважды и с разными знаками.
Найдем теперь дисперсию, связанную с ошибкой взвешивания при новой схеме постановки экспериментов. Она равна
Аналогичным образом находим
Мы видим, что при новой схеме дисперсия взвешивания получается вдвое меньше, чем при традиционном методе, хотя в обоих случаях на взвешивание трех объектов затрачивалось по четыре опыта. При традиционном взвешивании мы должны будем все четыре опыта повторить дважды, для того чтобы получить результаты с такой же точностью, как и в первом опыте. В результате чего происходит увеличение точности эксперимента в два раза? В первом случае эксперимент был поставлен так, что каждую массу мы получали лишь из двух опытов. При новой схеме эксперимента каждая масса вычислялась уже из результатов всех четырех опытов. Вторую схему эксперимента можно назвать многофакторной. Здесь оперируют всеми факторами (объектами взвешивания) так, чтобы каждая масса вычислялась то результатам всех опытов, проведенных в данной серии экспериментов. Рассмотренная задача взвешивания решается с помощью слишком простой процедуры, и вряд ли здесь нужно применять сложные схемы планирования эксперимента.
Пример со взвешиванием показывает, что даже в простых задачах можно с достаточной отчетливостью противопоставить неэффективный эксперимент эффективному.
Преимущество многофакторного эксперимента можно продемонстрировать и на более сложных задачах. Пусть, например, нам априори известно, что выход некоторого продукта у линейно зависит от трех переменных (факторов) х1, х2, х3. В частном случае это может быть температура, давление и содержание некоторого компонента. Нам нужно оценить значения коэффициентов регрессии линейного уравнения
где Е — знак математического ожидания.
Каждую из переменных будем варьировать только на двух уровнях и обозначать эти уровни знаками «—1» и «+1». Если температура в наших опытах принимает два значения, скажем, 100 и 120°С, то нижний уровень температуры обозначим через «—1», а верхний через «+1». Воспользуемся для постановки опытов матрицей планирования, приведенной в табл. 14.3. Здесь мы имеем дело с так называемой матрицей Адамара. Матрицы Адамара Н — это квадратные матрицы, размера N?N (в нашем случае N — число опытов), состоящие из элементов +1 и —1, удовлетворяющие условию HTH = NI, где I — единичная матрица, T — знак транспонирования. Матрицы Адамара можно построить только для N=2 и далее для N, кратного четырем.
В этом примере та же схема планирования, что и в табл. 14.2, только факторы а, b, с заменены независимыми переменными х1, х2, х3 и добавлен столбец «фиктивной» переменной для оценки свободного члена ?0.
В соответствии с этой таблицей, эксперименты выполняются следующим образом: в первом опыте переменные х2 и х3 находятся на нижних уровнях, х1 — на верхнем уровне; во втором опыте переменная х2 находится на верхнем уровне, а переменные х1 и х3 на нижних уровнях и т. д. Здесь мы имеем дело с насыщенным планом, число наблюдений равно числу оцениваемых параметров. Обозначим через вектор оценок параметров ?.
План, приведенный в табл. 14. 3, обладает следующими свойствами:
Таблица 14. 3
Планирование эксперимента для линейной модели с тремя независимыми переменными
Первое из этих условий—условие ортогональности к столбцу из единиц, второе—условие нормировки, третье— условие попарной ортогональности столбцов (скалярные произведения всех векторов-столбцов равны нулю). Это значит, что матрица независимых переменных X, называемая также матрицей коэффициентов (см. табл. 14.3), устроена так, что матрица ковариаций (ХтХ)-1 для вектора параметров уравнения регрессии оказывается диагональной, т. е. все ковариации cov{} равны нулю и, следовательно, все коэффициенты регрессии определяются независимо друг от друга.
Напомним здесь, что в матричных обозначениях вектор-столбец коэффициентов регрессии задается соотношением
причем
и коэффициент корреляции
Здесь сii и сij — диагональные и соответственно внедиагональные элементы матрицы (ХТХ)-1, поэтому последняя называется ковариационной матрицей уравнения регрессии или просто матрицей ошибок; матрица X ТХ называется информационной матрицей.
Из второго условия следует, что все диагональные элементы матрицы (ХТХ)-1 равны 1/n. Система нормальных уравнений распадается на п+1 независимых уравнений. В этом случае коэффициенты регрессии определяются формулами:
с дисперсией
Из этих двух формул следует, что коэффициенты регрессии оцениваются по всем N опытам и соответственно в N раз уменьшается дисперсия в их оценке по сравнению с дисперсией единичного опыта. Последнее обстоятельство является весьма примечательным. Представим себе, что мы имеем дело с последовательностью N независимых наблюдений у1, у2,..., yN, тогда среднее арифметическое этого ряда наблюдений будет оцениваться с дисперсией ?2{y}/N. В рассмотренном выше случае все N коэффициентов регрессии оцениваются по N опытам с дисперсией ?2{y}/N. Отсюда становится очевидным, хотя бы на интуитивном уровне, что нельзя придумать такого расположения точек (внутри области, ограниченной единичным кубом), которое дало бы возможность получить лучшие по точности оценки коэффициентов регрессии. Это утверждение может быть и строго доказано.
Интересующие нас четыре коэффициента регрессии можно было бы оценить и с помощью традиционного однофакторного эксперимента. В этом случае мы действовали бы следующим образом: один эксперимент поставили бы так, чтобы все независимые переменные были на нижнем уровне, а дальше следовали бы три опыта, в каждом из которых одна переменная на верхнем уровне, а две другие на нижнем. Всего было бы опять поставлено четыре опыта. Но каждый коэффициент регрессии определялся бы только по двум опытам как тангенс угла циклона прямой, проведенной через точки, абсциссы когорт соответственно равны —1 и +1.
В этом случае
В нашем случае с тремя независимыми переменными, ставя многофакторный опыт, мы выигрываем в дисперсии в два раза. Если бы нашей целью было, скажем, определение 15 коэффициентов регрессии, то, поставив эксперименты по схеме, аналогичной приведенной в табл. 14.3, мы получили бы выигрыш уже в 8 раз! Однофакторный эксперимент оказывается явно неэффективным, хотя в этом случае мы имеем дело с созданием условий для изучения явления, не осложненного другими физическими явлениями, именно такое действие должно соответствовать представлению о физическом эксперименте.
Можно показать, что эксперимент, проведенный по схеме, заданной в табл. 14.3, обладает и еще рядом свойств, одно из которых называется ротатабельностью. Оно означает, что получаемое с помощью этого плана уравнение регрессии обладает тем свойством, что дисперсия оценки модели зависит только от длины радиуса, проведенного из центра эксперимента, но не от угла, под которым этот радиус проведен.
Это свойство следует из того, что все коэффициенты регрессии оцениваются с одной и той же дисперсией, равной ?2{y}/N. Применяя закон накопления ошибок к уравнению регрессии
получаем
где
Если принять за меру информации величину то можно утверждать, что информация, содержащаяся в уравнении регрессии, полученном для ротатабельного плана, равномерно «размазана» по сфере (в общем случае гиперсфере) с радиусом r. Исследователь не знает заранее той области факторного пространства, где находится интересующий его участок, поэтому представляется вполне разумным стремиться к такому планированию эксперимента, при котором количество информации, содержащейся в уравнении регрессии, одинаково для всех эквидистантных точек.
Другое положительное свойство эксперимента, заданного табл. 14.3, это упоминавшееся уже свойство ортогональности. В этом случае коэффициенты регрессии оцениваются независимо друг от друга. Тогда независимыми друг от друга оказываются и доверительные границы для оценок коэффициентов регрессии. Это обстоятельство имеет очень важное значение при представлении, хранении и интерпретации результатов исследования. Чтобы пояснить эту мысль, рассмотрим трудности, связанные с интерпретацией неортогонального эксперимента, т. е. такого эксперимента, для которого векторы-столбцы матрицы независимых переменных не ортогональны друг другу и, следовательно, cov{}?0. В этом случае при представлении результатов исследования приходится строить совместную доверительную область для всех коэффициентов регрессии, задаваемую многомерным эллипсоидом рассеяния. В простейшем случае, когда мы имеем дело с уравнением регрессии для одной независимой переменной и оцениваем, следовательно, два коэффициента регрессии ?0 и ?1 совместная доверительная область будет задаваться эллипсом рассеяния. Допустим теперь, что мы хотим для ?0 выбрать не значение , оцененное методом наименьших квадратов, а какое-то другое, близкое к нему, т. е. попадающее в область доверительных границ, заданных эллипсоидом. Тогда этот выбор немедленно определит и доверительные границы для второго параметра. Легко представить себе, насколько эта процедура усложняется в многомерном случае. Представим себе теперь еще, что мы хотим данные, полученные по многопараметрической задаче, занести в память ЭВМ. Как это сделать — заносить туда параметры многомерного эллипсоида рассеяния? Можно, конечно, вокруг эллипсоида описать параллелепипед. Тогда запись доверительных границ упростится, но они будут далеки от реальных границ, к тому же с ростом размерности резко увеличивается грубость такой аппроксимации.
Рассмотрим еще одну трудность, связанную с неортогональностью планов. Допустим, что один исследователь построил модель кинетики химического процесса, отразив в ней какое-то множество гипотетически возможных промежуточных реакций, а другой построил для описания того же процесса несколько отличную модель, введя в нее иные, также гипотетически возможные реакции. Тогда оценки параметров, сделанные по неортогональным планам, дадут несовпадающие результаты для параметров и тех основных реакций, которые оставались неизменными в обеих моделях. Таким образом, если в наших представлениях о механизме реакции изменяются хотя бы какие-то, может быть, и не очень существенные детали, то немедленно должны будут измениться и оценки параметров, задающих основные составляющие химического процесса.
Каждый раз, когда мы рассматриваем ту или иную математическую модель, параметры которой оценены по экспериментальным данным методом наименьших квадратов, нам надо иметь перед собой и ковариационную матрицу (Хт X)-1. Без нее понимание модели будет неполным, а порой просто неверным. При этом коррелированность параметров в модели, доставляющая столь много неприятностей при интерпретации результатов исследования, это не свойство, присущее самому изучаемому процессу, а только следствие того, как устроена матрица X. Коррелированность параметров определяется, с одной стороны, структурой выбранной модели (а модели для описания одного и того же процесса можно выбирать по-разному) и, с другой стороны, расположением экспериментальных точек.
Математическая статистика позволяет не только оценить некоторым наилучшим, в каком-то смысле, образом параметры модели, но и получить некоторые метапредставления о качестве оценок. Из этих метапредставлений и рождается, как это детально будет показано дальше, возможность планирования, т. е. улучшения эксперимента.
И наконец, последнее. Представим себе, что исследователь ставил эксперимент так, что не очень нарушал естественно текущий ход событий в лаборатории. Тогда может оказаться что наряду с независимыми переменными х1, ..., хп на результат эксперимента могут оказать влияние еще не регистрируемые, но спонтанно изменяющиеся переменные z1, ..., zp. При этом переменные z могут оказаться сильно закоррелированы с переменными х, и тогда все оценки (если даже они сделаны по методу наименьших квадратов) окажутся смещенными. Чаще всего с такими неприятностями приходится сталкиваться в биологических исследованиях. Представьте себе, что исследователь изучает действие некоторых условий на поведение крыс. При этом опыты ставятся так, что ежедневно некоторое количество крыс подвергается воздействию одних и тех же условий; условия воздействия меняются только при переходе от одного дня к другому. В результате такого исследования обнаружено, что один из способов воздействия необычайно эффективен — средний результат для всех крыс, испытанных за этот день, во много раз превосходит квадратичную ошибку, которой характеризуется разброс испытаний по отдельным крысам. Исследователь приходит к заключению, что он обнаружил некий бесспорный биологический феномене Но затем, много времени спустя, кто-то вдруг вздумал повторить этот опыт и ничего похожего не получил. Одно из возможных объяснений такое: в тот злополучный день, когда был получен высокий эффект, лаборантка поссорилась дома с мужем и, придя на работу, выместила свою обиду на крысах—существах очень нервных.
Такого смещения в оценках не происходит, если эксперимент рандамизирован относительно неконтролированных условий. В рассматриваемом случае надо было бы все способы воздействия испытывать на разных крысах в течение каждого дня. Но технически это совсом не просто осуществить — удобнее в течение одного дня поставить все испытания в одних и тех же условиях. Иногда возникает здесь еще и дополнительная трудность: объектов, предназначенных для ежедневного испытания, может быть меньше, чем вариантов испытаний, И тогда возникает другая задача — рандомизация с наложенными ограничениями.
Планирование эксперимента и возникло в 20—30-х годах прошлого века из потребности устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента. И сейчас многие книги, особенно издаваемые за рубежом, излагают представления о планировании эксперимента исходя из концепции рандомизации.
Рандомизация условий проведения эксперимента — это основное требование при постановке всякого грамотного исследования не только в биологии, но и в любой другой области знаний.
И в химических или металлургических лабораториях мы можем столкнуться с тем, что отсутствие надлежащим образом проведенной рандомизации может привести к смещенным оценкам из-за неучтенной неоднородности исходного материала или из-за неконтролируемого изменения во времени экспериментальных установок и тех или иных реагентов. Известен случай, когда в весьма высококвалифицированном собрании диссертанту при защите диссертации был задан недоуменный вопрос: как могло получиться, что при оценке параметров по двум сериям испытаний, одна из которых проводилась с планированием эксперимента, а другая без него, расхождение получилось столь большим, что вероятность его появления должна быть оценена примерно в 10-5. Ответ здесь простой: процедура планирования оказалась направленной не только на уменьшение дисперсии оцениваемых параметров, но также и на рандомизацию относительно сопутствующих, спонтанно изменяющихся и неконтролируемых переменных. В результате удалось избавиться от смещения в оценках.
Рассмотрим здесь еще пример, заимствованный из практики работы одного металлургического завода. В мартеновском процессе очень важно, чтобы содержание углерода в момент расплавления колебалось в достаточно узких пределах. Естественным было бы стремление организовать процесс плавки так, чтобы содержание углерода в момент расплавления стало регулируемой величиной. Статистический анализ результатов наблюдений показал, что содержание углерода в момент расплавления линейно зависит от основности шлака
Если бы мы захотели воспользоваться этой связью для интерполяции, определяя, скажем, содержание углерода по основности, то все было бы хорошо. Но попытка воспользоваться таким соотношением для регулирования технологического процесса, оказалась неудачной. Причину этого легко удалось объяснить. Как содержание углерода (в момент расплавления), так и основность определяются одной и той же причиной—содержанием чугуна в завалке. Но эта переменная не поддается непосредственному измерению, и поэтому она не включается в уравнение регрессии. В результате в линейном уравнении, связывающем содержание углерода с основностью, коэффициент регрессии оказывается смещенным. Используя это линейное уравнение для интерполяции, мы не нарушаем внутренних связей в системе, и поэтому, несмотря на смещенную оценку, получаем правильные результаты. Однако как только будет сделана попытка использовать наше уравнение для управления процессом, так сразу же будут нарушены внутренние связи между измеряемыми и неизмеряемыми переменными в системе, и смещенность оценки приведет к бессмысленным результатам.
Особенностью рассмотренного выше примера является то, что здесь мы имеем дело с ситуацией, где действует скрытая переменная. Она не входит в матрицу независимых переменных X и анализ ковариационной матрицы (ХТХ)-1 не дает никаких оснований для беспокойства. Дефектность данной модели остается скрытой. Такого рода ситуации являются типичными при изучении сложных систем — большая часть действующих там факторов (независимых переменных) остается недоступной для непосредственного наблюдения. Постановка любого активного эксперимента неизбежно нарушает в той или иной степени внутренние связи в системе и таким образом спасает исследователей в какой-то мере от смещенных оценок. Но именно поэтому активный эксперимент и труден — отсюда и понятно стремление исследователя наблюдать пассивно за некоторым установившимся процессом, а не экспериментировать активно. Рандомизированный эксперимент, если процедура рандомизации хорошо продумана, должен полностью избавить результаты исследования от влияния скрытых переменных.
Здесь необходимо рассмотреть вопрос о логических основаниях планирования эксперимента не только с позиции рандомизации, а во всей доступной исследователю полноте.
Еще по теме 14.1. Логика понятия эффективного эксперимента:
- Логика. Учение о понятии
- 9.2. Понятия эффективности и влияния СМИ в журналистике и в социологии
- 15.2. Гипотеза эффективности финансового рынка
- «НАУКА ЛОГИКИ» ГЕГЕЛЯ И МАРКСИСТСКАЯ НАУКА ЛОГИКИ
- Общее деление логики
- 1. ПОНЯТИЕ ДОКАЗАТЕЛЬСТВА И ЕГО СТРУКТУРА
- Очерк 4 ПРИНЦИП ПОСТРОЕНИЯ ЛОГИКИ
- II Очерк 10 ЛОГИКА "КАПИТАЛА"
- § 4. МЫШЛЕНИЕ И ЯЗЫК. "ЯЗЫК" ЛОГИКИ
- § 2. ДОКАЗАТЕЛЬСТВО (ОПРОВЕРЖЕНИЕ)
- Формальная и математическая логика
- Тема 1. Понятие и функции рекламы. Разработка стратегии рекламной кампании
- Глава 17 ЭКОЛОГИЧЕСКОЕ ВОСПИТАНИЕ
- § 7. Методы эмпирического и теоретического исследований
- ВИО- и ПИО-типы работы и эксперимента в физике
- Основные концепты системологии
- 14.1. Логика понятия эффективного эксперимента
- 14.2. Формализация эффективного эксперимента.
- Цель и задачи исследования