<<
>>

14.2. Формализация эффективного эксперимента.

  Несмотря на невозможность дать четкого определения, что есть научный эксперимент, мы все же можем достаточно четко, хотя бы на отдельных примерах, провести разграничение между эффективно и неэффективно поставленными экспериментами.
И если идти дальше — необходимо попытаться формализовать наши представления об эффективном эксперименте.

Разобьем все мысленно возможные эксперименты на две группы. К одной из них отнесем те задачи, в которых нужно решить вопрос о том, как наилучшим образом расположить экспериментальные точки в пространстве независимых переменных. Такие задачи будем несколько условно называть пространственно локализованными, или статическими.

К динамическим отнесем те задачи, в которых приходится заботиться о стратегии исследования в целом, полагая, что в этом случае исследование распадается на серию последовательно проводимых локальных экспериментов.

Начнем изложение с попытки формализовать представления об эффективном статическом эксперименте. Чтобы сделать это, необходимо иметь возможность рассмотреть в некотором достаточно общем   виде свойства всех возможных матриц планирования эксперимента в некоторой заранее заданной области пространства независимых переменных. Этому  должно предшествовать задание той модели, ради оценки параметров которой ставится эксперимент.

Таким образом, формализация наших представлений об эффективном эксперименте начинается с записи модели. Ранее мы записали модель в виде полинома первой степени для трех независимых переменных и предложили для оценки ее параметров матрицу планирования эксперимента, представленную в табл. 14.3. Запишем теперь модель в виде неполного полинома второй степени для двух независимых переменных

Для оценки параметров здесь можно предложить план эксперимента, представленный в табл.

14.4.

Таблица 14.4

Планирование эксперимента для модели с двумя независимыми переменными, включающей эффект взаимодействия между переменными

Сама матрица здесь выглядит так же, как и матрица, приведенная в табл. 14.3: по строчкам и столбцам в одном и том же порядке расставлены одни и те же элементы. Но во втором случае над последним столбцом указано, что он относится к произведению х1х2, т. е. служит для оценки параметра ?12. Если же мы пользуемся первой моделью в случае, когда коэффициенты    регрессии   для эффектов взаимодействия не равны нулю, то оценки полученные методом наименьших квадратов, должны будут интерпретироваться так:

т. е. они являются оценками для сумм некоторых параметров. Здесь мы имеем дело уже со смешанными оценками: четыре опыта не дают нам возможности сделать чего-то большего, чем оценить раздельно четыре коэффициента регрессии: Таким образом, матрица X приобретает истолкование в терминах эксперимента тогда, когда она связывается с какой-либо моделью.

Выше мы рассмотрели план эффективного эксперимента для взвешивания трех объектов а, b, с, не приводя притом модели. На самом деле   такой   план можно было построить, только имея, хотя бы в уме, модель процесса взвешивания. Она в данном случае   должна    была бы быть записана так:

где хi — переменные, принимающие только два значения «+1» и

«—1» в зависимости от того, помещен или не помещен взвешиваемый объект на весы.

Смысл этой записи заключается в том, что признается аддитивность  процедуры взвешивания, не допуская в ней существования эффектов взаимодействия. При интерпретации этой модели принимается, что

где ?0 — возможное смещение нулевой точки. Коэффициент ?0 при процедуре взвешивания практически вычислять не нужно (в матрице, приведенной в табл. 14.2, даже не записан столбец, состоящий только из «+1», но в модели коэффициент ?0 должен быть записан, чтобы она адекватно отражала результаты взвешивания по каждой строке.

Естественно было бы записать модель взвешивания трех объектов следующим образом:

полагая, что хi могут принимать только значения 0 (когда на весы

i-тый предмет не положен) и +1, когда на весы положен соответствующий объект. Такого рода модели используются в том разделе планирования эксперимента, который называется «Планы взвешивания» (подробнее см. об этом ниже).

Теперь допустим, что мы имеем дело с моделью, нелинейной по параметрам, скажем, с экспонентой или суммой экспонент.  В общем виде запишем модели такого типа следующим образом:

?=?(х, ?),

где х — вектор независимых переменных;

? —вектор параметров модели.

Если мы хотим оценить методом наименьших квадратов параметры ? по результатам наблюдений, то нам надо будет линеаризовать нелинейную по параметрам функцию, разлагая ее в ряд Тейлора в окрестности некоторой точки В результате мы приходим к рассмотрению информационной матрицы ХТХ, полученной из матрицы независимых переменных X размера N?k:

где элемент матрицы

есть частная производная по параметру ?r в точке при значениях x1u, х2и, …, хпи, соответствующих условиям некоторого и-того опыта.

Мы видим, что если модель задана нелинейно, то для оценки ее параметров нам надо опять находить матрицу (ХТХ)-1. Однако это возможно сделать только в том случае, если известен не только вид функции, но еще и какие-то, хотя бы очень грубые оценки ее параметров. Оценки параметров в процессе эксперимента улучшаются, и в соответствии с этим должен изменяться оптимальный план эксперимента. В этой ситуации исследование разбивается на ряд последовательных шагов. На каждом шаге ставится некоторое число опытов и после этого происходит переоценка коэффициентов и изменение плана. Такая стратегия планирования называется последовательной.

Итак, мы видим, что при заданной модели изучаемого явления и плана,  появляется возможность написать матрицу независимых переменных X, а затем и ковариационную матрицу (ХтХ)-1. Последняя позволяет высказывать суждения о качестве оценок параметров изучаемой модели по результатам эксперимента. Если необходимо изменить в том или ином направлении качество оценок параметров или модели в целом, следует каким-то образом задавать матрицу X.

Теперь можно ответить на вопрос о том, когда возможно планирование эксперимента. Планирование локального эксперимента  возможно во всех тех случаях, когда еще перед началом исследования можно сформулировать предварительные знания в виде математической модели. Практически это  возможно   сделать   во всех случаях, когда исследователь изучает что-то, о чем он имеет хотя бы весьма смутное представление общетеоретического характера. Даже работы вспомогательного, чисто препараторского характера, требующие прежде всего определенного искусства от исследователя, могут  быть представлены моделями хотя бы такого типа, как рассмотренная выше модель взвешивания. Для этого надо уметь выделить те факторы, которыми исследователь реально может управлять, и записать предполагаемые взаимоотношения. Конечно, явно невозможно запилить модели для открытий, скажем, для открытия такого типа каким было открытие радиоактивности, сделанное Беккерелем.

Но это открытие и появилось как нечто неожиданное и непредвиденное, а не как результат некоторого сознательного поиска.

Таким образом, мы видим, что логически продуманная постановка исследования включает в себя выбор модели, с одной стороны, и выбор плана эксперимента, оптимального в каком-то смысле для этой модели, с другой стороны.

Решение первой из этих задач связано с глубоким знанием объекта исследования; решение второй задачи совершенно не зависит от объекта исследования.

Запись изучаемой проблемы в виде математической модели позволяет достигнуть такого уровня формализации, при котором мы можем полностью абстрагироваться от физического содержания задачи. К миру физической реальности исследователь должен возвращаться только на последнем этапе своего исследования — при интерпретации модели.

Мы будем рассматривать только вторую из поставленных выше двух задач. Это позволит вести изложение в достаточно абстрактном плане, отвлекаясь почти полностью от обсуждения физического смысла при постановке задач в той или иной конкретной области знания.

Вопрос о том, как выбирать математические модели и как интерпретировать полученные с их помощью результаты исследования, надо рассматривать в книгах настоящей работы, посвященных отдельным отраслям знаний. Задача этого раздела работы — рассмотреть логику планирования эксперимента на том его этапе, который уже доведен до формулировки модели.

Допустим, что дана модель изучаемого явления. Задача построения оптимальных планов эксперимента сводится к тому, что нужно (сначала на чисто логическом уровне) рассмотреть те требования, которыми может характеризоваться «эффективная оценка модели»; далее необходимо связать эти требования со свойствами ковариационной матрицы или информационной матрицы и в соответствии с этим найти отвечающую этим требованиям матрицу плана эксперимента. При этом заранее должна быть задана та область пространства независимых переменных, где будет ставиться эксперимент. Это может быть многомерный куб, шар, правильный симплекс или какая-нибудь совсем несимметричная область.

Во многих случаях задача сводится просто к заданию свойств матриц некоторыми скалярными характеристиками и попытке найти связь между этими характеристиками и статистическими свойствами моделей. Так, например, естественно потребовать минимизации объема эллипсоида рассеяния оценок параметров уравнения регрессии.

Это требование, как и некоторые другие, является естественным обобщением критерия совместных эффектных оценок, введенных в математическую статистику еще Р. Фишером. Если раньше требовалось построить алгоритм для вычисления  параметров уравнения регрессии так (см. ниже), чтобы при заданном плане эллипсоид рассеяния оценок параметров был минимальным, то теперь подобное требование предъявляется к построению плана при заданном способе обработки результатов наблюдений.

Это требование будет выполнено, если мы найдем на множестве планов с заданным числом измерений план с такой матрицей независимых переменных X, что детерминант матрицы (ХТХ) будет максимален или, что то же—минимален детерминант ковариационной матрицы  (ХТХ)-1. Такие планы называются D-оптимальными.

Таким образом, одно из важнейших статистических свойств модели задается всего одним числом — детерминантом матрицы. Однако оно полностью не определяет поведения рассеяния оценок коэффициентов   регрессии —объем эллипсоида рассеяния может быть минимален, но сам эллипсоид может оказаться слишком вытянутым по одной из своих осей. Если исследователь хочет минимизировать максимальную ось эллипсоида рассеяния, то он должен суметь построить такую матрицу плана, которой бы соответствовала ковариационная матрица с минимальным значением максимального характеристического числа. Это будет так называемый Е-оптимальный план. Исследователь может потребовать, чтобы минимальной была средняя дисперсия оценок коэффициентов регрессии. Этому требованию соответствуют эллипсоиды рассеяния с наименьшей суммой квадратов длин осей. Соответствующие планы называются А-оптимальными; им соответствуют ковариационные матрицы, с наименьшим значением следа.

Здесь не будут перечисляться все те требования, которые можно предъявить к планам эксперимента, отвечающим нашим представлениям о том, что такое эффективный эксперимент. Подробно об этом будет рассказано в следующем разделе. Здесь важно отметить только то , что, как правило (за исключением некоторых очень простых моделей), нельзя предложить плана, который бы отвечал одновременно всем или хотя бы важнейшим критериям оптимальности. Нужно искать компромиссное решение. В этом состоит важнейшая задача планирования эксперимента. Чтобы выполнить ее, приходится, пользуясь численными методами, строить планы, соответствующие какому-нибудь одному критерию, а затем оценивать для этих планов численные характеристики, соответствующие другим критериям, и в завершение — выбирать на множестве всех планов наилучшее компромиссное решение.

Эту задачу  возможно решить только частично. Трудность здесь состоит в том, что не все желательные свойства планов можно хорошо оценить численно. Если мы, например, имеем дело с D-oптимальностью, то здесь все обстоит вполне благополучно. Достаточно найти для некоторых заданных условий D-оптимальный план и тогда для любого другого плана, построенного в той же области значений независимых переменных, мы можем оценить отклонение от D-оптимальности (отклонение от минимального значения определителя |(XTX)-1N|), и эта оценка даст вполне четкое представление о том, насколько увеличился объем эллипсоида рассеяния. Таким образом, появляется возможность оценивать с позиций оптимальности планы, построенные в соответствии с какими-нибудь другими требованиями.

Ничего подобного нельзя сделать с критерием ортогональности. Для ортогонального плана можно задать четкую числовую меру: отношение где сii — диагональные элементы матрицы (ХТХ)-1 должно быть равно единице. Но вот отклонение значения этого отношения от единицы для неортогональных планов мало что говорит, ибо здесь одно и то же числовое значение отклонения может характеризовать планы, в которых один раз какой-нибудь один коэффициент регрессии   (скажем    будет    сильно    закоррелирован только со всеми коэффициентами типа в другой раз — план, в котором все коэффициенты регрессии, хотя и в меньшей степени, будут закоррелированы друг с другом.

Ясно, что при интерпретации модели мы будем иметь дело с существенно различными ситуациями. Не удается придумать такую компактную меру неортогональности, которая бы отчетливо характеризовала степень коррелированности различных параметров в модели.

Выше уже говорилось о том, что матрица независимых переменных X появляется только после того, как оказывается заданной модель. Ясно, что для описания одного и того же явления можно задать несколько моделей, но не для всех моделей, описывающих одинаково хорошо одно и то же явление, можно построить планы, дающие достаточно слабую коррелированность параметров. Рассмотрим в качестве примера хорошо известное уравнение Аррениуса

где k — зависимая    переменная — константа     скорости реакции;

R — универсальная газовая постоянная;

Т — температура;

K0 и E — параметры модели, подлежащие оценке из экспериментальных данных.

Поскольку обычно переменная Т изменяется не более чем на 10—15% от среднего, в интервале возможного изменения информационная матрица для линеаризованной модели всегда оказывается близкой к вырожденной. Это многократно отмечается в ряде работ.  Вырожденный, или точнее почти вырожденный, характер матрицы ХТХ приводит к овражному характеру поверхности для сумм квадратов отклонений, что значительно осложняет поиск оценок параметров.  Числовые значения коэффициентов корреляции оценок этих параметров могут доходить до 0,97 и 0,98. Возникающие при этом трудности в интерпретации модели уже рассматривались выше.

В этом случае рекомендуется репараметризация, т. е. переход к новой модели:

где — некоторое среднее значение температуры;

—«средняя»   константа,   т.   е.   новый   параметр

Параметры и Е оказываются закоррелированными слабее, коэффициент корреляции при подходящем выборе плана удается снизить до 0,5 и в соответствии с этим резко сужаются совместные доверительные границы. Но экспериментаторам часто все же не нравится введение новой непривычной константы — это затрудняет привычную интерпретацию, и, кроме того, новые результаты оказываются несовместимыми со старыми.

Таким образом, даже при изучении одного и того же явления возможности построения хорошего плана эксперимента определяются выбором модели.

Планирование эксперимента само по себе не может улучшить физический смысл модели, оно улучшает только ее статистические свойства.

Если, скажем, исследователь при изучении кинетики химического процесса неверно записал промежуточные,   непосредственно   не   измеряемые реакции, то планирование даст ему только возможность оценить некоторым наилучшим образом параметры этой неверно записанной модели. Эта модель может даже оказаться в статическом смысле очень эффективной, если ее использовать для целей интерполяции. Дефектность ее может выявиться только при экстраполяции. Но во многих случаях модели строятся для того, чтобы знать то направление в пространстве независимых, переменных, куда нужно двигаться дальше, чтобы получить наиболее благоприятные результаты.

Планирование эксперимента может использоваться и для дискриминации конкурирующих гипотез, т. е. для выбора лучшей из нескольких, предложенных априори. И здесь, если даже и говорится о том, что ведется поиск модели, задающей механизм явления, на самом деле с помощью планирования эксперимента отбирается только та модель, которая обладает наилучшей интерполяционной силой в области, отведенной для исследования (подробнее о критериях в дискриминирующих экспериментах будет сказано  ниже). Формализация наших представлений об эксперименте и введение в обиход таких понятий, как «эффективность плана», «выбор оптимальной модели», не должны затуманивать реального физического смысла того, что мы при этом имеем в виду.

Рассмотрим вопрос об общей постановке задачи при втором подходе, когда речь идет о стратегии в целом. Здесь затруднительно сформулировать какие-либо достаточно общие высказывания. При первой постановке задачи, когда мы рассматривали статические оптимальные планы, все было достаточно ясно: перед нами была модель — цель нашего исследования, и мы могли составить матрицы X и соответственно (XTX)/N и (XTX)-1N. После этого сразу становилось ясно, в каких терминах можно вести разговор о том, что есть эффективный эксперимент. Высказывания сразу приобрели достаточно общий характер. Когда же речь идет о динамических задачах — о стратегии всего исследования, таких возможностей у нас нет. Приходится каждый раз придумывать какую-то свою, подходящую для данного конкретного случая систему действий, записывать ее на математическом языке. Но существует достаточно много хорошо продуманных высказываний о стратегиях исследования в широкой постановке задачи, идейное содержание которых изложено в последующих разделах.

<< | >>
Источник: А.Е. Кононюк. ОСНОВЫ НАУЧНЫХ ИССЛЕДОВАНИЙ (Общая теория эксперимента) Книга 3. 2011

Еще по теме 14.2. Формализация эффективного эксперимента.:

  1. § 1. Методы построения идеализированного объекта и оправдания теоретического знания
  2. РАЗДЕЛ 0. У БАРБОСА ЕСТЬ ВОПРОСЫ. Что такое эффективность?
  3. РАЗДЕЛ 5. В поисках справедливости : шведский эксперимент[21]
  4. 1.2. Влияние структурно-компоновочных особенностейавтоматизированных производственных систем на эффективность загрузки оборудования
  5. ФАКТОРЫ ЭФФЕКТИВНОЙ ОРГАНИЗАЦИИ. Л О КЛАССИЧЕСКАЯ ТЕОРИЯ ОРГАНИЗАЦИИ: БЮРОКРАТИЧЕСКАЯ ТЕОРИЯ.
  6. ПЕДАГОГИЧЕСКИЙ ЭКСПЕРИМЕНТ
  7. Тема 2. Формирование эффективного психотерапевта как развитой языковой системы1
  8. СИЛА МОТИВА И ЭФФЕКТИВНОСТЬ ДЕЯТЕЛЬНОСТИ
  9. 2.5. 3. Традиционные методы: наблюдение, эксперимент, интервью
  10. Электроника и информатика — основы индустриального прогресса.
  11. Эффективность естественного отбора
  12. Создание системы эффективного взаимодействия
  13. Анализ и оценка результатов экспериментальной работы
  14. 13.3.9. Становление и развитие планирования эксперимента
- Коучинг - Методики преподавания - Андрагогика - Внеучебная деятельность - Военная психология - Воспитательный процесс - Деловое общение - Детский аутизм - Детско-родительские отношения - Дошкольная педагогика - Зоопсихология - История психологии - Клиническая психология - Коррекционная педагогика - Логопедия - Медиапсихология‎ - Методология современного образовательного процесса - Начальное образование - Нейро-лингвистическое программирование (НЛП) - Образование, воспитание и развитие детей - Олигофренопедагогика - Олигофренопсихология - Организационное поведение - Основы исследовательской деятельности - Основы педагогики - Основы педагогического мастерства - Основы психологии - Парапсихология - Педагогика - Педагогика высшей школы - Педагогическая психология - Политическая психология‎ - Практическая психология - Пренатальная и перинатальная педагогика - Психологическая диагностика - Психологическая коррекция - Психологические тренинги - Психологическое исследование личности - Психологическое консультирование - Психология влияния и манипулирования - Психология девиантного поведения - Психология общения - Психология труда - Психотерапия - Работа с родителями - Самосовершенствование - Системы образования - Современные образовательные технологии - Социальная психология - Социальная работа - Специальная педагогика - Специальная психология - Сравнительная педагогика - Теория и методика профессионального образования - Технология социальной работы - Трансперсональная психология - Философия образования - Экологическая психология - Экстремальная психология - Этническая психология -