<<
>>

Метод оврагов как прототип «гибкой логики»

Попробуем теперь уяснить, каким должен быть «идеальный» педагог и как он должен действовать.

Легко понять, что все многообразие оттенков и систем обучения располагается, по существу, между двумя крайними случаями.

Типичным при- мером одного подхода может служить обучение солдат строевому уставу или материальной части военной тезники. Каждый шаг обучения тщательно продуман и регламентирован, весь процесс расчленен на строго очерченные «элементарные порции» (типа «На ле-во!» или «По счету „раз“ оттянуть затвор назад...»), последовательность которых с немалым основанием может претендовать на звание «алгорифма». Конечно, корни этого расчленения и «алшрифмизации» следует искать отнюдь не в математической логике, а в опыте практического обучения, но суть дела от этого не меняется — это именно алгорифмы, то есть единые методы для вполне определенного, однозначного решения задач массового обучения из класса задач однотипных (хотя и не тождественных). Вопрос о различных возможных исходах каждого элементарного акта обучения на этом уровне просто не ставится — предполагается (и этот «постулат» оправдывается его практической выполнимостью), что путем продуманной и целесообразной тренировки цель обучения достигается всегда.

С легкой руки интеллигентных Обломовых все такого рода принудительные методы обучения (принудительные — в том смысле, что они допускают лишь однозначные, заранее предопределенные исходы) стали называть «муштрой», хотя каждому непредубежденному человеку должно быть ясно, что неприемлемым в действительности является не сама по себе «принудительность», а распространение сферы ее приложения на области, обучению которым она по существу противопоказана (таковы, например, попытки — к сожалению, не всегда безуспешные — свести нравственное или идеологическое воспитание к навязыванию догм). Что же касается «безумного», «автоматического» пользования таблицей умножения или умения печатать на пишущей машине, то этому можно лишь радоваться — никому не хочется тратить свои умственные способности на ежедневное открытие уже открытых Америк.

Наиболее интересные и эффективные методики массового обучения (особенно профессионального) как раз обязаны своим происхождением осознанию этого простого обстоятельства— не пытаясь «алгорифмизировать» все и вся, они подверши «алгорифмизации» все, что ей в действительности поддавалось (см. ниже о методике ЦИТа).

Какие же, однако, «рецепты» успешного обучения можно рекомендовать в тех случаях, когда к «алгорифмизации» не видно (хотя бы на определенном уровне знаний) никакого оправданного подхода (а таких случаев, по-видимому, большинство)? — Здесь мы обратимся к прямо противоположной педагогической тенденции (столь же, впрочем, далекой на первый взгляд от «идеала», как и образ педашга-командира). Вспомним, что делают часто с безнадежно «отстающими» учениками — к ним приглашают «репетитора». Такой «репетитор» (часто это даже не педагог-профессионал, а подрабатывающий на жизнь студент) за два-три месяца «вдалбливает» в своего подопечного все те премудрости, которые тот никак не мог усвоить в школе. В чем же секрет успеха? — Ведь репетитор не только не знает, как «поступать в каждом случае наилучшим образом» (то есть во всяком случае не владеет никакими «алгорифмами»), но подчас вообще не представляет толком, с чего начать! Избираемая им тактика часто предельно проста — и мудра: он действует наугад. Не зная, как надо действовать, он знает зато, что ему нужно — допустим, чтобы его ученик стал переэкзаменовку за седьмой класс. Об успешности своих проб (в виде объяснений, даваемых наугад упражнений и др.) он судит не на основании неизвестных ему критериев их доброкачественности, а по степени соответствия их результатов намеченной им цели. Такой «случайный» перебор отдельных «тактик» продолжается до тех пор, пока «проба» не оказывается удачной, затем (и в этом-то и сотоит «общая тактика») он продолжает идти в «удачно угаданном» направлен™, пока вдруг не убедится, что частная тактика перестала приносить успех, затем снова «ищет» новую частную тактику, следует ей до следующего вынужденного «переключения», и т.

д. Память репетитора и накапливаемый при ее помощи опыт позволяет ему избегать при дальнейшем выборе очередной частной тактики явно бессмысленных шагов (то есть его действия становятся все менее случайными), но в конечном счете надежнейшей гарантией успеха служит именно умение оценивать степень соответствия результата каждого этапа своей деятельности (которую хочешь- не хочешь— придется называть обучением) намеченной цели. Итак, успех репетитора объясняется тем, что по мере обучения ученика он обучается сам. Он адаптируется (приспосабливается) к действиям ученика, а тот, в свою очередь, адаптируется к его действиям. Никто у них не командир, и никто не выполняет приказы, но каждый из них учит другого — в том же смысле, в каком «необученная» мышь учит котенка ловить мышей, а тот — опять-таки неученный — учит ее спасаться от кошек.

Значит ли все это, что такое обучение «как Бог на душу положит» и сеть залог успеха? — Разумеется, нет. Чем опытнее «репетитор», чем лучше ему известны основные трудности (закономерности) преподаваемой дисциплины, чем больше знает он частных «алгорифмов», заменяющих некоторые «частные тактики», тем менее случайным оказывается поиск других частных тактик и тем быстрее достигает он конечной цели. А скорость обучения как раз и оказывается часто решающим критерием его успешности -если во многих случаях и нельзя указать нижние границы сроков обучения, то приемлемые верхние границы вполне обозримы (понятно, например, что обучение таблице умножения, на которое тратится пять лет, вообще не стоило бы называть обучением).

Так почему же успех самоучки-репетитора часто оказывается недостижимым для педагога-профессионала? Ответ прост: в отличие от репетитора, который преспокойно «играет в адаптацию» с учеником один на один, учитель в школе часто просто физически не в состоянии осуществить свои функции «управляющего сложной системой обучения» — «ал- горифмически-командных» методов он (да и никто другой!) не знает, а «адаптироваться» к каждому ученику он не успевает.

Поэтому-то любой уважающий себя педагог, с негодованием отворачивающийся от «муштры» и «репетиторства» как «непедагогических» методов обучения, на самом деле всей своей практикой пытается лавировать между этими тенденциями. Опыт такого лавирования и благоприобретенные его навыки и есть, то что часто называют педагогическим мастерством, а способность к нему — педагогическим талантом.

* * *

Описанное выше схематически взаимодействие обучающего и обучаемого есть типичный случай той широко распространенной формы приспособления различных организмов (или «механизмов») к окружающей среде, которую биологи (особенно трактующие этот вопрос с «кибернетических позиций») называют гомеостазисом.

Представим себе некоторую «систему» (например — но не обязательно — живой организм), состоящую из «среды» и реагирующих на изменение последней «рабочих организмов» системы. Система характеризуется набором «переменных» (наборы значений переменных суть «состояния» системы), часть которых — так называемые существенные переменные — должна оставаться (или каким-либо образом поддерживаться извне) в определенны, так называемых физиологических, пределах. Переменные эти можно предположить меняющимися непрерывно — их изменения (внутри физиологических пределов) незначительно изменяют состояние системы (во всяком случае, такого рода изменения существенных переменных не приводят к тому изменению «живой» системы, которое принято— или имеет смысл — называть «смертью» системы). Другие переменные — назовем их параметрами (или несущественными переменными)— можно мыслить меняющимися дискретно, «ступенчатыми» (принимающими конечное или счетно-бесконечное множество значений); практически «ступенчатость» означает обычно, что за «значения» переменной принимаются целые области значений какой-либо другой, непрерывной переменной — если состояние системы определяется не отдельным значением непрерывной переменной, а тем, к какой из этих областей она принадлежит (изменение же переменной внутри каждой области не влияет на систему).

Переменные «рабочей» («реагирующей») части системы и среды взаимодействуют непрерывно, и это взаимодействие (при помощи так называемой обратной связи) собственно и есть то, что называют жизнедеятельностью системы. Когда в ходе этого взаимодействия, существенные переменные приближаются к физиологическим пределам (попадая в так называемую критическую область), это приводит (путем действия так называемой обратной связи второго порядка[105]) к изменению параметров, изменению, вообще говоря, случайному; последнее в виду его скачкообразного характера, можно трактовать как не просто изменение отдельного состояния системы, а изменение «формы ее поведения» (то есть характера взаимодействия существенных переменных со средой) -нечто вроде выбора одной фиксированной кривой из семейства кривых, характеризуемых уравнениями, содержащими параметр (или несколько параметров). Если такое «переключение параметров» ввело существенные переменные в доктритическую область, форма поведения (то есть то, что раньше называлось «частной тактикой») не меняется (до худших времен), если же нет — оно происходит до тех пор, пока не будет найдена жизнеспособная тактика, и т. д.

Поясним сказанное простым примером. Пусть в качестве существенных переменных системы — человеческого организма фиксированы пульс и частота дыхания. Пока каждая из них не выходит за пределы значений 40-160 и 20-60 соответственно, организм живет (цифры, разумеется условны), в противном случае умирает. Критические значения пусть соответственно 50,130 и 30,50. В качестве единственного параметра возьмем температуру тела; этот «параметр» принимает всего три «значения»: «нормальная» (36°-37°С), «аномальная» (35°-36° и 37°-41°) и «летальная» (lt; 35° и gt; 41°). (Конечно, мы знаем, что температура тела сама есть функция других характеризующих нашу систему переменных, но мы вправе фиксировать в качестве параметра именно се, рассматривая организм как «сложную функцию» многих, вообще говоря недоступных измерению, переменных). Выход пульса и (или) частоты дыхания за критические значения обусловливает (сложным, но в данном случае безразличным для нас способом) изменение температуры.

Организм из состояния «здоровый» переходит в состояние «больной» и «выбирает» новую тактику поведения (активизируются защитные антитела в крови, усиливается кислородный обмен и т. п.). Если это «изменение тактики» вводит существенные переменные в докритические границы — организм выздоравливает, если же в течение определенного времени (время такой адаптации само можно рассматривать как одну из существенных переменных системы) этого не происходит, или же существенные переменные, продолжая изменяться в критической области, выходят за физиологические пределы, организм умирает[106]

Конечно, этот отрубленный пример не может дать достаточного представления о богатстве возможностей адаптации, которыми могут располагать гомеостатические системы. Но если представить себе систему с большим набором параметров (а следовательно, и определяемых их комбинациями форм поведения — тактик), становится понятным, что даже такой случайный, «слепой» поиск может — в случае, когда среди состояний системы достаточно велика доля «устойчивых», то есть таких, что проходящие через них линии поведения не выходят в критическую область,— обеспечить организацию системы управления, в частности, обучения, неизмеримо более жизнеспособную и гибкую, чем строго детерминистская система того же порядка сложности[107].

Теперь нам придется перейти к чрезвычайно важному вопросу (лишь бегло упомянутому выше) о времени, требующемся для адаптации. Довольно естественно ожидать, что вопрос этот теснейшим образом связан со «степенью случайности» системы. Проявление тенденции, противоположной случайности, хаотичности, будем, как и обычно, называть организацией (или организованностью) системы.

* * *

Естественно возникает вопрос: действительно ли полная случайность гомеостатического поиска приемлемых значений параметров так фатальна? — Уже самое поверхностное раздумье побуждает нас считать, что это не так. В самом деле, если нам (организму или механизму, вырабатывающему тактику приспособления к среде) известны (или — на что во всяком случае имеет смысл рассчитывать— становятся известными в процессе поиска) хоть какие-то специфические свойства данной среды, то грех не попытаться использовать их входе дальнейших поисков. Разыскивая, например, человека и, зная лишь номер дома, в котором он живет, мы стараемся припомнить самые разрозненные сведения, которые могут нам помочь (обрывки разговоров о виде из окна, упоминания о соседях и т. п.) так что, по существу, поиск уже оказывается не вполне случайным

Больше того, поиск может если в действительности и не стать более результативным, то хотя бы каким-либо «разумным» образом организоваться не только из-за действительного знания особенностей среды, но и благодаря более или менее правдоподобным гипотезам об этой организации, в том числе даже самой бедной (в отношении заключенной в ней информации), например, гипотезой, что какая-то «организация» действительно есть. Если нам приходится ночью добираться до жилья по незнакомой местности, мы, конечно, исходим прежде всего из предположения о се обитаемости, а наткнувшись, например, среди голой степи на дорогу, считаем, что она куда-то ведет, и т. п.

Рассмотрим теперь вкратце, следуя, И. М. Гельфанду и М. JI. Цетли- иу[108], вопрос о том, каким образом знание (или гипотезы) об «организации» (структуре) управляемой (управляющей) системы может облегчить процесс поиска решения. При этом мы будем исходить из следующих (частично уже отмеченных выше) основных представлений[109]

  1. Главным недостатком «изоморфных», «алгорифмических» моделей сложных управляющих систем являются претензии на полноту описания моделируемой системы Полнота эта, достигаемая ценой чрезвычайных усилий, оказывается часто практически бесполезной, ввиду необозримости полученного описания и громоздкости предписываемых им расчетов, превосходящей реальные возможности.
  2. Расчет на «чистый» гомеостатический поиск, принципиально безупречный, не оправдывается из-за слишком большого времени, требуемого для такого «слепого» поиска. Это обстоятельство, неудобное и само по себе, в случаях, когда «оптимизируемая» система меняется во времени быстрее, чем происходит поиск, совершенно обесценивает результаты последнего. (К такого рода «запаздывающим» решениям в полной мере приложим популярный афоризм, относящийся к ал- горифмическим моделям: «Вычислить погоду на завтра можно точно, но для этого нужен месяц»).
  3. В согласии с давней естественнонаучной традицией, мы будем стремиться строить не столько «изоморфные», сколько «гомоморфные» модели интересующих нас процессов, фиксируя в них лишь самые существенные черты оригинала. Назначение модели (в случае сложной системы, каковыми, безусловно, являются объекты живой природы) состоит не столько в задании громоздких и жестких алгорифмов, сколько гибких (хотя и не стопроцентно надежных) тактик. Не пытаться «командовать» природой, а «играть» с ней (стремясь, разумеется, к выигрышу)!

Что же, однако, такое «существенные» черты процесса, и каким образом они сказываются на его течении и свойствах? На первый взгляд, существенными для данного процесса являются те факторы, которые заметно меняют его течение, прочие же — несущественны. Интересно, что по некотором размышлении выясняется, что дело обстоит как раз наоборот! Изменение температуры тела человека не сказывается «заметно» на его состоянии— в том смысле, что его органы по-прежнему продолжают функционировать (хотя и в другом режиме), и вообще человек остается человеком. То же относится и к другим жизненно важным характеристикам функционирования организма. С другой стороны, наличие шести пальцев на руке воспринимается как резкая аномалия, а восьмипалого человека мы склонны (хотя, быть может, и без достаточного основания) считать монстром. Значит ли это, что одной из «существенных» характеристик системы «человек» мы должны признать число пальцев на руке? Не проще ли с самого начала ограничиться рассмотрением пятипалых, двуногих, одноголовых людей? Изменение концентрации адреналина в крови — пока она не выходит за физиологические границы! — не превращает человека в труп, чего никак нельзя сказать о концентрации, допустим, цианистого калия («в норме» равной нулю). Так что же естественнее: считать «существенными» степени отравления цианистым калием, стрихнином и др. или попросту «ограничиться» изучением неотравленных людей? Изменения окружающей температуры, конечно, далеко не безразличны для нас. И тем не менее мы не пожертвуем сколько-нибудь значительно общностью, если забудем указать, как «функционирует» организм при температурах жидкого гелия или оказавшись в эпицентре взрыва водородной бомбы. Вопросы о характере дыхания человека в атмосфере из метана и аммиака, о разрешающей способности микроскопа после удара парового молота, о точности хронометра в мартеновской печи не так уж глубокомысленны! Итак, изучая человека, мы позволяем себе «отвлечься» от исследования трупов; занимаясь теорией механизмов, не будем рассматривать обломки.

Действительно существенным для человека (в вообще любого «механизма», «организма», «системы») является не то, без чего он перестает быть человеком, а то, чем определятся его поведение именно в качестве человека! Таким образом, роль несущественных переменных какой-либо системы выражается не в том, чтобы характеризовать ее самое, а в том, чтобы выделить нужную функцию (как предмет последующего изучения) из класса, семейства функций. Существенные же переменные характеризуют более «тонкие», «деликатные» свойства самой выбранной функции. («Несущественные переменные» больного — его паспортные данные, «существенные» — данные клинического исследования.).

Общий тип задач, к которому относится интересующая нас задача рационализации обучения, можно охарактеризовать следующим образом. Рассматривается некоторая система F, определяемая переменными х( и » (/ = 1,..., n\j = 1, ..., т; n gt; 1, т gt; 0), называемыми также параметрами[110]: F = F(xlt ...,xn;yh ...,Ут).

Переменные xh...,xn— так называемые рабочие параметры, доступные непосредственному измерению и преднамеренному изменению; переменные у и ут (являющееся, вообще говоря, функциями рабочих параметров и времени) — так называемые скрытые параметры — измерению не доступны. Функция Ф (xIf xn, t) = F (xh xn; yh ym), значения которой могут быть измерены, называются функцией оценки (или оценочной функцией). Ставится задача о разыскании областей относительно малых значений функции оценки[111]

Поскольку, как говорилось выше, такие алгорифмические методы минимизации, как, например, решение системы дифференциальных уравнений, полученных приравниванием нулю производных оценочной функции по каждому аргументу, вообще говоря, слишком трудоемки, ставится задача о непосредственном отыскании минимумов. К тому же мы вовсе не ограничиваем рассмотрение случаем, когда Ф задана аналитически: «система» задается как таковая (поскольку речь идет о реальных физических процессах, протекающих в реальном времени), а не представляющей ее формулой (которой, как обычно в физике, мы просто не знаем).

Каковы возможные типы тактик поиска минимума? Заметим превыше всего, что поскольку Ф зависит от времени, имеет, конечно, смысл ставить лишь задачу о разыскании не абсолютного минимума, а областей со сравнительно малыми (для определенного промежутка времени) значениями Ф. Отвлекаясь пока от этого обстоятельства, укажем, прежде всего на так называемые методы слепого поиска: рассматривавшиеся выше гомеостатический поиск и «регулярные» (то есть производящиеся по некоторому априорному, не определяемому особенностями функции, закону) просматривания значений Ф. Поиск такого рода приостанавливается по достижении достаточно малых значений Ф и возобновляется, когда с течением времени эти значения снова возрастают. Тактика эта обладает всеми достоинствами и недостатками тактики пришедшего в кино человека, занимающего первое попавшееся место (или — в случае «закономерного» поиска — пытающегося садиться, скажем, на места, номер которых оканчивается на 5 или на 8) и сидящего на нем до тех пор, пока его не сгонит владелец билета. Удобства этой тактики при аншлагах общеизвестны.

Вторая группа тактик — так называемые методы локального поиска. Один из наиболее распространенных, так называемый градиентный метод, можно кратко описать так. Пусть интересующая нас функция двух переменных задана своим двумерным графиком, то есть макетом некоторой «холмистой поверхности». Бросая шарик в любую точку этого «макета», мы будем считать задачу решенной, когда шарик останется в какой-нибудь впадине. Для достаточно малой окрестности полученной впадины она действительно будет минимумом, но, конечно, эта тактика никак не отражает свойств минимизируемой функции в целом (шарик всегда может застрять в «нехарактерной» впадине, своего рода «высокогорном озере», так и не попав в «долину»).

Методы третьей группы, называемые И. М. Гельфандом и М. JI. Цет- линым методами нелокального поиска, представляют собой «гибриды» методов двух первых типов. Например, из выбранных наугад («принцип гомеостата») точек ведется спуск градиентным методом, причем в случае достижения достаточно малых значений оценочной функции поиск приостанавливается, в случае же, когда дальнейшее продвижение по градиенту оказывается малоэффективным, хотя значения функции оценки еще велики, поиск начинается из новой случайно выбранной точки.

Недостаток локального метода, состоящий в том, что в нем не учитываются «частичные успехи» и дальнейший поиск снова предпринимается с больших значений оценочной функции (то есть игнорируется «прошлый опыт», могущий быть положенным в основу «обучения»), преодолевается в предложенной Гельфандом и Цстлиным «тактике оврагов». Основной ее предпосылкой является представление о «хорошей организации» минимизируемой функции: функция называется хорошо организованной, если ее переменные можно разбить на две группы: немногочисленные (одна, две, три) существенные и все остальные — несущественные ( в разъясненном выше смысле).

Это разбиение переменных на два класса (а в более сложных случаях — на несколько классов: несущественные, существенные I рода, П рода,...) вовсе не предполагается заранее заданным (так же, как и сама оценочная функция!), а выявляется в процессе поиска. Кроме того оно зависит, вообще говоря, от времени и от рассматриваемого участка оценочной функции[112], что также определяется поиском и сказывается на его дальнейшем ходе.

Образно говоря, «хорошо организованной» можно назвать функцию (систему), «сущность» которой изменчива, но в каждый момент ее можно описать «в немногих словах». По сути дела такое представление о «хорошей организации» («четкой структуре») совпадает с привычным мнением о том, что действительно важные особенности упорядоченной ситуации, или системы (в отличие от хаотической), можно выразить кратко; все же остальное, как бы внешне оно не меняло систему, не стоит подробного упоминания. Можно, например, считать, что единственной «существенной переменной» системы «живой человек» является его дыхание (живущий— дышит, и обратно -тот, кто дышит, тот живет), все же остальное либо несущественно (цвет волос, вероисповедание и др.), либо однозначно определяется самим фактом дыхания (у дышащего бьется сердце и обратно, и т. д. и т. п.).

* * *

Вопрос, к которому мы теперь подошли, для интересующей нас темы, по нашему убеждению, является важнейшим. Ни жесткие рецепты «алго- рифмической логики», ни стихийная «логика здравого смысла», которой мы руководствуемся при гомеостатическом «репетиторстве», не могут сами по себе решить проблему создания достаточно гибкой и эффективной системы обучения. «Логика», которая нам кажется в гораздо большей степени отвечающей нуждам задачи рационализации обучения, есть «логика игры», но не игры, рассчитанной на чистое «везение», а игры, правила которой предусматривают учет всех (известных!) особенностей «оптимизируемой» системы, которая делает поиск более целенаправленным, а следовательно, более эффективным и быстрым[113]

Предложенная в неоднократно упоминавшейся статье Гельфанда и Цетлина «тактика оврагов» кажется нам наиболее адекватным «логическим инструментом» для моделирования управления обучением. Отнюдь не претендуя на подмену чрезвычайно ясного точного и убедительного изложения авторами этого метода, нижеследующие абзацы призваны описать «логику овражного поиска» как можно нагляднее.

Представим себе снова, что задача, которую мы решаем, заключается в отыскании областей малых значений некоторой зависящей от времени «оценочной» функции. Пусть она задана нам в виде «материального графика», то есть в виде совершенно реального участка местности. Еще лучше: дана нам именно местность, а такие слов, как «функция» и т. п., мы вольны произносить или не произносить. Допустим, что дело происходит зимой, так что многие ямы и возвышения, занесенные снегом, нам не видны даже в непосредственной близости, а снегопад настолько силен, что вообще что-либо (не подлинный рельеф, но хотя бы сугробы) мы видим лишь на расстоянии нескольких (скажем, десяти) шагов. Как в этой ситуации целесообразно вести поиск малых значений функции оценки (то есть по возможности низких мест)?

Начнем поиск из первого попавшегося места. Допустим, что чувство равновесия и тактильные ощущения через подошву позволяют нам определить наклон этого участка. Сделаем шаг (стандартной длины) в направлении наибольшего наклона (по градиенту!). Там повторим то же самое и так до тех пор, пока перестанем чувствовать уклон, или же сочтем, что он слишком мал, чтобы имело смысл тратить время на дальнейшее движение в этом направлении.

Теперь естественно посмотреть, как ведет себя местность поблизости. Выберем еще одну произвольную точку (скажем, для определенности в направлении, перпендикулярном градиенту в первоначальной точке) на расстоянии, значительно большем «градиентного шага», например, на расстоянии видимости. Проделаем оттуда градиентный спуск — опять до такого места, где уклон станет меньше заранее определенной величины. Идея этих двух «разведывательных спусков»[114] состоит в том, чтобы добраться до области с малым уклоном — крутые градиентные спуски соответствовали минимизации по несущественным переменным, внизу же (в области двух конечных точек спусков), очевидно, уже нет прежнего (по предположению имеющегося, что подтверждается быстротой начала спусков) четкого разделения переменных на существенные и несущественные. Итак, два пробных спуска позволили нам установить, что мы находимся на «склоне оврага»[115]. Теперь для нового спуска нам незачем снова подниматься наверх: продолжив прямую, проходящую через конечные точки двух первых спусков (напомним, что эти точки находятся на расстоянии видимости), мы сделаем новый «овражный шаг» уже по этой прямой. Выбор фиксированной величины этого шага (как и выбор минимального учитываемого уклона при градиентном спуске) определяет точность и скорость поиска. Естественно ожидать, что лежащая на продолжении «спущенной» прямой исходная точка нового спуска лежит в области значений, не намного больших (если не меньших) предыдупщх «спущенных». Но даже если мы, сделав «овражный шаг» (по склону), несколько перескочили через «ложбину», то очередной градиентный спуск скорректирует этот подъем.

Итак, двигаясь, вообще говоря, по склону оврага (большими «овражными шагами») в направлении изменения существенных переменных, мы, исчерпав возможности минимизации по несущественным переменным на очередном градиентном спуске, исследуем уклон в новой начальной точке и — если градиент таков, что можно еще хоть немного спуститься, — используем и эту возможность[116]. Чем выше «степень организованности» функции (то есть чем меньше «сюрпризов» в виде «несущественных» «рытвин» и «бугров» мы встречаем на своем пути), тем больше шансов на то, что наш путь будет проходить если и не с монотонным спуском, то по крайней мере в области малых значений функции оценки.

Дополнительный учет изменения оценочной функции во времени можно представить себе как поиск низин в местности с меняющимся рельефом — скажем, в движущихся зыбучих песках. Ясно, что чем сильнее зависимость оценочной функции от времени, тем, при прочих равных условиях, менее эффективен поиск. В случаях, когда время не слишком сильно «меняет организацию» минимизируемой функции, направление поиска адаптируется к направлением оврагов, что и открывает возможности для интересующих нас приложений этой тактики.

* * *

В практической деятельности педагога намеченная выше тактика интерпретируется очень прозрачно. Представим себе учителя, обладающего психологией «репетитора», то есть человека, совершенно сознательно отказывающегося от претензий на «знание» того, как надо учить, но (вернее сказать — и потому) стремящегося как можно больше обучать своих учеников, учась у них. Возьмем, для определенности, школьный курс алгебры и будем исходить из предположения (оправданного хотя бы всеобщим почтением к строгости математики), что от (как совокупность формул и законов, что ли) представляет собой хорошо организованную функцию (определенную, например, на некоем множестве «всех осмысленных вопросов алгебраического содержания» , допускающих ответы «да» и «нет»). То же предположение сделаем и относительно процесса обучения алгебре — опять-таки без претензии на априорное знание того, какие «переменные» являются для него существенными.

Как же, по нашему представлению, должна протекать целесообразная деятельность образованного (на худой конец — в результате чтения предыдущей части этой статьи) репетитора, в отличие от описанного выше не мудрствующего лукаво репетитора-гомеостата? Каждый, кто учился (а тем более — учил) в школе, помнит, что примерно треть уроков алгебры уходит на воспитание беглых навыков в тождественных преобразованиях, и нашему «идеальному репетитору» простительно будет начать с того, что он предложит своим питомцам — шестиклассникам пару примеров на умножение и сложение дробей. Убедившись, что считать как следует они не умеют, он начнет тренировать их в том же (... градиентом!) направлении. Когда, наконец, ученики усвоят, что сумма квадратов и квадрат суммы не одно и то же, учитель (мы вводим здесь дополнительное и весьма сильное предположение) должен будет задуматься: «Неужели же все эти „утроенные произведения квадрата первого члена на второй" и т. п. и есть математика? А не вернее ли предположить, что математика начинается там, где проблема беглости уже не возникает?». — Тогда, двинувшись по «оврагу», то есть в области малых значений оценочной функции (которую, очевидно, можно задать в виде Ф = 5 — п, где п — отметка по пятибалльной системе), он займется, скажем, решением линейных уравнений[117]. Ко-

122

нечно, сталкиваясь с сюрпризами вроде «шестью-семь тридцать пять» , он будет вынужден каждый раз вносить «градиентные поправки», но для этого ему, вообще говоря, незачем будет на продолжительное время возвращаться к амплуа дрессировщика: в целом движение будет идти все же где-то в нижней части оврага, по которому протекает один из рукавов реки Алгебры (шкала времени может быть проградуирована, например, в параграфах и абзацах учебника Киселева; природа этой шкалы, как уже говорилось, выдвигает свои проблемы, но и они, как нам кажется, могут успешно рассматриваться с помощью аналогичного подхода).

Не раз (например, в связи с действиями над радикалами при решении квадратных уравнений) учителю и ученикам придется огибать «пороги» и «заторы», возникающие на «фарватере» их ручья, но благоразумные «градиентные» усилия помогут им найти если не водосбросные стоки через эти плотины, то перевалы через цепь прибрежных холмов. Определение разумного соотношения между минимальным уклоном градиентных спусков и длиной овражного шага есть, конечно, как и в любой задаче такого типа, дело эксперимента: выбор слишком малого минимального уклона приведет к «зацикливанию» на бесконечных «упражнениях» и «примерах», слишком большой овражный шаг может вызвать у учеников дурную привычку рассуждать об умных материях, не овладев элементарной «кухней».

Но как бы то ни было — ив этом, пожалуй, основной методологический тезис «овражной логики» — никакая попытка «жестко запрограммировать» методику даже самого успешного овражного поиска в качестве «эталона» не может претендовать на применимость ко всем «плохим» задачам (относящимся к той же «массовой проблеме» среднего образования) в качестве «алгорифма». Залог успешности поиска не в силе алгорифмов, а в гибкости тактик[118] Эта же мораль, по нашему мнению, целиком относится и к (еще не созданным) «моделям обучения».

<< | >>
Источник: Бирюков Борис Владимирович. Трудные времена философии. Юрий Алексеевич Гастев: Философско-логические работы и «диссидентская» деятельность. М.: Книжный дом «ЛИБРОКОМ»,2010. — 160 с.. 2010

Еще по теме Метод оврагов как прототип «гибкой логики»:

  1. Метод оврагов как прототип «гибкой логики»