ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

Инновационные источники языкового материала

При всей важности и необходимости использования традиционных источников языкового материала они всё же имеют ограничения.

Во-первых, для того чтобы обеспечить эмпирическую базу, достаточную для получения достоверных результатов, исследователь затрачивает много сил и времени на кропотливую, в какой-то мере рутинную работу, состоящую в ручной обработке письменных текстов, которая иногда затягивается на годы [Баранов 2002 : 112].

Дефицит времени иногда приводит к тому, чтобы ограничиться лишь минимально достаточным количеством материала, что снижает степень достоверности исследования.

Во-вторых, функциональный подход к анализу лексико-семантической системы языка, а тем более - речеведческий, можно уподобить микроскопу, позволяющему лингвисту разглядеть микроизменения в языке, незаметные «невооруженным глазом». Наличие такого инструментария даёт возможность фиксировать тенденции в развитии языка и осуществлять прогнозирование. Но для этого нужны большие массивы текстов.

В-третьих, по мнению А. А. Кретова, сложность состоит в том, что список единиц, функции которых подлежат всестороннему изучению, исследователь получает лишь по завершению сбора материала и анализа источников. Это значит, что для сбора информации о функционировании интересующих его лексических единиц требуется заново обработать тот же корпус источников

под новым углом зрения. Избежать повторения исследовательского цикла можно, лишь формируя электронные корпуса текстов\

Таким образом, поиски инновационных источников языкового материала закономерны.

Создание таких корпусов и формирование корпусной лингвистики является магистральным направлением современной лингвистики. Встаёт задача разработки общих принципов построения корпусов с использованием современных компьютерных технологий с точки зрения пользователя, и, прежде всего, - национальных корпусов (вторая половина XX века).

Национальный корпус - это информационно-справочная система, основанная на собрании текстов в электронной форме. Он представляет данный язык на определённом этапе его существования и во всем многообразии жанров, стилей, территориальных и социальных вариантов, потому может использоваться для решения широкого круга задач лингвистики. При этом полученные результаты «максимально объективны», поскольку «языковой материал отчуждён от исследователя и не зависит от него» [Кронгауз 2001 : 95].

Доступ к большому объему текстов позволяет избежать неправомерных обобщений о состоянии языка, которые возможны при работе с ограниченным и разрозненным материалом [Гвишиани, Герви 2001].

В настоящее время национальные корпусы - это не просто дань техническому прогрессу и очень удобный инструмент для поиска языкового материала, но именно предмет новой идеологии изучения языка, для которой язык, собственно говоря, и есть корпус [Плунгян 2008 : 12], т. е. корпусная лингвистика сосредоточила своё внимание на идее выбора и лингвистике речи, а потому национальные корпусы языков - это одновременно и база, и инструмент лингвистического исследования, и третий, обязательный формат представления языкового знания и языка.

Смысл корпусно-ориентированной лингвистики в том, что она позволяет изучать действительно существующие явления языка, т.к. весь материал является отмеченным в реальной языковой коммуникации, а не мнимые явления, поэтому исследования, базирующиеся на корпусах, сильно отличаются от исследований, созданных в «докорпусную» эпоху [Кронгауз 2001 : 91-95; Плунгян 2008 : 7-20].

Вот почему мои аспиранты активно используют национальные корпусы [например: III. Василенко 2008; Запевалова 2008; Талапина 2008; Дедюхина 2010; Шадрина 2010 и др.].

* Приведём хотя бы один пример.

nt\. Диссертационное исследование Ю. Ю. Шадриной «Функционирование д местоименных прилагательных в русскоязычном и англоязычном дискурсах» (Екатеринбург, 2010)» базируется на языковом материале, извлечённом из «Национального корпуса русского языка» [www.ruscorpora.ru] и «The British National Corpus» («Британского национального корпуса») [625]

[www.sara.natcor.ox.ac.uk] в объеме 100 000 высказываний (одинаково по

языкам).

Такой объем оказался достаточным для решения трех специфических задач: выделить и описать семантическое пространство местоименных прилагательных в изучаемых языках; выявить и описать денотативное пространство местоименных прилагательных в изучаемых языках; определить степень когнитивной выделенности местоименных прилагательных в русскоязычном и англоязычном дискурсе.

Как видим, решение таких задач оказалось возможным только в рамках корпусной лингвистики и когнитивно-дискурсивной парадигмы.

Следует отметить, что на сегодняшний день работа с корпусами имеет определённые сложности, связанные и с качеством корпусов и не сложившейся пока методикой работы с корпусами (исследовательскими и иллюстративными).

С множеством проблем корпусной лингвистики можно ознакомиться в работе: [Баранов 2001 : 112-137].

Необходимо сказать и о других инновационных формах сбора языкового материала. Поскольку компьютерные технологии широко используются в печатном деле и в средствах массовой информации, то существенно упростился процесс получения материала: большинство крупных газет имеют электронные версии, функционирующие в информационных сетях, в частности, в Интернете. Имеются довольно продуктивные устройства сканирования текста (сканеры) и эффективные программы расшифровки графической информации.

Хочу обратить внимание исследователей на то, что если корпусы по сути своей сближаются с основным, первичным традиционным источником языкового материала - текстами, то со вторым традиционным источником (лексикографическим), по мнению В. М. Лейчика, сближаются такие инновационные источники, как БД (базы данных) и ТБД (терминологические базы данных), а на их основы БЗ (базы знаний) и ТБЗ (терминологические базы знаний), которые можно рассматривать как «развитие словарей в сторону автоматизации поиска упорядоченной информации» [Лейчик 2006 : 214-215].

В 1996 году специалистами по компьютерной лингвистике и индексированию текстов была создана компания «Интегрум», разработавшая информационно-поисковую систему баз данных для гуманитарных исследований - Integrum [www.integrum.ru].

Сравнивая «Национальный корпус русского языка» и Integrum, В. А. Плунгян считает, что они дополняют друг друга: для специальных лингвистических исследований, к примеру, грамматических, благодаря развитой системе разметки, наиболее приспособлен «Национальный корпус русского языка». Но с другой стороны, для фронтальных исследований в области «истории слов конца XX века» собрание баз «Интегрум» вне конкуренции [Integrum 2006 : 84].

Кроме того, эта крупнейшая электронная коллекция русскоязычных документов и информационно-поисковая система для их обработки (в том числе уникальный инструмент для статистического анализа) в нашей стране - самая мощная. Так, она - рекордсмен среди информационных систем на русском языке: на начало 2006 г. «Национальный корпус» содержал 120 млн. словоупотреблений, тогда как в базах «Интегрума» хранилось уже 350 млн. документов. В книге «Integrum: точные методы и гуманитарные науки» (М., 2006) содержатся описания исследований, выполненных при помощи Интегрума. В приложении даётся характеристика существующих баз данных (отечественных и зарубежных), к примеру, хочу обратить внимание на «Полистилевой корпус русского языка» [www.philol.msu.ru/humlang/articles/polystylcorp.html] [Интегрум 2006 : 406-420].

Остался ещё один важный вопрос: какова должна быть по объему эмпирическая база лингвистического исследования?

Однозначный ответ дать невозможно: количество единиц определяется рядом параметров данного исследования: темой ^ проблемой ^ объектом ^ предметом ^ целью и задачами. Если исследователь владеет лингвистическими методиками, то они уже обусловливают верификацию результатов [см.: Комарова, Краев 2008 : 59-66][626].

Если же не владеет, то всегда для того, чтобы полученные научные результаты были в зоне достоверности, приходится собирать материал «с запасом» и комбинировать использование источников.

? Приведём пример.

пК В диссертационном исследовании «Репрезентация категории парти-

тивности в статике и динамике (в русском и английском языках)»

А.

С. Дедюхина в эмпирическую базу исследования включает два типа

источников: для анализа категории партитивности в сопоставляемых языках в системно-категориальном (языковом) аспекте - словари и справочники, грамматики русского и английского языков; для анализа категории партитивности в сопоставляемых языках в конкретно-смысловом (речевом, дискурсивном) аспекте - национальные корпусы русского и английского языков («Британский национальный корпус»), из которых сплошной выборкой были извлечены 100 тысяч высказываний в равных количествах по языкам [III. Дедюхина 2010 : 11].

Первый источник позволил выявить четыре прототипических смысла категории партитивности, а второй - 12 модификационных смыслов в зоне ближней периферии; 15 - в зоне дальней периферии и 16 - в зоне крайней периферии, т. е. 43 модификационных смысла.

Думаю, что эти результаты можно было получить только при сочетании источников материала и, безусловно, только с использованием корпусов языков.

Вместе с тем такая эмпирическая база позволила провести классификацию языкового материала с учётом 1) логических правил операции классификации (см. раздел 3.1.3 пособия); 2) философско-общелогического метода классификации (см. раздел 7.4 пособия); 3) методики классификации описательного метода лингвистики (см. раздел 14.1.1 пособия).

<< | >>
Источник: Комарова З. И.. Методология, метод, методика и технология научных исследований в лингвистике: учебное пособие. 2012

Еще по теме Инновационные источники языкового материала:

  1. Глобальный английский в «зоне перевода»
  2. ТЕМА: Лингвистическая катастрофа
  3. НЕКОТОРЫЕ ПРОБЛЕМЫ МЕЖДУНАРОДНОГО НАУЧНОГО СОТРУДНИЧЕСТВА И РАЗВИТИЯ ОБЩЕСТВЕННЫХ НАУК В КОНТЕКСТЕ ДИАЛОГА КУЛЬТУР Ильхам Мамед-Заде
  4. ИНТЕРТЕКСТУАЛЬНОСТЬ КАК ФОРМООБРАЗУЮЩИЙ ПРИНЦИП НОВЕЙШЕЙ АРХИТЕКТУРЫ А.С. Шамрук
  5. СТИЛИ ЯЗЫКА
  6. ИСТОЧНИКИ И МЕХАНИЗМЫ КУЛЬТУРНОЙ ДИНАМИКИ
  7. КАЗАХСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТим. АЛЬ-ФАРАБИ - ВЕДУЩИЙ НАУЧНЫЙЦЕНТР КАЗАХСТАНА
  8. НАУЧНО-ИССЛЕДОВАТЕЛЬСКАЯ ДЕЯТЕЛЬНОСТЬКАБАРДИНО-БАЛКАРСКОГОГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
  9. Инновационные источники языкового материала
  10. Технология формирования межкультурной коммуникативной толерантности студентов в вузе
  11. 5.4. Использование языковых средств фольклора и прецедентных текстов в рекламе