Всем корпусом

В рамках Инновационной программы образования на Отделении деловой и политической журналистики (Государственный университет - Высшая школа экономики) прошла Международная конференция "Национальный корпус русского языка и проблемы гуманитарного образования". Сайт Национального корпуса русского языка открыт три года назад и является новым, еще малоосвоенным в России ресурсом. Между тем, по мнению организаторов конференции, использование этого ресурса в образовании должно оказать большое влияние на систему преподавания русского языка.

Конференция началась с двухдневного учебно-методического семинара для преподавателей российских вузов, в рамках которого преподаватели русского языка учились на практике использовать возможности нового ресурса. В учебно-методическом семинаре приняли участие профессора и молодые преподаватели из 15 российских городов.

19-20 апреля состоялась научная часть конференции, в которой с докладами выступили российские и зарубежные преподаватели-лингвисты. Участники поделились своим опытом использования этой инновационной технологии и обсудили проблемы развития корпусной лингвистики.

На вопросы отвечает Владимир Плунгян, один из создателей Национального корпуса русского языка, профессор, зав. отделом корпусной лингвистики Института русского языка РАН.

"Русский журнал": Давайте начнем издалека. Когда появилась корпусная лингвистика в ее современном виде и где появился первый корпус?

Владимир Плунгян: Не очень давно, это вторая половина XX века. Самый ранний, самый первый корпус, так называемый Брауновский корпус, появился в США, как и многие другие технические новинки. Но он был очень далек от современных корпусов - это были просто короткие отрывки текстов, которые использовались в основном для решения прикладных, статистических задач. Ценность корпусов для теории языка долгое время не осознавалась. А первый крупный успешный проект именно национального корпуса в современном понимании - это 90-е годы, Британский проект (British National Corpus). Он во многом стал образцом для последующих корпусов.

РЖ: А как развивалась корпусная лингвистика в России

В.П.: В России корпусные исследования долгое время отставали, и уже почти все ведущие языки обзавелись Корпусами в том или ином виде, а у нас еще даже не начинали работу в этом направлении. Русский Корпус впервые был открыт для свободного доступа в апреле 2004 года.

РЖ: Какие у русского Корпуса есть достоинства и недостатки по сравнению с другими национальными корпусами?

В.П.: Ну, начну с сильных сторон. Сильная сторона была в том, что наше отставание было не так плохо, оно сыграло и положительную роль - в том смысле, что мы могли учесть опыт предшественников и взять все лучшее, не повторяя ошибок. В частности, уже были славянские корпуса - чешский Национальный корпус очень хороший. И в некоторых решениях мы пошли дальше. Например, по качеству обработки материала, по количеству учитываемых языковых параметров, да и по объему материала наш Корпус один из лучших. Слабость, к сожалению, прежде всего в программном обеспечении - не все из того, что мы хотим реализовать, мы можем реализовать, и здесь проблем очень много. Не удается избежать и ошибок в обработке текстов; хотя ошибки есть в любом большом Корпусе (это предусмотрено технологией), хотелось бы, чтобы их было как можно меньше.

РЖ: В чем заключается глобальная задача Корпуса? Какие изменения он привносит в теорию лингвистики?

В.П.: Если совсем кратко, как я уже неоднократно говорил, то Корпус вернул лингвистам их настоящий объект изучения - т.е. подлинный язык, а не теоретические конструкции. Не то, каким должен быть язык, а то, каким он на самом деле является. Почему это произошло? Корпус дает несопоставимую возможность получения примеров. Если раньше лингвист вручную выписывал на карточках примеры, и на это уходили недели, месяцы, даже годы, то теперь за считанные секунды мы получаем тысячи примеров на интересующие нас явления. Т.е. массив данных, к которым мы получили доступ, возрос несопоставимо. И оказывается, в этих данных есть много того, к чему теоретики не готовы, что для них неожиданно. Это очень важно - знать, что мы на самом деле изучаем.

РЖ: А может ли Корпус реально внести изменения в теорию лингвистики?

В.П.: Да, я очень надеюсь, что все словари и все грамматики, которые будут делаться в ближайшем будущем - и русского языка, и другие, - будут делаться на основе Корпуса. Использование Корпуса и лингвистами, и не лингвистами в повседневной практике должно быть так же естественно, как, например, использование толкового словаря. И всякое утверждение в грамматике, будь то правило употребления падежей или, например, правило построения сложных предложений, должно быть подкреплено данными из Корпуса - что в Корпусе это так-то, столько-то, такие-то случаи и т.д. Это повысит надежность и проверяемость. Как нас учат, наука существует там, где существуют проверяемые утверждения. С Корпусом лингвистика делает еще один шаг к тому, чтобы повысить свой статус как науки.

РЖ: Какие задачи ставили организаторы данной конференции перед собой?

В.П.: Вы знаете, она задумывалась как обращение к преподавателям языка. Это, может быть, не главная особенность использования Корпуса, ведь в первую очередь он предназначен для исследователей языка: мы хотим, чтобы их сознание поменялось. И мы сами не ожидали, что это будет иметь такой резонанс среди преподавателей. Это получилось в каком-то смысле случайно - был просто отклик, люди писали, приходили, спрашивали, и мы поняли, что преподавателям Корпус тоже очень нужен, ведь они тоже имеют дело с живым реальным языком. Например, когда иностранцев обучают русскому языку. Многие из них говорят: "Я учил русский язык по учебникам, а потом я встретил русских и не понял ни слова". Это очень понятная, естественная ситуация. А в Корпусе - вот он, русский язык, настоящий русский язык. Поэтому, конечно, преподаватели, как люди практические, ухватились за Корпус сразу. И потом оказалось, что с его помощью очень удобно и эффективно учащимся - готовить задания, студентам - писать курсовые работы. Обо всем об этом мы первоначально не очень думали, но когда увидели, что эта сторона Корпуса вызывает отклик, мы поняли что надо работать с этим. Именно в этом направлении Высшей школой экономики была организована данная конференция. Кафедра словесности взяла на себя инициативу, и это очень приятно.

РЖ: А для кого создавался Корпус в первую очередь, если не для преподавателей?

В.П.: Мы думали в первую очередь про исследователей языка, про лингвистов. Но, конечно, Корпусом пользуются и редакторы, и журналисты, и кто угодно. В общем, все, кто хочет понять, что такое современный русский язык. Могло, например, оказаться, что преподаватели проявят консервативность, но, наоборот, преподаватели, к нашей большой радости, оказались очень гибкой и мобильной частью научного сообщества.

РЖ: Возможно ли внедрение Корпуса в методологию преподавания русского языка?

В.П.: Конечно, это возможно, и это надо делать, но здесь нужно соблюдать известную осторожность: дело в том, что Корпус не является нормативным собранием текстов - здесь все, что бывает в живом, неприглаженном языке. Все-таки преподаватель должен что-то отбирать. Главное, что у него есть из чего выбирать теперь. Нужно как-то специально разрабатывать способы внедрения Корпуса в преподавание, и я надеюсь, что это будет сделано. Так сказать, наше дело - создать Корпус, а дальше... Так что при некоторой настройке Корпуса на преподавание я ожидаю большой эффективности и повышения качества преподавания русского языка.

РЖ: Насколько я знаю, в Италии обучение работе с корпусом уже внедрено повсеместно. А как у нас обстоит с этим дело?

В.П.: У нас это делается в каких-то передовых местах - студентам дают задания по Корпусу, например, на Отделении теоретической и прикладной лингвистики в МГУ есть даже курс "Корпусная лингвистика". Я думаю, что это будет распространяться. Да, кстати, Италия - один из лидеров корпусной лингвистики. В Европе я бы назвал всего несколько стран, где эти исследования достигли больших высот, - это Финляндия (не случайно у нас на конференции финское представительство очень важное), затем Великобритания, Чехия и Италия. В остальных странах корпуса тоже есть, но работа ведется, может быть, не так интенсивно.

РЖ: Как вы оцениваете перспективы развития корпусной лингвистики в России?

В.П.: Хочется верить, что перспективы большие. Корпус - это требование нового времени, это необходимость. Люди сейчас даже уже не рассуждают, нужен он или не нужен, все дело в том, как быстрее и эффективнее его внедрить. Так что лингвистика будущего - это лингвистика корпусов.

Участник конференции Арто Мустайоки, профессор русского языка Отделения славистики и балтистики Хельсинкского университета(Arto Mustajoki, SlavonicandBalticDepartment, UniversityofHelsinki).

"Русский журнал": Профессор Мустайоки, многие утверждают, что Национальный корпус в Финляндии - один из самых лучших в мире. Это действительно так?

Арто Мустайоки: Я бы так не сказал. Конечно, мы уже давно начали, наш Корпус существует уже больше десяти лет. Кроме того, у нас есть знаменитый Хельсинкский корпус (как ни странно, английского языка), который начали составлять в середине 80-х годов. К тому же у нас очень развито общее языкознание, довольно рано были сделаны программы для автоматического анализа текстов - это было в начале 90-х годов. Наши специалисты по компьютерной лингвистике выиграли конкурс английского издательства COLLINS, которое пригласило разные научные группы с предложением сделать как можно более быстрый и надежный способ анализа английского языка.

Но что касается современных корпусов, я бы не сказал, что у нас очень хорошая ситуация. Они есть, и ими можно пользоваться бесплатно, но интерфейс старомодный и по сравнению с Национальным русским корпусом, и по сравнению с коммерческой системой Интегрум. Наш Корпус был сделан для специалистов, а не для широкого круга пользователей, так что над этим вопросом у нас сейчас работают. Скоро Финляндия будет участвовать в крупном европейском проекте Clarin - это в рамках широкого европейского процесса - с целью поднять инфрастуктуру научных исследований. Цель этого проекта - унифицировать корпусы разных европейских языков и таким образом расширить их пользование.

РЖ: Какие есть достоинства и недостатки у русского Корпуса по сравнению с другими европейскими корпусами?

А.М.: Я, конечно, незнаком со всеми корпусами Европы, но в русском Корпусе есть удобный интерфейс и возможность искать по грамматическим параметрам, т.е. хорошо сделана сама система поиска. В нашей системе этого еще нет. То, что у вас, может быть, хуже, - это достаточно большое количество ошибок в самом материале и иногда непонятные решения в выборе грамматических параметров и отметок. Конечно, нельзя сказать, что их много, но больше чем желательно.

РЖ: В заключение - ваши впечатления от конференции и о перспективах развития корпусной лингвистики в России.

А.М.: В конференции был выбран очень интересный подход, так как главный акцент был сделан на использовании Корпуса в преподавании. Я думаю, что для преподавания родного языка Корпус весьма полезен. Конечно, для иностранных студентов тоже, но для них нужен уже определенный уровень владения языком, чтобы использовать Корпус, потому что ведь это же естественный язык, который первокурсники не могут воспринять. У нас есть большой опыт использования корпусов при написании дипломных работ, мы используем как Национальный корпус, так и Интегрум. Вообще, использование корпусов дает очень большое преимущество при изучении конкретных языковых явлений. Это как в физике - с новым аппаратом ты можешь сделать такие вещи, которые другие просто еще не успели сделать. Корпус иногда дает такие возможности, о которых ты до этого даже не думал.

Заместителю председателя Оргкомитета РАН по проведению Года русского языка вице-президенту РАН, академику А.Д. Некипелову от участников Международной конференции "Национальный корпус русского языка и проблемы гуманитарного образования"

( Высшая школа экономики, 19-20 апреля 2007, Москва)

Глубокоуважаемый Александр Дмитриевич!

Участники международной конференции "Национальный корпус русского языка и проблемы гуманитарного образования", преподаватели русского языка в российских и зарубежных университетах, хотели бы выразить благодарность за ту поддержку, которую Российская академия наук оказывала проекту по созданию Национального корпуса русского языка. Этот недавно открывшийся электронный ресурс внес огромные изменения в нашу профессиональную деятельность. Мы получили свободный доступ к богатому и разнообразному собранию русских текстов (более 140 млн. слов), дающему возможность глубокого изучения лексических и грамматических явлений современного русского языка.

На конференции каждый из нас делился своим опытом использования корпуса для научной работы или для преподавания русского языка. Мы убедились, что число задач, которые можно быстрее и эффективнее решать с помощью корпуса, очень велико - оно даже существенно выше, чем первоначально предполагали его составители. Это, в частности, открывает путь и к созданию новых учебных пособий, лучше отражающих современные языковые реалии. Данный аспект особенно важен для преподавателей русского языка как иностранного.

Сегодня, в год русского языка, можно с уверенностью сказать, что Российская академия наук создала в гуманитарной сфере продукт, который имеет чрезвычайно важное практическое значение для всех людей. Мы пришли к выводу, что стихийно Национальный корпус русского языка стал подлинным национальным проектом. И мы просим Вас и Президиум РАН оказывать всемерную поддержку этому начинанию, осуществляемому специалистами разных институтов Академии - ВИНИТИ, ИЛИ, ИППИ - при общем руководстве Института русского языка им. В.В.Виноградова РАН.

       
Print version Распечатать