Sketch engine что это
Языковые открытия своими руками: корпусы в изучении языка
Рецензия на учебник Дж. Томаса «Изучаем английский язык со Sketch Engine: корпусный подход к исследованию языка»*
Куниловская Мария Анатольевна — Канд. филол. наук, доцент, доцент кафедры английской филологии и перевода, Тюменский государственный университет, Тюмень, Россия
Ковязина Марина Анатольевна — Канд. филол. наук, доцент кафедры английской филологии и перевода, Тюменский государственный университет, Тюмень, Россия
Новый поворот в теоретическом осмыслении языка, стремительное развитие лингвистических технологий, доступность значительных объемов текстовых данных в электронном формате повышают интерес к корпусным ресурсам со стороны всех специалистов в области языка: исследователей, лексикографов, терминологов, переводчиков, преподавателей. Это обусловливает востребованность знаний и умений, связанных с использованием корпусов: от постановки исследовательского вопроса, выбора корпуса и формирования поискового запроса до интерпретации извлеченной информации. Эффективность работы с реальными языковыми данными предполагает не только знакомство с функционалом имеющихся программ извлечения информации о языке и с доступными языковыми ресурсами, но и некоторый уровень лингвистических знаний в рамках неоферсианской парадигмы, постулирующей важность учета контекста, принципиальную взаимосвязь лексики и грамматики, конструкционный характер языка. Не секрет, что методика преподавания языков часто существенно отстает от актуального уровня научных знаний. Причиной этому является не только традиционная оторванность образования от науки, но и отсутствие дидактических материалов, нехватка теоретически обоснованных и хорошо описанных ноу-хау в этой области. В этом контексте появление комплексного и увлекательного учебника Джеймса Томаса по использованию системы онлайн-анализа корпусных данных Sketch Engine (https://www.sketchengine.co.uk/) представляется очень своевременным. Учебник представляет собой практическое введение в корпусную лингвистику, ориентированное прежде всего на преподавателей английского языка и методологически основанное на концепции использования реальных языковых данных в языковом образовании (data-driven learning [2; 4]).
Sketch Engine – это набор программных инструментов для обработки языковых корпусов, разработанный компанией Lexical Computing Ltd. Это совместный проект британского лексикографа, корпусного лингвиста Адама Килгарриффа и чешского программиста Павла Рыхли из Лаборатории обработки естественного языка факультета информатики Университета им. Масарика (г. Брно, Чехия). В 2004 г. эта поисковая система стала доступна как компьютерная программа для лингвистов, занимающихся корпусными исследованиями языка (на тот момент в системе были доступны только корпусы на трех языках – английском, чешском и ирландском) [3]. Особенно полезным этот программный комплекс стал для лексикографов: его используют такие издательства, как Cambridge University Press, Harper Collins, Macmillan, Oxford University Press и др. [8, p. 15]. Сегодня Sketch Engine – это прежде всего интернет-ресурс, предлагающий (в рамках коммерческой лицензии) широкий набор инструментов корпусного анализа и большую коллекцию языковых ресурсов на более чем 85 языках мира, в том числе параллельных. Кроме того, в Sketch Engine предусмотрена возможность создания, разметки и эксплуатации собственных корпусов пользователя.
Одиннадцать лет спустя после запуска системы Sketch Engine вышло первое издание учебника «Изучаем английский язык со Sketch Engine: корпусный подход» (“Discovering English with Sketch Engine: A Corpus-Based Approach”), подготовленное Джеймсом Томасом, сотрудником Университета им. Масарика, где был разработан Sketch Engine. В 2016 г. вышло второе издание этого учебника [9], а также первое издание рабочей тетради «Изучаем английский язык со Sketch Engine. Рабочая тетрадь и глоссарий» (“Discovering English with Sketch Engine. Workbook and Glossary”) [10], обзор которых представлен в данной рецензии.
Пособие, адресованное преподавателям английского языка, студентам, лингвистам и переводчикам, в структурном плане организовано как руководство по освоению возможностей программного комплекса Sketch Engine и предоставляемых этой платформой корпусных ресурсов. За время своего существования система обрела широкий набор инструментов и функций. К основным относятся следующие [3; 4; 8].
1. Конкордансер (Concordance) осуществляет поиск в корпусе по словоформе, лемме, словосочетанию и морфосинтаксической метке в разных комбинациях на языке поисковых запросов (Corpus Query Language).
2. Инструмент построения частотных списков слов, лемм, n-грамм, ключевых слов (Word List).
3. Инструмент извлечения ключевых слов и терминологии на базе корпуса (Keywords and Terms).
4. Инструмент вычисления коллокаций на базе нескольких статистических мер сочетаемости (T-score, MI, log likelihood, logDice и др.) (Collocations).
5. Инструмент построения коллокационных профилей (скетчей) на базе пользовательской скетч-грамматики (Word Sketch).
6. Дистрибутивный тезаурус (Thesaurus).
7. Сравнение коллокационных профилей для двух лексических единиц (Word Sketch Differences).
8. Инструмент, позволяющий проводить диахронический анализ лексики (Trends).
9. Программа для создания собственных корпусов из текстов в интернете (WebBootCaT).
Рецензируемый учебник – прекрасный пример использования лингвистически обоснованного подхода к изучению языка. В содержательном плане книга представляет собой взаимосвязанный комплекс исследовательских задач, позволяющих читателю освоить методику корпусного анализа языка и развить теоретические представления о языке. Описывая очередную задачу, автор вводит необходимые понятия (напр., grammatization, word family, binominal, lexicogrammar, Idiom Principle, troponym, FASI, colligation, template, connotation, lemma, node, part-of-speech tagging, association measures like (log)Dice and MI, metacognitive strategies и др.), которые, как видно из примеров, не только относятся к области корпусной лингвистики, но охватывают широкий круг направлений современной лингвистической теории. Кроме того, автор дает удачные научно-популярные и образные интерпретации для ряда теоретических положений, подкрепляя их емкими цитатами и ссылками на авторитетную и современную лингвистическую литературу, а также на полезные лингвистические ресурсы (напр., Patrick Hank’s Pattern Dictionary of English Verbs (http://pdev.org.uk/)), которые призваны расширять лингвистические и языковые знания, стимулировать исследовательский интерес читателя и формировать способность задавать теоретически обоснованные вопросы, самостоятельно генерировать знания о языке. Все использованные в учебнике термины разъясняются в глоссарии, входящем в состав второй книги издания.
Учебник отличается выраженным авторским подходом к изложению материала, высокой степенью интерактивности, наличием элементов языковой игры. Главы и разделы издания организованы не только логично, но и оригинально, автор использует интересные отсылки к внеязыковой действительности, энциклопедическим знаниям и литературным произведениям, ассоциативно связанным с содержанием той или иной главы. Все это способствует вовлечению читателя в предлагаемые виды деятельности и делает учебник Дж. Томаса по-настоящему увлекательным и эффективным.
Как отмечалось выше, учебник в полной мере реализует принципы использования реальных языковых данных в процессе обучения языку (data-driven learning). Идеология этого подхода, противопоставленного традиционной технологии «передачи готовых знаний», состоит в предоставлении учащимся возможности самостоятельно извлекать знания о языке, отвечающие индивидуальным познавательным потребностям. Дж. Томас справедливо указывает, что в области языкового образования корпусные технологии сегодня неоправдано недооценены. По данным Британского совета, в мире насчитывается более 15 млн преподавателей английского языка, однако, как отмечает автор, многие никогда не слышали о корпусах и не понимают, как их можно использовать в процессе изучения и преподавания языка. При этом существуют все условия для применения корпусов как педагогами, так и обучающимися: доступ к компьютерам с выходом в сеть, интерактивные доски в школах и университетах, открытые корпусы, работающие как онлайн, так и оффлайн [10, p. 17–19]. По нашим наблюдениям, это верно и для ситуации в России.
В своем учебнике Дж. Томас создает контекст для развития мета-когнитивной способности учиться, включающей умение правильно ставить вопросы, подбирать адекватный языковой материал, обдумывать полученные результаты и делать выводы. Читателю предлагается теоретически мотивированный вопрос, описание процедуры извлечения необходимых данных и нюансов построения запроса, советы по использованию корпусных ресурсов для каждой задачи, но не ответы. Важно, что в ряде случаев автор подсказывает читателю возможные способы качественной интерпретации количественных результатов поиска, обращает внимание на возможности их сортировки и фильтрации, что позволяет получить наглядные и убедительные свидетельства в пользу или против выдвинутой гипотезы. Подчеркнем, что большинство заданий сформулированы таким образом, что они не могут не вызвать живого интереса и исследовательского азарта, а ответы на них имеют значительный «вау-фактор», повышающий мотивацию продолжать поиски.
Автор убедительно демонстрирует важность компетенций в области корпусных технологий для изучающих иностранный язык. Обращение к реальным языковым данным помогает обнаружить закономерности использования языка в конкретной языковой ситуации, которые не могут (в силу их бесконечного разнообразия) быть описаны в грамматиках, словарях и традиционных учебниках, но делают речь живой и идиоматичной, развивает языковую интуицию учащегося, формирует представление о вариативности и изменчивости языка и обусловленности языкового выбора контекстом ситуации и культуры (напр., автор учебника показывает, что I was sat watching TV является типичным шаблоном для британского английского (p. 109), а drink oneself beautiful – скорее креативная эксплуатация соответствующей синтаксической модели (p. 155), поскольку one swallow does not a summer make (p. 28)). Умение отделить наиболее вероятное и частотное от креативного и единичного представляется одним из важных корпусных умений, позволяющих критически оценивать полученные результаты. Учебник демистифицирует корпусный анализ как средство обучения языку и показывает, что программное обеспечение – это инструмент сродни микроскопу, который позволяет получить знание о мире, недоступное без него. Безусловно, овладение этим инструментом требует приложения определенных усилий, которые, впрочем, сравнимы с усилиями по освоению современных смартфонов или интеллектуальных ТВ-систем.
Относительно некоторых языковых структур автор предлагает целую систему исследовательских вопросов, которые могут быть использованы как задания для лабораторных или курсовых работ (см. напр., серию заданий по изучению словосочетаний с десемантизированными глаголами типа to give a smile (p. 111–113)) либо как план занятия по освоению соответствующего языкового материала.
Существенным дополнением к первому изданию учебника стали рабочая тетрадь и глоссарий. В рабочей тетради воспроизведены все 354 вопроса-задания из учебника и выделено место для кратких ответов на них. Кроме того, по каждой главе сформулированы вопросы для дальнейшего исследования и обсуждения в классе, а также тестовые вопросы, касающиеся как обсуждаемых в главе лингвистических понятий, так и исследуемых языковых явлений и данных. Часть этих вопросов вынесена на специальные страницы, предназначенные для копирования, и может использоваться для работы в парах и организации обсуждения в классе. Характер вопросов позволяет установить важные связи между лингвистикой, корпусной лингвистикой и прикладными задачами, прежде всего в области языкового образования, но также и перевода, терминоведения и лексикографии. Способ представления терминов в глоссарии следует общей «человекоориентированной» идеологии учебника: формулировки лишены традиционного формализма и функциональны.
Несмотря на то что все задания в книге предусматривают использование англоязычных корпусов в системе Sketch Engine, причем часть из них, как и часть иллюстраций, вынесенных в постраничные сноски, доступна только обладателям коммерческой лицензии, описанные подходы, идеи и способы корпусного анализа могут быть легко адаптированы к другим корпусным менеджерам и ресурсам. Самый очевидный вариант использования этих знаний вне Sketch Engine – эксплуатация сравнимых интернет корпусов семейства Aranea [1], свободный доступ к которым организован на основе свободного программного комплекса NoSketch Engine [6] на сайте Университета им. Коменского (г. Братислава, Словакия; http://unesco.uniba.sk/aranea_about). В настоящее время семейство включает корпусы на 17 языках мира, которые созданы на основе одного и того же набора процедур сбора текстов в сети, их обработки и разметки, что обеспечивает сравнимость содержащихся в корпусах языковых данных. Свободно доступны все корпусы типа Minus (объемом 100 млн токенов); доступ к миллиардным корпусам (Maius) осуществляется после бесплатной регистрации, а для русского языка есть версия размером в 13,7 млрд токенов. Платформа NoSketch Engine поддерживает значительную часть функционала Sketch Engine, описанную в рецензируемой книге в главах 1–10 и 13.
Таким образом, учебник Дж. Томаса – это увлекательное введение в корпусный анализ языка, представляющее собой набор лингвистических и языковых задач, предполагающих активную и во многом автономную деятельность учащихся по поиску решений. Его основная ценность не столько в приобретении технических компетенций, сколько в развитии лингвистических представлений, важных для эффективного освоения иностранного языка. Большое внимание в книге уделяется развитию способности учиться (learning to learn), что повышает мотивированность и независимость учащихся, предоставляет в их распоряжение ресурсы и способы совершенствования языковых знаний, которые можно использовать на протяжении всей жизни. В этом автор следует постулату основателя теории когнитивного развития швейцарского философа и психолога Жана Пиаже о том, что именно в процессе самообучения новое знание познается лучше всего [9, p. 98]. Осваивая возможности системы Sketch Engine и погружаясь в процесс лингвистического исследования, пользователь пособия открывает для себя английский язык (именно это отражено в названии учебника).
* Работа выполнена в рамках проекта No. 17-06-00107\18, поддержанного РФФИ, протокол 5(202) от 14.03.2018 г.
1. Benko V. Aranea: Yet Another Family of (Comparable) WebCorpora // Text, Speech and Dialogue. 17 th International Conference, TSD 2014, Brno, Czech Republic, September 8–12, 2014. Proceedings. LNCS 8655. Springer International Publishing Switzerland, 2014. P. 257–264.
2. Boulton A. Data-Driven Learning: Taking the Computer out of the Equation // Language Learning. 2010. 3. V. 60. P. 534–572.
3. Finding Terms in Corpora for Many Languages with the Sketch Engine / A. Kilgarriff, M. Jakubíček, V. Kovář, P. Rychlý, V. Suchomel // Proceedings of the Demonstrations at the 14 th Conference the European Chapter of the Association for Computational Linguistics. Sweden, April 2014. P. 53–56. URL: https://www.sketchengine.co.uk/wp-content/uploads/Finding_Terms_2014.pdf.
4. Herman O., Kovář V. Methods for Detection of Word Usage over Time // VII Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2013. Brno: Tribun EU, 2013. P. 79–85.
5. Johns T. Should You Be Persuaded: Two Samples of Data-Driven Learning Materials // English Language Research Journal, 4, 1991. P. 1–16.
6. Rychlý P. M. Bonito – A Modular Corpus Manager. In 1 st Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Masaryk University, 2007. P. 65–70.
7. The Sketch Engine / A. Kilgarriff, P. Rychlý, P. Smrž, D. Tugwell // Proceedings of the XI EURALEX International Congress. Lorient: Universite de Bretagne-Sud, 2004. P. 105–116. URL: https://www.sketchengine.co.uk/wp-content/uploads/The_Sketch_Engine_2004.pdf.
8. The Sketch Engine: Ten Years On / A. Kilgarriff, V. Baisa, J. Bušta, M. Jakubíček, V. Kovář, J. Michelfeit, P. Rychlý, V. Suchomel // Lexicography ASIALEX. 2014. V. 1. P. 7–36. URL: http://link.springer.com/article/10.1007/s40607-014-0009-9.
9. Thomas J. Discovering English with Sketch Engine: A Corpus-Based Approach to Language Exploration. 2 nd ed. Versatile, 2016.
10. Thomas J. Discovering English with Sketch Engine: Workbook and Glossary. Versatile, 2016.
Sketch engine что это
Sketch Engine is the ultimate tool to explore how language works. Its algorithms analyze authentic texts of billions of words (text corpora) to identify instantly what is typical in language and what is rare, unusual or emerging usage. It is also designed for text analysis or text mining applications.
Sketch Engine is used by linguists, lexicographers, translators, students and teachers. It is a first choice solution for publishers, universities, translation agencies and national language institutes throughout the world.
Sketch Engine contains 500 ready-to-use corpora in 90+ languages, each having a size of up to 60 billion words to provide a truly representative sample of language.
Linguists and Lexicographers
Sketch Engine processes texts of billions of words and, within seconds, finds instances of the word, phrase or phenomenon and presents the results in the form of Word Sketches, concordances or word lists.
Translators
Aligned parallel corpora are a source of translation suggestions as produced by real translators. Word Sketches help identify idiomatically correct word combinations and help use words like native speakers do.
Terminologists
Sketch Engine’s next generation term extraction and bilingual term extraction combine statistics and linguistic analysis to yield unprecedented quality. Extracted terms require very little manual cleaning or post-processing, if any at all.
Text analysis
Perform co-occurrence analysis, term extraction or generate frequency lists which take advantage of morphological analysis and part-of-speech tagging.
Product naming
Get ideas for product names and check the feelings and ideas they invoke. Check how such words are used by your competitors.
Teachers and Students
Word Sketch and concordance are the ideal tools to quickly understand how a word or phrase is used in context. Or try SkELL!
Historians
Time annotation in diachronic corpora together with Sketch Engine’s trends feature detects neologisms and trending words in seconds.
Corpora
Language corpora, multi-billion word collections of texts, provide source data for all features of Sketch Engine. Our corpora are tagged and annotated to be ready for complex searches of phrases and language structures. Parallel and multilingual corpora are also available.
Features
Word Sketch ∎ Word Sketch difference ∎ Bilingual Word Sketch ∎ Word lists ∎ Thesaurus ∎ Term extraction ∎ Concordancer ∎ Trends ∎ Corpus Architect ∎ n-grams ∎ CQL ∎ WebBootCaT ∎ CAT integration ∎ Tick Box Lexicography
Languages and scripts
Sketch Engine currently works with more than 90 languages and over 30 writing systems (Latin, Cyrillic, Chinese, Thai…) including RTL scripts such as Arabic.
If you have a professional interest in words and meaning – as a teacher, a student, a language engineer, or a linguistic theorist – you need Sketch Engine. This is because words in isolation are hopelessly ambiguous. Only in context do words have a clear meaning. The genius of Sketch Engine is that it shows how prototypical collocations affect meaning. For example, “blowing up a bridge” has a quite different meaning from “blowing up a balloon”.
Even more different are “blowing your nose” and “blowing a whistle”. Similar examples could be cited in many other languages. In my work on verb patterns and lexical semantics, meanings are arranged in patterns around prototypical collocations. I could not do this work without Sketch Engine.
Why should translators bother with corpora, when there are so many other resources and technologies available? Well, corpora can help us address questions that are not covered in dictionaries, termbases, translation memories, the Wikipedia, Google, Linguee, translators’ forums, and so on. The beauty of Sketch Engine is that with one single tool you can look up answers to all sorts of questions in many different languages. In the same way as CAT tools are like an enhanced text editor that has been adapted to the needs of translators, think of Sketch Engine as a kind of tweaked search engine that has been customized for linguistic analysis, helping you get unprecedented access to how language is really used.
When I speak to other people about Sketch Engine, they are impressed by how easy Sketch Engine is to use. Much easier than they had feared. One presentation, a demo and a supervised exercise is all I have ever done and yet the participants rarely needed my support after the session.
Sketch Engine и Маяковский. Часть I: человек до и после революции
Системный Блокъ уже рассказывал, как провести собственное корпусное исследование при помощи antconc и mystem. Теперь мы обратимся к другому инструменту — корпусному менеджеру Sketch Engine и с его помощью проанализируем корпус текстов Владимира Маяковского.
Что такое Sketch Engine?
Sketch Engine — инструмент для корпусных исследований, таких, которые выполняются на материале корпусов, больших электронных коллекций текстов. Sketch Engine может быть полезен не только исследователям-лингвистам и филологам, но и лексикографам, переводчикам и тем, кто изучает и преподает язык.
Почему такое название — «скетч»? Скетч — это быстрый набросок, пробная версия рисунка. Очень простой и незавершенный, скетч, тем не менее, передает общий замысел рисунка: мы уже понимаем, что хочет изобразить художник. Так и Sketch Engine позволяет создать «скетч», набросок, образ отдельного слова, текста или даже целого корпуса. С его помощью мы можем например, понять, в каких контекстах встречается интересующее нас слово, какие у интересующего нас текста или корпуса ключевые слова, а затем уже интерпретировать и использовать полученные результаты.
Интерфейс Sketch Engine дает возможность работать с 520 корпусами 95 языков или создавать собственные корпуса. Для работы понадобится только браузер, Sketch Engine — онлайн-проект.
Sketch Engine — коммерческий проект, но у него есть пробная бесплатная подписка, которая действует 30 дней (и ей несложно воспользоваться несколько раз — достаточно зарегистрироваться на новую почту). В бесплатной подписке доступны только 250 загруженных корпусов, а объем пользовательского корпуса ограничен миллионом слов. Для работы с собственным корпусом можно скачать полностью бесплатный инструмент NoSketchEngine (понадобятся навыки программирования), а корпуса некоторых языков находятся в свободном доступе, но функционал бесплатных сервисов ограничен.
Чтобы создать свой корпус и работать с ним, мы воспользовались бесплатной онлайн-версией проекта. Тексты Владимира Маяковского мы скачали из поэтического подкорпуса НКРЯ.
После того как мы зарегистрировали пробный аккаунт, появилась рабочая область, где нам предлагается выбрать для работы уже существующий корпус или создать свой. Чтобы создать свой корпус, нужно выбрать вкладку «My corpora» и нажать «New corpus».
Немного информации о корпусе, который у нас получился:
Он поэт — этим и интересен
Маяковский — одна из ярчайших фигур Серебряного века. В советских учебниках литературы писали, что он один из первых поэтов начала ХХ века, который «отдал свой могучий талант революционному обновлению жизни, начатому Великим Октябрем». Сегодня исследователи его творчества делятся на два лагеря: одни утверждают, что Маяковский — прежде всего поэт-агитатор, другие видят в нём лирика-одиночку.
Многие маяковеды разделяют творчество Маяковского на «до» и «после» Октябрьской Революции, объясняя это тем, что после прихода к власти большевиков он стал «официальным» поэтом, а задача его творчества кардинально изменилась: теперь он не оппозиционный и опасный агитатор, пагубно влияющий на сознание масс, а поэт нового строя, который должен его «продвигать».
Два образа, довольно конфликтные между собой, как-то уживаются в Маяковском. Поэт-шестидесятник Евгений Евтушенко назвал это феноменом «огромности и беззащитности».
А мы попробуем при помощи Sketch Engine провести собственное «расследование», чтобы выяснить, какой был лирический герой Маяковского — главный ключ к пониманию поэзии любого автора, и какой лирический герой чаще появляется в творчестве Маяковского: поэт-агитатор на пароходе современности или отвергнутый и непонятый всеми романтик, каким автор предстает перед нами в своей любовной лирике.
Человек Маяковского
Вот так выглядит меню функций Sketch Engine:
Инструменты Sketch Engine
Воспользуемся инструментом «Word Sketch». Он ищет слова и словосочетания, которые задает пользователь, оценивает частоту их появления и показывает, в каких контекстах встречаются заданные пользователем слова в корпусе. Например, мы хотим узнать, как меняется образ человека в стихотворениях Маяковского: задаем лемму «Человек» и запускаем программу для подкорпуса «До революции». Аналогично поступаем с подкорпусом «После революции».
Перед нами результаты частотного анализа слова «человек» в поэзии Маяковского. Контекстные слова делятся на группы в зависимости от типа связи с указанным словом: в первой колонке глаголы, для которых слово «человек» — субъект действия, во второй — прилагательные и т.д.
Следующим этапом мы их должны интерпретировать. Выберем для этого первую колонку «subject_of». Что делает человек в стихах Маяковского, написанных до революции? Ничего особенного: он рождается, растет, ждет чего-то, дичает и в итоге исчезает. А вот после революции он деятелен и полон энергии: ходит, ездит, прыгает, готов ринуться куда-то… в общем, живет полной жизнью. Это же можно подтвердить инструментом «Word Sketch Difference» для «Subcorpora»: в режиме «Subcorpora» он предназначен для сравнивания одной и той же леммы в разных подкорпусах. Мы сравнили, в каких контекстах встречается слово «Человек», и получили такую визуализацию:
Если мы предположим, что главным героем поэзии Маяковского был простой рабочий, представитель пролетариата — основной движущей силы революции, то такие перемены могли быть связаны с изменением социального положения героя, установлением новой власти и радужными перспективами социализма. Стоит также принять во внимание, что первые послереволюционные годы Маяковский активно работал в «окнах сатиры РОСТА», по факту исполняя госзаказ.
Но образ человека не исчерпывается действиями.
Воспользуемся инструментом «Concordance» (конкорданс): он позволяет увидеть расширенный контекст слова «Человек», то есть, не просто сочетания слов, а целые предложения, в которых встречается указанное слово. При анализе полученных данных увидим, что до 1917 года в творчестве Маяковского много восклицаний, побудительных предложений, есть призыв к действию («Эй, человек, землю саму зови на вальс!» или «Люди, слушайте, вылезьте из оков!»), а вот после 1917 года предложения утвердительные, в них прославляется человек, его всесилие и могущество («миром правит сам человек», «Человеку — сажень», «Люди двигают горами» или «Люди летают по небесам»).
Казалось бы, еще одно подтверждение в пользу теории о Маяковском как исключительно поэте, славящем новое государство и новых людей, но есть одна небольшая деталь. Почему так мало призыва брать новые высоты в послереволюционном периоде творчества Маяковского? Неужели всего достигли и не к чему больше стремиться? А как же светлое коммунистическое будущее, достичь которого можно только упорным трудом, в том числе, и над собой?
После революции, что наглядно показывает нам «Concordance», в творчестве Маяковского очень часто встречается образ «искусственных людей»: «Этими — и добрыми, и кобры лютей, Союз до краев загружен». Они — порождение бюрократической системы, которая рождается вместе с молодым Советским государством, хоть и совершенно противоречит его идее. А Маяковский сам в «Стихах о советском паспорте» говорил, что «волком бы выгрыз бюрократизм», но, увы, бюрократия, мещанство, «квартирный вопрос», как называл его Булгаков, «обывательщина» и слепая вера партийным лидерам убивают живую душу человека, он перестает быть личностью, шагая строевым шагом с тысячами и миллионами таких же, как и он. Отсюда, вероятно, и иронические нотки в поздней поэзии Маяковского, и его обличительные высказывания в адрес безвольных обывателей, и мотив одиночества в толпе, который усиливается год от года.
Советская Россия на деле совершенно не отвечала заявленному в теории. Благодаря «Word Sketch» мы выяснили, что человек у Маяковского, хоть и стал деятельным после Революции, но стал не личностью, а винтиком в системе. Виной всему бюрократия, которая возникла в государстве, которое изначально должно было быть основано на всеобщем равенстве и принципах справедливости.
Еще в последние годы жизни Ленина бюрократия охватила сначала верхушку партии в борьбе за сферы влияния и быстро спустилась вниз по партийной вертикали. Маяковский был одним из немногих, кто всем сердцем и душой болел за идею сделать положение рабочего народа лучше, и такой исход событий не мог его удовлетворять, а даже мог доводить до отчаяния от осознания собственной беспомощности неспособности повлиять на ситуацию.
Результаты выдачи Word Sketch и Concordance (и всех других функций Sketch Engine) можно скачать в форматах CSV, XLS, XML и PDF. Для этого нужно нажать на стрелочку в правом верхнем углу рабочей панели:
На этом возможности Sketch Engine не заканчиваются. О них и том, что же говорит поэт о Советском государстве и России в целом, читайте во второй части нашей статьи!