– это понимание ключевого слова как важного элемента культуры. В фокусе внимания исследователей оказываются слова, которые описывают характерные для данной культуры понятия и ценности; специфика семантики таких слов часто вызывает трудности при переводе [Вежбицкая, 2001]. Глобальная цель таких исследований – с помощью лингвистического анализа описать языковую картину мира.
Второй вариант трактовки понятия ключевого слова связан не с возможностью обозначения им специфического понятия, характерного для определенной культуры, а с ролью отдельных слов в понимании конкретного текста. Например, в тексте научной статьи ключевые слова играют роль метаданных, которые в самом общем виде представляют тематику исследования [Кретов, 2012; Кашкин, Шилихина, 2014].
В сфере автоматической обработки естественного языка трактовку понятия ключевого слова можно считать «гибридной»: ключевые слова рассматриваются и как инструмент понимания текста, и как способ выражения определенных идей.
В рамках данного исследования были выявлены ключевые слова в речах Дональда Трампа и Хиллари Клинтон. Получение списков ключевых слов проводилось по следующему алгоритму: при сопоставлении двух массивов текстов выделялись статистически значимые слова в Корпусе-1, при этом Корпус-2 использовался в качестве справочного. Затем был составлен список ключевых слов для Корпуса-2, при этом в качестве справочного использовался Корпус-1. Инструментом статистической оценки, на основе которой были выделены слова, встречаемость которых в речи одного политика выше, чем в речи другого, стала функция логарифмического правдоподобия. Данные о первых 30 ключевых словах представлены в таблице 7.
Таблица 7
Ключевые слова в речах Д. Трампа и Х. Клинтон
Результат, представленный в таблице, позволяет увидеть, какие ценности и идеи являются для двух политиков приоритетными: для Хиллари Клинтон это семья и дети, молодежь, взаимоотношения рядовых граждан с полицией. Кроме того, в число ключевых попали слова, выражающие уверенность в собственной правоте, в будущем. Для Трампа важными являются темы коррупции, иммиграции, противостояния администрации Барака Обамы.
Более детальный анализ первых 100 ключевых слов позволяет увидеть тенденции в выборе способа воздействия на аудиторию. Обращает на себя внимание обилие прилагательных с отрицательной коннотацией: illegal (нелегальный), bad (плохой), disaster (катастрофа), corruption (коррупция), corrupt (коррумпированный), horrible (ужасный), radical (радикальный), crime (преступление), depleted (истощенный), nothing (ничего).
Х. Клинтон пользовалась противоположной стратегией: в отличие от своего оппонента она использовала лексику, в семантике которой преобладает положительная оценка: together (вместе), young (молодой), sure (уверенный), clear (ясный, понятный), stronger (сильнее), trust (доверие), faith (вера), progress (прогресс), hope (надежда), affordable (доступный), opportunity (возможность), health (здоровье), investments (инвестиции), best (лучший), fairer (более справедливый).
Подводя итоги, отметим многообразие вариантов применения методов корпусной лингвистики для