Лингвистические аспекты МИНОА (русский язык, национальное сознание, проблемы поиска информации)

Хочу поделиться своими наблюдениями за тем, как влияет на эффективность изыскания информации (первый этап алгоритма МИНОА) язык запросов. Только не пугайтесь: речь пойдет не о специфическом синтаксисе Google или Yandex, а о самом заурядном — языке нашего общения.

Разумеется, проблема гораздо глубже  простых алгоритмов запросов, создаваемых на том или ином языке. Язык формирует наше мышление и — как следствие — и саму логику запросов, которые мы формулируем на подсознательном уровне весьма специфическим образом (потому как думаем с национальным своеобразием). Тем не менее, гибкость (либо ограниченность) языка на формальном уровне является  уже сама по себе важным фактором, способным облегчить либо затруднить поиск информации.

Семь лет назад в одной из «Голубятен» я попытался объяснить зашкаливающую агрессию общения, универсально проявленную в русскоязычном сегменте Интернете, своеобразием русского языка (его высоко флективной природой и синонимичностью, в первую очередь), который, одновременно, оказывает еще и существенное влияние на качество изыскательной работы в поисковых системах. Предлагаю всем интересующимся алгоритмами МИНОА освежить в памяти этот текст, поскольку его ключевые положения я планирую задействовать для дальнейшего развития и углубления темы.

Флексия и злость

«Dieu qui voit tout, regarde-nous, regardez-vous
Dans nos maisons coule un poison qui a un nom
La haine, la haine…»
Lady Capulet, Romeo et Juliette (Gérard Presgurvic)

Больше всего меня печалит непонимание тоталитарного стиля «Голубятен». Похоже, без дополнительных объяснений мне не удастся добиться адекватного восприятия колонки, которую огромная армия гоблинов ненавидит и все же продолжает читать подобно тому, как две трети населения страны, ненавидя,  безотрывно смотрит «Дом 2».

На самом деле напускная безапелляционность «Голубятен» – лишь способ преодолеть чудовищную энтропию Рунета, в котором давно уже потребность СКАЗАТЬ ПРОТИВ является смыслом всей виртуальной жизни! Из-за этой энтропии стало невозможно работать: невозможно ничего найти, невозможно докопаться до объективно осмысленной информации, ибо вместо спокойного изложения фактов, как это принято на любом домене кроме RU, мы натыкаемся на дурное размывание темы, на тотальную анархию мнений, на истерический визг и рев. Стоит кому-то заявить на форуме, что, дескать, «Программа XYZ — самая удобная для выполнения конкретной задачи», как молниеносно со всех сторон проливается ушат дерьма в адрес: 1) программы XYZ; 2) автора; 3) его родственников; 4) его сексуальной ориентации; 5) его национальной принадлежности (причем плохо ВСЕ — от евреев (это само собой разумеется) до китайцев, японцев, американцев, индусов и еще 184 наций). Параллельно выдается на гора длиннейший список якобы альтернатив программе XYZ, каждая из которых НА ГОЛОВУ ее лучше,  а потому  — АМ/КГ  и не пойти бы всем в жопу!!!

Описанное поведение — центральный паттерн Рунета, его смысловой костяк, кредо, жизненная цель и основная форма самоутверждения для обитателей виртуального пространства. Причина? Их несколько. Первая лежит на поверхности: поведенческий паттерн Рунета отражает невроз реальной жизни, в которой 150 миллионов Genossen вместе с их детьми и внуками отымели по полной программе, лишили материальных активов, люмпенизировали и превратили в невякающий хлам (это когда физики-ядерщики, не успевшие или поленившиеся слинять из этой клоаки в начале 90-ых, сегодня работают охранниками на автостоянках – недавно с одним таким познакомился и горько побеседовал).

Бунтовать в реальной жизни не получается из-за отсутствия пассионарных импульсов в крови, которые планомерно вытравили за 70 лет советской власти, поэтому самая энергичная часть нации перемещается в либеральное пространство Рунета, где можно относительно безопасно махать руками и яростно брызгать слюной. Отсюда и неслыханный, невиданный нигде в мире заряд ненависти и тотального негатива, который мы наблюдаем в блогосфере,  на ефрейторских форумах и  конференциях новостей.

Кроме социальной причины патологической энтропии Рунета есть и другая  — внутренняя структура русского языка, которая не позволяет формализовать общение. Именно эта причина, на мой взгляд, исполняет первую скрипку в деструктивной полифонии Рунета, поэтому остановлюсь на ней подробнее.

Русский язык идеально подходит для поэтического творчества в силу двух причин: бесконечной флексии и бесконечной синонимии. В поэзии, смысл которой, как известно, в передаче настроения и чувственного мира автора,  флексия и синонимия обеспечивают идеальную форму для самовыражения — флексия обогащает рифму, синонимия добавляет «тумана», то есть смазанности, нечеткости понятий и образов, что мгновенно повышает ее смысловую нагрузку и, тем самым, способствует росту художественного потенциала (цель поэзии! — круг замкнулся).

Одна незадача: флексия и синонимия мучительно диссонируют с современным информационным полем, которое сложилось в эпоху цифровой революции. Главная цель и задача этого поля — предельная формализация, которая позволяет ОДНОЗНАЧНО передавать мысли и идеи. Нагляднее всего это выражается в любой поверхностной поисковой работе, не говоря уж о серьезном дата-майнинге. Не вдаваясь в лишние детали, проиллюстрирую мысль на элементарном примере — поиске, скажем, на Google или Yandex. Оказывается, что поиск, выполняемый на русском языке, В РАЗЫ сложнее поиска на самом формализованном языке мира — английском.

Предположим, мне нужно найти информацию о некой программе и ее доступности для загрузки. Пишу в строке запроса «Program XYZ download» и через секунду получаю исчерпывающий список сайтов с линками на загрузку нужной мне программы. Без экивоков, вариаций и лишнего смыслового мусора. Теперь выполняю запрос на русском языке – «Программа XYZ загрузить» — и сразу же начинается блаженная катавасия с родным языком: «Загрузить?» А может – «Закачать?» А может – «Скачать?» А может – «Залить?».  И так далее до бесконечности практически с любым словом.

Если современные поисковые машины еще как-то справляются с языковыми флексиями (всеми этими программами, программулинами, программками и  прогами), то перед синонимией они отступают в полнейшем бессилии. В нашем примере помимо синонимического ряда слова «загрузить», если еще море вариантов для «программы»: софт, софтина, софтенция, «это чудо», «утилита», «шаревара» и т.п.

Да не покажется вам последний пример преувеличением! Если, скажем, я пытаюсь отыскать информацию о загрузке программы XYZ на форуме, блоге или конференции (тем паче бакунианской), то мне придется иметь дело именно с языковым вывертом типа «софтинки» и «этого чуда».

Что это означает на практике? То, что изыскание информации на русском языке занимает из-за флексий и синонимии в разы  больше времени, чем поиск на английском языке. Не подумайте только, что русский язык демонстрирует какое-то особое богатство на фоне языка английского. В последнем нет флексий, однако словарный запас в два раза превосходит русский: самый большой словарь русского языка насчитывает 140 тысяч слов, английского –  300 тысяч (http://www.oed.com). В чем тогда дело? В том, что английский язык выделил из себя самого некое формализованное семантическое ядро, которым и пользуется сегодня большая часть человечества. На Basic English не только общаются на форумах, но и разговаривают на улицах Лондона и Нью-Йорка.

Где же скрывается Extended English? В языковой истории, культуре и продуктах высокого литературного творчества – аккурат места, куда дети индиго носа не кажут. Попробуйте взять какую-нибудь хорошую книжку – скажем, Фолкнера, и почитать со знанием языка на уровне средней школы: сразу поймете, о чем речь: из 10 слов 8 неизвестных!

Формализованное семантическое ядро английского языка не только превратилось в универсальный инструмент международного общения, но и идеально вписалось в информационное поле цифровой революции. Однозначная выразительность English перевесила все недостатки, вызванные криптоорфографией (когда пишется одно, а читается совершенно другое) и неподъемной фонетикой (говорят, нагрузка на мышечно-челюстной аппарат в английском в несколько раз превышает нагрузку, создаваемую другими европейскими языками – посмотрите на мандибулы американцев и все поймете!).

Своеобразие русского языка, к сожалению, не только вызывает сложности при поиске информации, но и порождает невроз виртуального общения. Русский язык с его поэтической поливалентностью и расплывчатостью смыслов (значения слов меняются на 180 градусов не от контекста даже, а от простой интонации!) разрушает созидательность общения, способствует поведению, направленному на утверждение любой ценой собственной, отличной от остальных точки зрения. Не истина, а ее непременное опровержение, желательно еще и с параллельным опусканием оппонента в грязь — вот главный импульс современного русского языкового сознания, впавшего в истерию от невозможности интегрироваться в информационно цифровую цивилизацию.

Где выход? Уничтожить флексию и синонимию невозможно, ибо это означало бы уничтожить сам великий и уникальный русский язык. Остается одно – бороться со смысловой поливалентностью. Например, как это происходит в «Голубятнях». Избегая диалогов, злоупотребляя суперлативами, раздавая жесткие оценки и делая безапелляционные заявления типа «Программа XYZ  — лучшая в мире» или «Британская империя — самое страшное зло в истории человечества», я, будучи еще в здравом уме, не преследую цели навязать читателям личные стереотипы. Я утверждаю альтернативную форму мышления, которая хоть как-то противостоит смысловой энтропии и анархии, царящей в современном русском языковом поле (у этой энтропии кроме языка, как я уже говорил, есть и очевидные общественно-политические корни).

Смысл ригоризма «Голубятен» — не «выпячивание собственного мнения впереди планеты всей», как бредится недалеким гоблинами, а утверждение парадигмы мышления, которая в упрощенном виде сводится к тому, что однозначное мнение, высказывание, утверждение, пусть даже сто раз ошибочное, НА ПОРЯДОК продуктивнее и конструктивнее воинственного столкновения сотен полифоничных голосов, учиняющий интеллектуальный и эмоциональный раздрай в социальной группе (любого уровня: от интернет-форума до всей национальной общности).

Нет ли здесь противоречия: с помощью однозначного мнения человек пытается расправиться со средой, в которой каждый делает ставку на собственное же однозначное мнение?! Тут-то мы и подходим к главному: в контексте т.н. информационного либерализма противоречие безусловно есть. Зато его нет в контексте информационного тоталитаризма! «Голубятни» сражаются с болезненной полифонией, злоупотребляя дополнительным весом, который получает текст, опубликованный на живой бумаге. Приведет ли это к какому-то результату? Конечно не приведет! К чему тогда все потуги? Да ни к чему! «Голубятня» — это форма художественной жизни, а не целеполагание!