Выбор редакции

О возможных стратегиях развития Digital Humanities

Статья Гавриила Беляка

Пандемия приблизила наше будущее: цифровая коммуникация в виртуальном пространстве стала важной как никогда. Приблизилось и будущее гуманитарной науки: ведь если производство технологий — дело цивилизации, то поиск нетривиальных путей применения этих технологий — задача культуры.

Более века назад, на рубеже подобного же цивилизационного сдвига, Ницше в очерке «О пользе и вреде истории для жизни» писал о трех различных типах отношений хранителей культуры к судьбе вверенного им сокровища: монументальном, критическом и антикварном. Для представителей научного сообщества, чей взгляд обращен в прошлое, которому принадлежит их предмет, предпочтительной оказывается стратегия консервации, характерная для того типа отношений с прошлым, который Ницше определял как антикварный [Ницше 2014].

Однако такой подход способен продлить жизнь хранимой нами культуры не более, чем на длину нашей собственной жизни. Новое поколение, говорящее на другом языке, не усвоившее наши уроки и ценности, благополучно предаст забвению язык уходящей эпохи. Если это произойдет, вина ляжет не на наших потомков, а на нас самих, не решивших труднейшей задачи — задачи перевода.

***

Оппозиция гуманитарных и точных наук, существующая, конечно, не столько на уровне философии науки, сколько в общественном сознании, на протяжении всего ХХ века определяла развитие фундаментального образования и науки. На судьбе отечественных гуманитарных наук особенно тяжелый отпечаток оставила советская идеология. Но не стоит думать, что идеология научно-технического прогресса оказала на них меньшее влияние.

Начиная с конца XIX века индустриальная революция выдвинула на передний план прикладные, точные и естественные науки. Тогда же сложилось привычное нам сегодня противопоставление гуманитарных и точных наук1. В философии ХХ века противостояние позитивизма и метафизики продолжалось, и для всякого ученого, знакомого с проблемами эпистемологии научного познания, ограниченность узко позитивистского подхода всегда была очевидна. Тем не менее на уровне массового сознания именно позитивистские критерии стали неотъемлемыми чертами научного дискурса. Тот факт, что парадигмальная наука, которая эти критерии научности породила, в лице своих основателей Ньютона и Декарта опирается на религиозную метафизику и вслед за ними до сих пор спокойно оперирует терминами Аристотеля, усвоенными через посредство средневековой христианской философии2, никак не подрывает в массовом сознании веры в силу примитивно понятого научного метода.

Отчасти ориентируясь на интеллектуальную моду, отчасти пытаясь подражать коллегам, занятым изучением материала, имеющего совершенно иную природу, гуманитарии, и в частности филологи, стали вырабатывать собственные методологические принципы и четко определять свой предмет. Отмежевавшееся от литературоведения языкознание достаточно быстро усвоило аппарат математической логики и продолжило развиваться в сторону структурной, а затем математической и компьютерной лингвистики (прикладные применения которой составляют основной источник финансирования современной науки о языке). Для литературоведения процесс адаптации к номенклатуре научного знания был много труднее.

В ходе этого процесса на разных этапах происходили и маргинализация герменевтических практик, и разворот в сторону комментирования и текстологии (как практик идеологически более безопасных и методологически безупречных), и возврат к проблемам метафизики и философии на волне интереса к междисциплинарным исследованиям и проблеме интертекста, и обратный откат интеллектуальной моды с возвращением к мелкой фактографии, социологии, антропологии как основным формам литературоведческого исследования. Все эти процессы должны стать и становятся предметом специального изучения3, однако не они являются основным предметом данной статьи. Важно лишь то, что именно в ситуа­ции перехода, в ситуации поиска своих методологических оснований, поиска удовлетворительной эпистемологии появляются и занимают сегодня свое место в системе гуманитарных наук Digital Humanities (далее DH)4.

Развитие культуры и цивилизации повторяет движение маятника: за этапом накопления новых цивилизационных технологий и механизмов неминуемо следует этап их освоения пространством культуры. Этот принцип часто называют законом техно-гуманитарного баланса [Назаретян 2004]. Сейчас наступает очередь гуманитарного знания возделывать новую цифровую реальность. И от нашей способности освоить, применить и, если угодно, подчинить новые технологии законам культуры зависит то, как эта культура будет выглядеть завтра.

***

На протяжении ХХ века основным продуктом академической гуманитарной науки были книжные издания. Именно вокруг структуры, задач и особенностей печатной книги сложились формы и практики литературоведческой науки.

Осознавая конец цивилизации Гутенберга, мы удовлетворились пониманием того, что книга еще долго не покинет нашу жизнь, пусть даже превратившись из главного источника информации в предмет интеллектуальной роскоши. Проблема принципиального устаревания книжного формата так и остается нерешенной. Для академической гуманитаристики это имеет самые разные последствия.

Наиболее очевидное из них связано с тем, что тиражи академических изданий, некогда измерявшиеся сотнями тысяч, сегодня могут быть равны 500, 200, 100 экземплярам. Это значит, что круг потенциальных читателей этих книг чуть больше круга их авторов. Но дело даже не в тиражах, а в природе символического капитала, который получают академические научные труды и издания. Если в эпоху индустриальной культуры он формировался для широкого читателя почти так же, как и для научного сообщества, то теперь наибольшим спросом будет пользоваться не многотомное комментированное собрание текстов автора, а первая ссылка в Google.

Индустриальный, гутенберговский тип формирования знания определялся принципами отбора и компетентностью ученого, производящего этот отбор, ограниченными возможностями хранения, а главное, представления и обработки больших данных. В современном цифровом пространстве сформировалась стратегия развития знания, прямо противоположная той, которая начиная с эпохи Просвещения определяла социологию научных практик. Опора на авторитет (автора, текста и т. п.), на котором построена система научных изданий и источников, принадлежит индустриальной культуре, между тем как пространство культуры информационной уже давно создало свою систему. Ризомное пространство гипертекстовой среды на место авторитета отдельного ученого или источника, подтверждающего качество информации, выдвигает другой критерий — ее количество. С этим же связана принципиальная переориентация научной методологии с дедуктивной на индуктивную, или, другими словами, с онтологической на экспериментальную5.

Переход от качества к количеству как более объективно определяемому критерию является одной из центральных особенностей реализации DH в области филологии. Не случайно количественные методы исследования часто становятся просто синонимом DH.

***

Книга Франко Моретти «Дальнее чтение» (2005) сформировала ощущение, что цифровая гуманитаристика открывает пути к преодолению кризиса гуманитарных наук6. С момента перевода этой знаковой книги прошли годы, за это время DH превратились в России из маргинальной дисциплины в модный тренд. Появились специализированные интернет-ресурсы, конференции, учебные курсы и магистерские программы, открылись научные лаборатории и исследовательские центры. При этом нужно сказать, что, хотя количественные исследования и занимают центральное место в новой цифровой филологии, DH ими далеко не ограничиваются. К DH относятся и создание цифровых музеев и электронных библиотек, и разработка электронных комментированных изданий, и цифровая текстология, и всевозможные визуализации данных, и проекты в области геймификации и сторителлинга, и интер­активные карты и путеводители, и различные онлайн-проекты, совмещающие все названное7.

Тем не менее ожидаемого магического преодоления кризиса гуманитарной мысли пока так и не произошло8. Статус гуманитарных наук в российском обществе не изменился. Хотя на уровне государственной риторики повальная цифровизация встала едва ли не в один ряд с православием и народностью, сотни проектов заканчиваются вместе с завершением грантового периода или же остаются недоступными как широкому пользователю, так и коллегам, а выросшие за последние несколько лет специалисты в области DH сегодня куда чаще работают дата-специалистами, чем занимаются собственно гуманитарными исследованиями9.

***

Появление DH было воспринято научным сообществом прежде всего как прорыв в области методологии. Большие данные и достижения в области обработки естественного языка (NLP) открыли гуманитарным наукам новые инструменты, потенциально позволяющие с большей точностью говорить о макропроцессах и по-новому решать формализуемые задачи. Однако оптимистичная надежда на то, что волшебные нейросетевые алгоритмы сумеют все посчитать и определить, порой мешает заметить те фундаментальные ограничения новых методов и последствия их применения, которые в естественных и точных науках уже давно осмыслены10.

Еще в 2008 году, когда только начинался бум Big Data, Крис Андерсен, в то время редактор журнала «Wired», приводил замечательный пример того, как большие данные могут обессмысливать научный метод. Примером было сделанное на основании их анализа открытие сотен новых видов бактерий и микроорганизмов. Когда мы говорим «открытие», мы представляем себе Дарвина, описывающего новый вид и его морфологию, однако в данном случае мы не знаем про новооткрытые элементы ничего, кроме того, что они существуют как статистически значимое изменение в общем наборе данных, поскольку никакого источника, для того чтобы говорить об их морфологии или структуре, у нас нет, мы можем лишь сравнивать между собой статистические кривые и говорить об их сходстве и различии [Anderson 2008].

Это вызвано тем, что в основе количественных исследований лежит индуктивная логика, в то время как в основе привычной нам научной методологии лежит, наоборот, логика дедуктивная, связанная с созданием общей гипотезы и общей системы, которая далее подтверждается или лишь частично подтверждается экспериментальными данными. Количественные исследования движутся от данных, пытаясь находить новые закономерности, которые человек с его дедуктивной логикой предпосылок найти не сможет.

Такой подход, заведомо исключающий предвзятость ученого, хорошо согласуется с задачами позитивистской науки, поскольку дает возможность говорить о несомненной научной объективности полученных результатов. Он позволяет характеризовать стиль или определять авторство на материале точных данных, изучать социологию чтения (библиотеки и интернет-магазины), сравнивать коммуникативные персонажные структуры в драматическом произведении (графы), осуществлять анализ топики и т. д. Но несмотря на то, что достижения компьютерной лингвистики, и в особенности NLP, обладают огромным потенциалом в области изучения истории культуры вообще и литературы в частности, эти методы все же имеют ряд ограничений, связанных с самой природой материала.

Основой любого количественного исследования являются данные. Для того чтобы исследование было точным, эти данные должны быть, во-первых, максимально полными, во-вторых, надежными. Проблемы пока возникают и с тем, и с другим11.

Хотя создание корпусов сегодня является одной из основных форм реализации DH, в области филологии в этом отношении мы пока находимся на этапе первоначального накопления данных, и лишь по его завершении новые методы исследований смогут стать по-настоящему эффективными. Строго говоря, научной объективностью результаты количественных исследований будут обладать только после полной оцифровки и обработки всех существующих текстов культуры. Но для того чтобы создать даже один корпус текстов и снабдить его максимально полной разметкой, необходимо проделать огромное количество механической работы. При этом границы количественных методов все равно будут определяться тем, какие параметры в структуре данных в принципе поддаются количественному измерению12. Не говоря уже о том, что статистика вообще нацелена на выявление типического, тогда как самые значимые явления часто находятся на краях спектра.

Отбор текстов в конечном счете всегда производится исходя из исследовательской установки, а она, в свою очередь, формируется на основе конечного набора суждений и гипотез, известных исследователю, и, следовательно, уже не объективна13. Именно так строилась научная логика в Гутенбергову эпоху. Принципиальное отличие от нее оказывается иллюзорным. При ближайшем рассмотрении выясняется, что индуктивные методы основаны на дедуктивных предпосылках.

Серьезная проблема связана и с метаданными, то есть с той разметкой, которая осуществлена в корпусе. Не случайно материалом корпусных исследований у Моретти служат прежде всего драматические тексты, в которых есть хорошо формализуемые коммуникативные структуры. Для многих видов прозы разделить текст — хотя бы на речь героев и повествователя — задача не всегда реализуемая14. Как только мы хотим перейти с уровня значения на уровень смысла, мы сталкиваемся с неформализуемой природой текста.

Еще Андрей Белый, рассуждая в книге «Мастерство Гоголя» о возможности точного описания семантики цвета, указал, что даже простая задача разметки цветописи не может быть решена автоматически, потому, например, что звонкая глубина полуденного неба будет голубой только в сознании читателя15.

Мы можем сравнить корпуса текстов Блока и Мандельштама и увидеть разницу в лексике, стилистике, топике, однако эти результаты станут не итогом исследования, а лишь вспомогательным инструментом для сущностного сопоставления поэтик этих авторов и свойственных им стратегий смыслопорождения.

Пожалуй, наиболее убедительное и компактное объяснение принципиальной ограниченности формального анализа по отношению к смысловым структурам художественного текста содержится в давней статье Ю. Лотмана «Мозг — текст — культура — искусственный интеллект», где описан механизм смыслопорождения, характерный для текстов, написанных на естественных языках. Контекстная обусловленность значений делает весьма ограниченным сравнение двух текстов по их элементному грамматическому или стилистическому составу. Проблема заключается в том, что литературный текст является таким целым, которое больше простой суммы своих элементов. А это значит, что его индуктивное описание в принципе невозможно16.

Можно было бы подробнее развить эту мысль, в конечном счете уперевшись в известную теорему Геделя о неполноте, однако эта задача уже во многом решена в замечательной статье Маттео Пасквинелли «Машины, формирующие(ся в) логику: нейронные сети и искаженная автоматизация интеллекта в качестве статистического вывода» [Пасквинелли 2019]. Здесь важно было лишь показать, что, несмотря на свою кажущуюся новизну, новые методы не решают эпистемологических проблем гуманитарного знания, связанных с самой природой материала, а лишь позволяют лучше адаптировать его к индуктивной логике научного позитивизма, характерной для индустриальной эпохи (см.: [Тоффлер 2004]). А значит, будучи цифровыми (то есть относящимися к информационной эпохе), они не создают для гуманитарных наук никакой новой онтологии, без которой переход в новую эпоху невозможен.

***

Кризис гуманитарного знания имеет не только эпистемологическую природу, он должен быть преодолен как на уровне тео­рии и методологии (выдвижение на первый план индуктивных стратегий познания, как было показано, этой проблемы не решает), так и на уровне социальном (предложение новых форм реализации научных практик).

Если так называемые точные науки производят новые технологии, то гуманитарные науки сегодня находятся на иждивении государства лишь потому, что могут служить производству идеологии17, связанной с программированием будущего через прошлое. Само собой, ни один уважающий себя филолог, философ, историк, антрополог, искусствовед не согласится с тем, что продуктом его деятельности должна оказаться идеология. Но что же можно предложить взамен? Подчеркнем, что для выживания академических дисциплин в современном мире принципиально важен вопрос о том, что является продуктом их деятельности, что они производят.

Функция науки — производство нового знания, но, увы, новое знание — это еще не продукт, чтобы стать им, оно должно быть кому-то адресовано. И если его адресат — само научное сообщество, а не внешний потребитель, то тут необходимым образом вступают в силу различные системы критериев, соответствие которым для науки имеет ту же функцию, что и покупаемость для любого продукта, выходящего на рынок.

Что же может помочь филологии заново определить собственный предмет таким образом, чтобы, не утратив своего содержательного смысла, она вновь начала производить продукт, востребованный обществом и способный полноценно участвовать в культурном процессе?

На этот вопрос можно дать разные ответы, и далеко не все из них связаны с цифровыми технологиями.

***

В рамках государственной стратегии развития науки возможный ответ связан с разворотом в сторону образования. Сегодня постепенно закрывается национальный проект «Наука», в рамках которого осуществлялось финансирование, в частности, всех институтов системы РАН, с тем чтобы запустить на его месте новый проект «Наука и университеты». Этот очередной зигзаг государственной политики будет иметь последствия, весьма ощутимые для ученых. Изменятся формы отчетности, поскольку задача науки сместится с производства знания на его воспроизводство.

Такой ход понятен. Образование — наиболее очевидный продукт, который может дать фундаментальная наука. Однако если взглянуть на этот цикл внимательно, то окажется, что он представляет собой дурную бесконечность, разрушительную как для образования, так и для фундаментальной науки.

Альтернативой сращения фундаментальной науки с образованием является ее интеграция в крупные бизнес-корпорации, которым выгодно содержать научно-исследовательские институты, поскольку возможная капитализация даже малой части их открытий с лихвой покрывает расходы на многолетнее финансирование18. В России этот процесс начался относительно недавно, но пока в нем по преимуществу участвуют точные, прикладные и социальные науки, в то время как науки гуманитарные, обращенные на изучение культуры и культурного наследия, в него почти не включены, поскольку инвестиции в эту область, на первый взгляд, могут иметь только имиджевую выгоду.

Для того чтобы крупному бизнесу было выгодно инвестировать в культуру, нужно научиться создавать продукт, в котором, с одной стороны, будут полноценно реализованы фундаментальные научные установки, а с другой стороны, будут содержаться возможности для успешной коммерциализации.

Для государства таким продуктом являлась идеология; интеграция науки и образования отчасти продолжает эту логику. Однако единственным покупателем идеологии может быть только само государство, а задача актуализации культурного наследия не может быть направлена на идеологические или дидактические цели. Широкому потребителю история культуры может быть интересна не потому, что служит формированию этических установок (будем честны, это принцип сомнительный), а потому, что о ней интересно рассказано19.

Именно рассказ, нарратив, стимулирующий к взаимодействию с объектами, которые являются областью компетенции гуманитарной науки, и организующий такое взаимодействие, может быть одним из возможных ее продуктов. Такой продукт станет не образовательным, а просветительским, направленным не на производство и воспроизводство знания, а на организацию доступа к нему20.

***

Наука, в том числе филологическая, обыкновенно занимает позицию, следующую, так сказать, за своим материалом. Он уже существует как данность, а она поясняет, анализирует его. Просвещение решает другую задачу, его цель — организовать доступ к материалу. Для традиционной филологии предметом исследования является текст в системе культуры. Вокруг него и организуются различные аналитические практики. Они могут быть интерпретативными или комментаторскими, но и те, и другие способны разворачиваться как «за» текстом, так и перед ним, предваряя или сопровождая взаимодействие с текстом, а не следуя после него.

Вопрос о том, какая из этих стратегий правильнее, связан не только с маркетинговым позиционированием конечного продукта, но и с методологическими установками изучения литературного текста. Характерное для индуктивных аналитических практик движение от части к целому, при котором мы изучаем отдельные элементы текста, рассматривая их во всевозможных связях и аспектах, чтобы стать продуктивным, должно завершиться возвращением к целому текста с новоприобретенными знаниями. Но для этого целое уже должно быть заранее дано, доступно, оно должно мыслиться как предшествующее частям, а не как складывающееся из них.

Наука, как правило, ставит своей задачей аналитическое осмысление данных с целью определения закономерностей. Однако для гуманитарных наук это только первый шаг. Объект изучения филологии не данные, а смыслопорождающая система, и это делает невозможным ее конечное аналитическое описание. Неспособность принять эту невозможность периодически приводит к тому, что литературоведение уходит от интерпретативных стратегий в сторону комментаторских.

Проведя композиционный, историко-литературный, поэтический или любой другой анализ текста, мы часто оставляем за собой разъятый на части остов произведения искусства, в то время как главная проблема заключается в том, чтобы помочь читателю взаимодействовать с ним во всей органичной полноте его контекстных связей и внутренних структур.

Закон организации художественного пространства не существует вне опыта взаимодействия с этим пространством (в отличие, скажем, от силы гравитации, которая неизменна вне зависимости от условий конкретного эксперимента). Природа материала такова, что всякое обобщение будет жертвовать научной точностью, поскольку каждый текст и каждое прочтение текста будет уникальной смысловой структурой. Попытка вырваться из этой западни грозит тем, что мы подменяем художественный текст неким конструктом, фактом истории, существующим в связях и цитатах, обладающим внутренней организацией, но лишенным своей органичной природы.

***

Лозунг «The medium is the message», предложенный отцом-
основателем Media Studies Маршаллом Маклюэном [Маклюэн 2003], можно интерпретировать не только как указание на новый объект, но и как новую сферу научного творчества. Ведь если интерфейс тоже является высказыванием, то задача проектирования интерфейса, сообразного нашему пониманию природы артефактов культуры, несомненно, является такой же научной задачей, как их анализ и описание. При этом результатом успешного решения этой задачи станет совершенно конкретный продукт, который будет радикально отличаться от продуктов Гутенберговой эпохи.

Если следовать формуле «Media is the message», то к проектированию интерфейсов взаимодействия с культурным наследием нужно отнестись как к задаче, позволяющей совместить просветительские и научные цели. Подобно тому, как в бумажном издании, так или иначе располагая текст, снабжая его дополнительными материалами, мы определяем возможные сценарии его дальнейшего аналитического осмысления читателем, так и в цифровой среде, создавая интерфейсы взаи­модействия для будущих пользователей, мы тем самым можем актуализировать различные аспекты внутренней природы текста21.

Главный предмет изучения истории литературы — историко-литературный процесс, который в гутенберговских формах культурного мышления подлежал описанию лишь в виде линейного повествования, — с появлением гипертекстовой культуры все с большей очевидностью видится как имеющий принципиально нелинейную природу. Одним из важнейших отличий цифровой среды от книжной является возможность размещения материала в виде многомерного и нелинейно организованного объекта, незавершенного и трансформируемого. Решая задачу перевода наших знаний об устройстве пространства культуры в пространство гипертекста, мы не только способствуем сохранению этих знаний, но и получаем возможность создать для них форму представления, намного более адекватную их внутренней природе.

Одной из главных задач будущей цифровой гуманитаристики мне видится создание такого единого и в то же время вариативного интерфейса, который бы отображал многомерную и нелинейную природу сорасположения культурных фактов, организующих те или иные культурные нарративы.

***

Такая постановка задачи хороша как лозунг, как мечта. Но для ее осуществления необходимо сперва решить другие, чисто практические задачи, причем решить не в рамках одного проекта, а глобально22.

Кроме очевидной необходимости оцифровать материа­лы, которые еще оцифрованы не были, необходимо привести их к одному стандарту хранения и доступа. Это проблема не только научная, но и социально-экономическая (неспособность договориться, помноженная на экономическую зависимость от предоставления платного доступа). Задача консолидации хранения материалов, впрочем, уже ставилась научным сообществом23. Существуют различные системы хранения музейных, архивных, библиотечных данных, но это закрытые внутренние системы24, и их объединение требует отдельного решения, включая разработку единого стандарта метаданных25. Решив проблему разработки единых стандартов метаданных, необходимо эти метаданные получить, причем как для объектов, которые цифруются впервые, так и для тех, которые давно оцифрованы, но не снабжены тегами (к последним относится большинство книг, существующих в формате PDF).

Один и тот же литературный текст может иметь несколько различных версий и источников (и, естественно, каждая такая версия является отдельным фактом культуры). Поэтому необходимо не только снабдить каждую версию текста такими базовыми тегами, как автор, год издания, место издания (которые, как правило, можно взять из уже существующего библиографического или архивного описания), но и установить для нее правильные связи с другими элементами корпуса. Источниками для автоматического вычленения таких связей могут быть и академические издания, в комментариях которых эта информация содержится, и справочные издания. Извлечение данных позволит сделать такого рода сведения характеристиками текста, а не отдельными от него метатекстами, эти характеристики описывающими. Иными словами, описания системы организации элементов можно будет превратить в саму систему связей. От качества решения этой задачи зависит, какие типы связей и атрибуций можно будет выделить, не прибегая к ручной работе, на основе тысяч уже выполненных исследований. Речь идет, разумеется, не только о связи разных изданий одного текста, но и о таких его характеристиках, как, например, адресация, жанровая принадлежность, пародийные или полемические отношения с другим текстом и т. п. В пределе сюда может войти вся сумма отношений различных элементов литературного поля, из которой складывается наше представление о литературном процессе.

Программирование алгоритмов извлечения необходимой информации из существующих научных источников должно превратиться в отдельную задачу, которая, с одной стороны, может быть решена только специалистом в предметной области (историком литературы, который составит списки возможных тегов, определит источники для их извлечения и их иерархию, поможет формализовать задачу поиска нужных данных), а с другой стороны, требует навыков, присущих дата-аналитику и специалисту по компьютерной лингвистике.

Огромный труд по осмыслению связей различных культурных объектов уже произведен в науке, однако результат этого труда не может быть представлен как единый объект, его невозможно увидеть, с ним невозможно взаимодействовать в его полноте. И даже сами ученые способны оперировать этим целым лишь в меру способностей своей памяти и доступности существующих материалов.

DH дают возможность представить наши знания о литературной культуре не в виде разрозненного собрания фактов, а в виде многомерной системы связей, что куда более соответствует самой природе культуры, имеющей никак не линейную и не дискретную природу. Связный граф как форма представления структуры анализируемых объектов и связей очень часто становится способом визуализации исследований в области DH. Это неслучайно, поскольку именно многомерная структура материала, так отчетливо понятная цифровой постгутенберговской культуре, выходит тут на первый план.

***

Компьютерная эпоха совершила бесшумную, но глобальную революцию (или, точнее сказать, глобальный эволюционный скачок) в области нашего представления о структуре, организации и хранении знания. Основным интерфейсом хранения данных в десктопных ОS является система папок, организованная по принципу двухмерной древовидной иерархии.

На создание удобных интерфейсов для работы с древовидными иерархиями на плоском экране ушло более двух десятилетий. Сегодня мы стоим на рубеже новой технологической революции, которая изменит наши стратегии взаимодействия с информацией. Речь идет о технологиях виртуальной и дополненной реальности. Сейчас они коммерчески востребованы в основном в сфере медиа-развлечений, однако уже появляются продукты для работы с объемными майндмэпами, которые особенно нужны в сфере проектирования сложных систем, поскольку трехмерное представление дает принципиально иные возможности описания логических структур, а также подачи информации. И структура связного графа, которая на плоском экране предстает лишь изометрической визуализацией, вероятно, станет в трехмерном пространстве наследником древовидной двухмерной логики организации данных.

И все-таки традиционный книжный формат обладает одной важнейшей особенностью, которой ризомная структура лишена. И эта особенность — сюжет26.

***

Построив трехмерную карту истории русской литературы, мы еще не решим задачу создания продукта. Несомненно, такой ресурс уже сам по себе будет чрезвычайно полезным источником больших данных для исследователя культуры. Однако для простого пользователя такая карта будет не более чем бесконечным нагромождением элементов и связей. Для того чтобы это изменить, она должна из карты превратиться в путеводитель. Среди стремящегося к бесконечности количества связей необходимо прочертить траектории-сюжеты, двигаясь по которым, перемещаясь от одного артефакта к другому, пользователь мог бы взаимодействовать с каждым из них во всей полноте его связей.

Ключевым элементом такой новой стратегии представления истории культуры должна стать установка на интерактивность. Тогда комментарий из предоставления сведений превратится в процесс их добывания, анализ текста — из готового результата в аналитическую задачу, если угодно, головоломку, которую читатель решает сам в рамках предложенного ему сценария, самостоятельно находя ключи и подсказки, выстраи­вая новые связи, высвечивая в многомерном пространстве интертексты и цитаты. Энциклопедические сведения о биографиях отдельных писателей начнут складываться в картину их творческих и жизненных взаимодействий, а описания историко-литературных сюжетов, культурных нарративов и практик превратятся из текстов, в которые читатель может быть включен лишь пассивно, в сценарии, героем которых может стать он сам.

Создание траекторий-сюжетов, включающих как повествование, так и различные интерактивные механики взаимодействия с объектами, легко может стать одним из продуктов филологического знания. Осуществить такую путеводную функцию, функцию Вергилия, — и есть та задача, которую, как кажется, могли бы решить цифровые гуманитарные науки.

***

Проблема проектирования интерфейсов на первый взгляд кажется лежащей далеко от поиска новой онтологии для гуманитарных наук. Однако именно эта проблема связана с теми способами пространственно-временной организации знания, которые открывают пути к совершенно другим формам существования объектов культуры.

За последние годы принципиально изменилось отношение физического и информационного пространств. Возможность создавать общедоступные виртуальные объекты стала основой разнообразных игровых проектов, использующих принципы дополненной реальности (вроде «Pokemon GO»), и поставила целый ряд серьезных вопросов. Если в одном и том же физическом пространстве мы можем разместить сколько угодно виртуальных локаций или объектов, то само понятие пространственного размывается. Мы и раньше могли, читая роман или смотря кино, погружаться в вымышленные миры. Но до сих пор это предполагало рамку, в которую симуляция заключена. Сегодня мы видим, как такая рамка начинает разрушаться.

Для гуманитарной науки это означает, что объект ее изучения скоро окажется вне рамок, в общем с нами пространстве и времени. И если сегодня проекты, предлагающие увидеть компьютерную симуляцию города, каким он был век или два назад, — это диковинка, то завтра, превратившись в один из слоев гугл-карты, они начнут резко менять наши отношения с прошлым.

Пространство и время — два базовых элемента онтологии. Про «глобальное время» как невероятный эволюционный скачок говорил уже Тоффлер [Тоффлер 2004]. Следующим шагом может стать создание единого временно́го измерения, в котором все события прошлых веков начнут существовать в общем с нами настоящем. Формат «сто лет назад в этот день» знаком нам еще по телехронике или прогнозу погоды, но новые медиа позволяют придать ему другое качество и иначе включить в наше настоящее. Пример движения в таком направлении — проект «1917», ежедневно размещавший отрывки из газет, дневников, писем той эпохи в новостной ленте Facebook и Вконтакте.

Нам видны лишь некоторые черты будущего, которое еще не сформировалось, но задачи гуманитарного знания уже сегодня должны ставиться с ориентацией на новые формы существования культуры. Должен возникнуть новый интерес к категориям организации художественных миров (прежде всего к категориям пространства и времени), соотносящий их с проблемами виртуальной реальности. Когда художественные тексты окажутся в общей с нами среде, потребуется новый тип комментаторских практик и т. д. Однако разговор о новой онтологии гуманитарного знания — это тема отдельной статьи.

***

Ноосфера уже превратилась в информационное поле, скоро она грозит целиком превратиться в физический объект. А значит, на следующем шаге информация станет пространством, в котором мы будем жить, станем его акторами. Именно пространственная форма требует наличия сюжета, поскольку пространство осваивается в движении. Оно не имеет единых законов чтения и зависит от точки зрения. То, что сегодня мы можем представить себе в виде связного графа, завтра из объекта, на который мы смотрим, превратится в объем, в котором мы движемся. И если мы хотим, чтобы этим объемом было целое культуры, то задачу его перевода на языки новой цифровой реальности должны решить мы сами.

  1. До начала ХХ века в немецкой традиции, например, было принято разделение на науки о духе и науки о природе. Однако победа материалистической философии придала словосочетанию «науки о духе» оксюморонный характер.[]
  2. Подробнее об этом см., например: [Хюбнер 1996: 21–24].[]
  3. См.: [Штайн, Петренко 2011].[]
  4. Необходимо оговориться, что такой взгляд на историю развития науки и место гуманитарных наук в общей системе знания является лишь одним из многих возможных и отнюдь не самым популярным. При этом противоположный взгляд на структуру гуманитарного знания также может стать отправной точкой для критического осмысления современных DH. Примером тому может служить статья Пола Розенблюма «О концептуальной структуре цифровых гуманитарных наук» [Rosenbloom 2012].[]
  5. Формулировка Г. Щедровицкого.[]
  6. Выходу русского перевода книги Моретти [Моретти 2016] был посвящен отдельный номер «Нового литературного обозрения» — № 2 (150) за 2018 год. На фоне общих восторгов перед будущими перспективами выделялась статья А. Рейтблата [Рейтблат 2018]: в ней высказывались резонные сомнения как в методологических установках «дальнего чтения», так и в потенциальной значимости его результатов.[]
  7. О различных направлениях DH см., например: [Svensson 2016].[]
  8. []
  9. Об аналогичных проблемах цифровой гуманитаристики на Западе было громко заявлено в статье Тимоти Бреннана [Brennan 2017], на которую откликнулись многие исследователи в области DH. См.: [Bond, Long, Underwood 2017; Weiskott 2017].[]
  10. В естественных и точных науках, где большие данные и машинное обучение появились гораздо раньше, сегодня уже вовсю обсуждается кризис воспроизводимости научных результатов, к которому привело злоупотребление новыми методологиями. С увеличением числа исследований, проводимых с использованием алгоритмов машинного обучения, оказалось, что другим ученым далеко не всегда удается на основе опубликованных данных прийти к тем же результатам, а порой и вовсе не получается заставить специа­лизированное ПО, созданное их коллегами, корректно работать. См. об этом: [Replication… 2021; Deep… 2019].[]
  11. К примеру, нас интересует, употреблялось ли слово «жанр» в пушкинскую эпоху. Google Ngram показывает вхождения в корпусе Google Books, однако как только мы начинаем открывать тексты, мы видим, что в качестве этого слова в книгах старой печати выделены «Жанъ-Жакъ», «такъ» и т. п. Такого рода досадные промахи компьютерного чтения могут быть исправлены либо с развитием технологии, либо с помощью ручной обработки корпусов (так, например, Национальный корпус русского языка покажет нам, что слово «жанр» впервые встречается только в 1850-е годы).[]
  12. Так, например, благодаря недавней работе Антонины Мартыненко [Мартыненко 2020] у нас есть Корпус русских элегий. В нем собраны тексты, опубликованные в печатных изданиях с 1815 по 1835 год и содержащие слово «элегия» в заглавии или подзаголовке. За рамками корпуса, таким образом, остались многочисленные элегии, не имевшие такого заглавия или подзаголовка, и к кругу этих неучтенных текстов относятся несомненные образцы жанра. Следовательно, характеризовать, скажем, стилистические черты элегии только на основе текстов, представленных в корпусе, — значит не учитывать особенности жанра во всей их полноте.[]
  13. О неизбежности подобной методологической ловушки для всякой «нормальной» науки см.: [Кун 2003].[]
  14. Так, например, отдельную проблему составит несобственно-прямая речь.[]
  15. »Я вел статистику цветов Гоголя; вернее — «старался» вести; ряд цветов неопределим; ряд предметов окрашен в цвет без упоминания об оттенке; слово «туман» — красочное представление, но группы оттенков, не подлежащей отметке; иногда упоминание о «белом личике» — условность языка, а не красочное пятно; оно тоже не подлежит отметке; и «синяя зелень», и «черная зелень» — не зелень красочного пятна; рубрика отмечает «синее», «черное», а не зеленое; есть ряд «цветных» слов, брошенных вскользь не для передачи красочности, а как условность языковых обиходов» [Белый 1934: 120].[]
  16. См.: [Лотман 1992].[]
  17. О DH как об антидоте идеологии см.: [Scheinfeldt 2016].[]
  18. Такая стратегия перспективна как для науки, так и для государства. Процесс подобной интеграции происходит на Западе уже достаточно давно (впрочем, он имеет и негативные последствия, связанные с коммерческим интересом, например запрет на публикацию открытий).[]
  19. Другое дело, что такой рассказ может преследовать чисто идеологические цели (к счастью, при этом он редко бывает интересен).[]
  20. В Гутенбергову эпоху эту задачу решала научно-популярная литература, сейчас ее решают такие проекты, как «Арзамас» или «ПостНаука». Но подобных проектов пока еще очень мало, и самим научным сообществом они еще не мыслятся как важный формат реализации результатов исследований.[]
  21. Проблема осмысления интерфейса может рассматриваться как специальная задача философии или филологии (см., например: [Куртов 2014]).[]
  22. См.: [McGann 2005].[]
  23. Так, в 2019 году этой проблеме был посвящен организованный Высшей школой экономики семинар «Текст как Data», собравший представителей крупнейших литературных музеев и архивов России, а также специалистов в области DH.[]
  24. КАМИС, ПАРУС и др.[]
  25. Одним из стандартов, принятых во всем мире для описания данных в DH, является язык разметки TEI (Text Encoding Initiative), однако он рассчитан прежде всего на разметку текстов, а тексты, хотя и составляют важную часть культурного пространства, отнюдь не исчерпывают его.[]
  26. Сюжет, понимаемый в лотмановском смысле: как «пересечение границы семантического поля», как «одно событие, описывающее сумму событий» [Лотман 1998: 221–229].[]