Обложка статьи

Что написано пером... переписано Word’oм

Время прочтения
Время прочтения: 31 минута

Две революции, мировая война — начало XX века в России. Мы до сих пор изучаем эти события, повлиявшие на всю мировую историю. Чтобы анализировать такой большой исторический пласт, мы вынуждены абстрагироваться, делать zoom out и не брать во внимание жизнь отдельного человека. Но хоть история и обезличена, у каждой личности — своя история. Егор Мишин, один из основателей проекта PETROWORKERS, рассказал, как работают волонтеры при оцифровке документов и почему нам важен «взгляд снизу».

Егор Мишин, руководитель проекта

— Как пришла идея создания проекта?

— Я как историк работаю в архиве и имею доступ к воспоминаниям рабочих. Раньше существовала организация Истпарт, которая в том числе занималась сбором сведений об истории партии. Эти документы хранятся в партархиве, который сейчас называется Центральный государственный архив историко-политических документов Санкт-Петербурга (ЛПА — Ленинградский Партархив в прошлом). Там есть специальный фонд, в котором находятся воспоминания рабочих. Современные историки часто к нему обращаются, так как в нем можно найти ценные воспоминания — отклики о грандиозных событиях, которые не отразились в официальных документах. Это востребованный источник, и мы с ним работали.

Но все чаще я стал задумываться, как было бы хорошо, если бы каждый раз человеку не приходилось лезть в архив и заново начинать поиски, а был уже готовый текстовый корпус. Я уже тогда знал про проект «Прожито», мы во многом вдохновились их идеей. Так пришла мысль упростить жизнь будущим исследователям, заодно открыть эти документы широкой общественности.

— Почему нам важны воспоминания рабочих?

— Голоса простых людей, которые были пассивными участниками тех событий, часто остаются за кадром. Это взгляд снизу, зачастую отличный от взгляда политиков или деятелей культуры, элиты. Авторы воспоминаний — простые люди. И посмотреть на то, как «маленький человек» ощущал себя среди бури эпохальных исторических событий, кажется нам чрезвычайно интересным. Конечно, такой взгляд имеет большое преломление, он идеологизирован, но это не делает его менее ценным. И в конце концов, это наши предки и их история.

— Кто такие рабочие перед революцией?

— Самые разные люди. Как такового рабочего класса еще не существовало, это скорее конгломерат различных социальных групп. Петербург конца XIX — начала XX века порой называют крестьянским городом. И действительно, огромная доля жителей, от лавочников и торговцев до рабочих и купцов, были крестьянами и перебрались в мегаполис не так давно. Крестьяне приносили с собой бунтарский дух, общинные ценности и идеалы, противоречащие культуре города индустриального типа. Поэтому рабочие — вчерашние крестьяне — были подвержены радикализации, представляли собой гремучую смесь, которая и взорвалась в феврале 1917 года.

— Какие детали можно найти в воспоминаниях?

— В нашем случае авторы воспоминаний — это коммунисты и (или) профсоюзные активисты, которые описывали свою подпольную работу до революции, забастовки, участие в событиях 1917 года или бои Гражданской войны, но не концентрировались на деталях личной жизни. Зато они часто были  откровенны и рассказывали о жестокостях: самосудах над пленными, белом и красном террорах. В мемуарах рабочие часто рассказывали о своих бытовых условиях, когда в небольшой комнате, где помещалось только четыре кровати, могло проживать 10–15 человек. А за это, как правило, им приходилось отдавать пятую часть своего заработка.

Нам попадаются самые разные люди: как крестьянки, которые, мягко говоря, не разбирались в политике, так и высококвалифицированные рабочие, посещавшие политические кружки и клубы, т. н. «рабочая интеллигенция». 

— Какие трудности связаны с расшифровкой текста?

— Наибольшие сложности возникают при работе с рукописными материалами, когда не всегда можно понять почерк человека. Но большинство мемуаров машинописные, что облегчает работу. Главная проблема в нашем случае — корректная передача текста, соблюдение баланса между архивным документом и его машиночитаемой копией на сайте. Например, в некоторых случаях мы имеем дело с черновиками, в которые вносились исправления. Здесь возникает технический вопрос, как отразить все стадии изменения текста. Затруднения вызывают и вопросы орфографии. Не всегда понятно, что перед нами — неграмотность автора, ошибка при печатании на машинке или норма для русского языка 1920-х годов.

1/3

2/3

3/3

Фотографии предоставлены собеседником 

— Как происходит набор волонтеров?

— Мы разместили наш проект на платформе «Люди науки». На этом сайте любой ученый может опубликовать свое исследование и попросить помощи у волонтеров. А дальше человек попадает на платформу, выбирает наш проект, заполняет небольшую форму, пишет, сколько времени он готов уделить работе, и вот он уже в деле. Наш куратор высылает инструкцию и первое задание. Это такой pdf-файл, в котором находится обложка личного дела рабочего и несколько нужных страничек. Волонтер должен переписать текст и расставить нужные теги:

  • имена — многие в мемуарах ссылаются на других людей, важно это систематизировать; 
  • предприятия — историкам необходимо понимать, в каком коллективе работал человек;
  • даты событий;
  • технические теги (у номеров страниц, абзацев).

Затем волонтер отправляет готовый текст нам, редактор его просматривает, правит, сличает факты, и, в принципе, документ готов к загрузке.

— Как проект планирует развиваться?

PETROWORKERS — это не единичная инициатива, а целый проект, в котором расшифровка воспоминаний — лишь часть идеи. Мы исследуем петербургских рабочих и рассказываем об этом во «ВКонтакте» и telegram, снимаем видео с историками для YouTube. В июне мы провели научно-популярный фестиваль по индустриальной истории.

Планируем увеличить и расширить базу источников: будем работать с воспоминаниями из других архивов, брать интервью у ныне живущих ветеранов труда. Параллельно с накоплением воспоминаний, продолжим собирать биографические сведения об их авторах. Таким образом, у нас получатся биографическая и текстовая базы данных. В первой можно будет анализировать социальную структуру, карьерные лифты и в идеале даже искать родственников. А вторая позволит анализировать текст машинными методами: выявлять речевые штампы и распространенные ошибки, изучать грамматику и общий уровень языка рабочих, исследовать структуру текстов.

Если нам удастся создать франшизу, то подобная работа начнется и с воспоминаниями рабочих Москвы, Урала, Сибири, других регионов. Петроград был колыбелью революции, надеемся, что он станет таковой и в этом процессе.

Какие еще проекты занимаются созданием электронных архивов?

Бумага — очень хрупкий материал. Вы можете поджечь листок, разорвать и разными другими способами его уничтожить. Тем не менее, на бумаге до нас дошло множество исторических документов, дневников, воспоминаний. Чтобы подарить свидетелям истории вторую жизнь, их оцифровывают и создают базы данных, по которым можно найти нужный документ. Часто на помощь приходят волонтеры. Мы составили подборку проектов гражданских инициатив, которые занимаются созданием электронных архивов и, быть может, вы станете частью команды одного из них.

Проект был создан в 2015 году для сбора и публикации личных дневников на русском и украинском языках. В 2019 году участники «Прожито» открыли Центр изучения эго-документов (документов, написанных, как правило, от первого лица. — Примеч. ред.) Европейского университета в Санкт-Петербурге. Центр развивает корпус личных дневников «Прожито», объем которого более полумиллиона подневных записей XVIII–XX веков.

Платформа включает в себя поисковый, аналитический и коммуникационный сервисы. Работа ведется с базой источников Томского государственного университета и Томского областного краеведческого музея. Платформой активно пользуются ученые для исследования оцифрованных документов. Проект работает с книжными изданиями, рукописными и архивными документами, а также с картами, изобразительными материалами и периодическими изданиями.

В конце мая руководители проекта организовали первый чемпионат по распознаванию сибирских газет XIX века. За один час участникам соревнования предстояло расшифровать колонки с записями в газетах, которые уже распознал машинный алгоритм, и перепечатать текст в новую колонку. Победителями стали те, кто смог провести наиболее точное распознавание текста и напечатать наибольшее количество знаков.  

Ю кен хелп!

Для тех, кто хорошо владеет английским языком, мы сделали подборку на крупной международной платформе проектов гражданской науки Zooniverse.

Изображение

Фото для расшифровки из проекта Get To Know Medieval Londoners. Источник: zooniverse.org

Погрузитесь в жизнь средневековых горожан, расшифровывая вместе с учеными документы о собственности тех лет.

Изучите изменение климата с помощью расшифровки судовых журналов XVIII века.

Опишите и классифицируйте более 60 тысяч открыток с редкими фотографиями, изображающими жизнь Мичигана в первой половине XX века.

Расшифруйте медицинские данные моряков за сто лет из госпиталя в Гринвиче с 1826 по 1930 год.

На обложке: собрание рабочих Путиловского завода, посвященное выборам в Петросовет, 1920 год. Проект «Люди науки» — Победитель Международной Премии #МыВместе

3 ноября 2022