Нейросеть расшифровала черновики Пушкина
Нейросеть разгадывает тайны рукописей. Заглянуть под слой чернил и увидеть зачеркнутые слова теперь возможно благодаря искусственному интеллекту. Как расшифровывают черновики Пушкина – узнала Юлия Кундрюкова.
Дмитрий Николаев и Николай Перцов работают вместе всего пару месяцев. Они сошлись, как лед и пламень – программист и филолог – для того, чтобы разобраться в черновиках пушкинского "Евгения Онегина". Николай Перцов, сотрудник Института русского языка РАН, около тридцати лет посвятил изучению рукописей русских писателей и поэтов. Он уверен, что в черновиках – целая параллельная вселенная с множеством деталей, о которых даже не все специалисты знают. "Очень интересно сопоставлять черновые варианты и окончательные, поскольку видно движение мысли", – говорит ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН Николай Перцов. На страницах первого черновика "Онегина" он недавно обнаружил, что Евгений родился вовсе не "на брегах Невы", а в деревне. И это благодаря одному эпитету – "патриархальный", который Николай прочел в рукописях. "Это удивительно. То есть у него сначала мысль была такая, что, может быть, сначала Онегина поместить в деревню, а потом – в Петербург. Он отказался от эпитета "патриархальный", и он неизвестен пушкиноведению", – объясняет ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН Николай Перцов.
Но зачем ученому-лингвисту понадобились услуги программиста? Дело в том, что расшифровывать любые черновики или рукописи – задача не самая простая. Во-первых, почерк: многое просто невозможно разобрать. Но главная трудность – это слова, зачеркнутые автором или цензором. И тут на помощь уставшим глазам филолога приходит искусственный интеллект. Здесь мы стали свидетелями научного открытия: Дмитрий Николаев с помощью натренированной нейросети смог убрать зачеркивание, и слово предстало в изначальном виде. Это восьмая глава "Евгения Онегина". "Вас непрестанно змий зовет/К себе, к таинственному древу..." – слово "таинственному" написано над зачеркнутым "погибельному". Именно такой эпитет Пушкин придумал изначально, но затем отказался. Для того чтобы осуществить такое расчеркивание, нейросеть долго учили читать пушкинские рукописи. "Нам потребовался большой набор зачеркнутых и незачеркнутых слов из автографов Пушкина. После чего одна нейросеть пыталась зачеркивать слова, которые не были зачеркнуты. А вторая пыталась отличить от настоящих зачеркнутых слов те, что первая зачеркнула", – рассказывает технический директор компании "Смарт Энджинс" Дмитрий Николаев.
Как работает эта система, Дмитрий объяснил с помощью этого видео. В достоверности результатов можно не сомневаться, потому что эта программа устроена как генеративно-состязательная сеть. Проще говоря, одна ее часть расчеркивает и предлагает вариант, другая – проверяет, насколько этот вариант правдоподобен. Перспективы у этой системы большие: ее можно натренировать на почерк любого классика. И, возможно, в скором времени нас ждет немало сенсационных открытий и новых прочтений.
