«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История» » Ваш Выбор Инноваций

«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»

История 17-02-2018, 07:00 Викторина 151 0

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре


«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»


Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык.


Татарская литература в цифре?

На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений.

Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми.


Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.)

Чего у нас нет?

Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но.

Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь.

Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах.


Биографические сведения об имамах Тетюшского и Чистопольского уездов

Что уже есть в интернете?

После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны.

Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов.

Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту.

В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо.

Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много.

Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн.


«Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама».

Зачем все это нужно?

Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники).

Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста.

Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время.

Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу.

Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю.


Альфрид Бустанов
Справка


Альфрид Бустанов

  • Ph.D. (Amsterdam University, 2013)
  • Профессор факультета истории в Европейском университете в Санкт-Петербурге.
  • Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык. Татарская литература в цифре? На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений. Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми. Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.) Чего у нас нет? Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но. Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь. Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах. Биографические сведения об имамах Тетюшского и Чистопольского уездов Что уже есть в интернете? После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны. Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов. Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту. В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо. Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много. Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн. «Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама». Зачем все это нужно? Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники). Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста. Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время. Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу. Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю. Альфрид Бустанов Справка Альфрид Бустанов Ph.D. (Amsterdam University, 2013) Профессор факультета истории в Европейском университете в Санкт-Петербурге. Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Похожие новости
Частные дома за год подорожали на 4%. Рейтинг регионов России - «Аналитика рынка»

Источник: Мир Квартир Ажиотаж на рынке недвижимости, продолжающийся уже год, затронул и сегмент частных...

Подробнее 0
Заколдованное место: под Казанью снова судят главу Семиозерки - «Происшествия»

По версии СК, 31-летний чиновник посодействовал незаконному отчуждению участка и его зачистке от вековых...

Подробнее 0
Сбербанк будет выдавать ипотеку россиянам с 18 лет - «Недвижимость»

Сбербанк в среду снизил минимальный возраст ипотечных заемщиков на три года - до 18 лет, следует из...

Подробнее 0
«Метриум Групп» начинает продажи в ЖК «Альфа Центавра» - «Новости компаний»

Елена Кудымова Источник: Метриум Групп Компания «Метриум Групп» приступила к реализации квартир в ЖК «Альфа...

Подробнее 0

Оставить комментарий
Ваш Выбор Инноваций

А о перспективе расширения НАТО никто не подумал Фото: Александр Алешкин (sobesednik.ru) «Реальное время»...

Подробнее 07-июн-2020

Купец и меценат Загидулла Шафигуллин. Часть 3: сыновья-компаньоны, приданое дочерям и просветительство Фото:...

Подробнее 06-июн-2019

Как получить 1,5 млн евро от Запада? Интервью с историком и исламоведом Альфридом Бустановым: часть 1 Фото:...

Подробнее 14-авг-2018

Проект «Реального времени»: от Татарии — к Татарстану. Часть 6-я Фото: предоставлено Государственным архивом...

Подробнее 24-авг-2019

В Кронштадте стартовали съемки фильма Тимура Бекмамбетова «Побег из ада» о подвиге летчика Михаила Девятаева...

Подробнее 18-фев-2020

Бывший тренер «волков» начинает новый путь в «Сочи», а нынешний пытается найти выход из кризиса Фото:...

Подробнее 06-окт-2021

Жизнь татарской диаспоры в одной из крупнейших стран Средней Азии. Ч. 1 Фото: Татары Ташкента. Фото начала...

Подробнее 04-янв-2019

«Великая Татария» казанского историка. Часть 19-я Фото: wikimedia.org Научный руководитель Института истории...

Подробнее 15-авг-2020

Яндекс.Метрика