«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История» » Ваш Выбор Инноваций

«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»

История 17-02-2018, 07:00 Викторина 148 0

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре


«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»


Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык.


Татарская литература в цифре?

На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений.

Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми.


Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.)

Чего у нас нет?

Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но.

Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь.

Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах.


Биографические сведения об имамах Тетюшского и Чистопольского уездов

Что уже есть в интернете?

После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны.

Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов.

Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту.

В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо.

Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много.

Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн.


«Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама».

Зачем все это нужно?

Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники).

Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста.

Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время.

Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу.

Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю.


Альфрид Бустанов
Справка


Альфрид Бустанов

  • Ph.D. (Amsterdam University, 2013)
  • Профессор факультета истории в Европейском университете в Санкт-Петербурге.
  • Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык. Татарская литература в цифре? На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений. Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми. Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.) Чего у нас нет? Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но. Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь. Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах. Биографические сведения об имамах Тетюшского и Чистопольского уездов Что уже есть в интернете? После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны. Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов. Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту. В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо. Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много. Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн. «Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама». Зачем все это нужно? Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники). Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста. Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время. Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу. Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю. Альфрид Бустанов Справка Альфрид Бустанов Ph.D. (Amsterdam University, 2013) Профессор факультета истории в Европейском университете в Санкт-Петербурге. Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Похожие новости
Хроники дефолтного года: разгром Госкомстата, грязные пляжи Казани, мисс Татарстана — будущая модель Victoria's Secret - «Власть»

Спецпроект «Реального времени»: какой была жизнь Татарстана до и после первого и единственного...

Подробнее 0
Куда пойти в Казани с 1 по 8 января: афиша мероприятий на новогодние праздники - «История»

Расписание концертов, выставок, работы катков, мероприятий для детей в Казани и за городом Фото: Максим...

Подробнее 0
«Золотые зубы»: птенцы экс-главы «Татнефти» вернули миллиардный оборот своим зубным клиникам - «Медицина»

Ирек Галиев вышел из состава учредителей «Стомуса» и полностью посвятил себя развитию сети «Жар-Свежар»...

Подробнее 0
Почему сотрудники «портятся» после испытательного срока - «Бизнес»

Наталия Венерова (Сторожева) Источник: Executive.ru Почему у новых сотрудников снижается мотивация, и что с...

Подробнее 0

Оставить комментарий
Ваш Выбор Инноваций

В Казани презентовали дополненный том научной серии «Народы и культуры», не все прошло гладко Фото: kpfu.ru...

Подробнее 02-ноя-2018

Потомок легендарного предпринимателя Николая фон Мекка рассказал «Реальному времени», как его прапрадед...

Подробнее 19-фев-2020

Удивительная история «Первого соборного» мусульманского храма столицы Татарстана. Часть 9 Фото:...

Подробнее 09-мая-2020

Проект «Реального времени»: от Татарии — к Татарстану, часть 33-я 19 июля 1920 года была учреждена...

Подробнее 20-сен-2019

Чем примечательна дата 15 апреля Фото: yandex.ru Сегодня, 15 апреля, Международный день культуры, он...

Подробнее 15-апр-2021

Большая рокировка в руководстве республики и районов, новые ограничения в продаже алкоголя, коровы-призраки...

Подробнее 23-сен-2019

Чем примечательна дата 31 августа Фото: ЦГКФФА Украины им. Г. С. Пшеничного/lenta.ru Сегодня, 31 августа, в...

Подробнее 31-авг-2021

Абдулазис Кильдеев — неизвестный автор известных мелодий Фото: Деревня Большие Полянки (Иса авылы, в 1910...

Подробнее 27-фев-2019

Яндекс.Метрика