«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История» » Ваш Выбор Инноваций

«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»

История 17-02-2018, 07:00 Викторина 148 0

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре


«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»


Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык.


Татарская литература в цифре?

На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений.

Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми.


Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.)

Чего у нас нет?

Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но.

Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь.

Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах.


Биографические сведения об имамах Тетюшского и Чистопольского уездов

Что уже есть в интернете?

После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны.

Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов.

Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту.

В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо.

Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много.

Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн.


«Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама».

Зачем все это нужно?

Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники).

Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста.

Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время.

Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу.

Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю.


Альфрид Бустанов
Справка


Альфрид Бустанов

  • Ph.D. (Amsterdam University, 2013)
  • Профессор факультета истории в Европейском университете в Санкт-Петербурге.
  • Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык. Татарская литература в цифре? На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений. Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми. Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.) Чего у нас нет? Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но. Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь. Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах. Биографические сведения об имамах Тетюшского и Чистопольского уездов Что уже есть в интернете? После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны. Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов. Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту. В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо. Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много. Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн. «Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама». Зачем все это нужно? Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники). Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста. Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время. Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу. Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю. Альфрид Бустанов Справка Альфрид Бустанов Ph.D. (Amsterdam University, 2013) Профессор факультета истории в Европейском университете в Санкт-Петербурге. Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Похожие новости
Татарстан бросит на борьбу с раком 6,6 миллиарда - «Медицина»

Госсовет Татарстана рассмотрел в первом чтении бюджет-2020 и бюджет Территориального фонда обязательного...

Подробнее 0
Великая Отечественная война в миниатюре представлена в Казанском Кремле - «Образование»

О дорогом хобби, которым занимаются состоятельные люди Фото: Максим Платонов Известный казанский адвокат...

Подробнее 0
МИЭЛЬ Офис «В Ногинске»: открыты продажи новых квартир в жилом доме «Захарченко 5» (г. Электросталь) - «Новости компаний»

Группа компаний «МИЭЛЬ» Офис «В Ногинске» МИЭЛЬ Офис «В Ногинске» приступает к продажам квартир в новом,...

Подробнее 0
Герман Дьяконов о годовщине ареста: «Требую, чтобы это беззаконие было прекращено!» - «Образование»

Обвиняемый в мошенничествах на 64 млн рублей экс-ректор КХТИ обратился с заявлением к Верховному суду...

Подробнее 0

Оставить комментарий
Ваш Выбор Инноваций

Стратегия развития татарского народа должна начинаться с формирования национального капитала Фото: vk.com В...

Подробнее 30-янв-2019

Незадолго до кончины она получила высшую профессиональную награду Фото: Ринат Назметдинов В Казани...

Подробнее 29-июн-2021

Чем примечательна дата 20 сентября Фото: из фондов Елабужского государственного музея-заповедника Сегодня,...

Подробнее 20-сен-2021

«Реальное время» публикует очередной отрывок из мемуаров директора Института истории им. Ш. Марджани Фото:...

Подробнее 20-янв-2018

Политолог Борис Межуев о разновидностях феминизма в России и мире и влиянии гомосексуализма и БДСМ-культуры...

Подробнее 24-июн-2018

Казань, Крым, Москва: родственные связи, материнская забота и геополитика Фото: history-doc.ru «Реальное...

Подробнее 04-дек-2018

Чем примечательна дата 18 марта Фото: wikipedia.org Сегодня, 18 марта, — важная дата в истории нашей страны...

Подробнее 18-мар-2021

Из книги «…Окаянная дщерь Златой орды...»: к 750-летию Улуса Джучи. Часть 7-я Булат Хамидуллин, историк и...

Подробнее 14-мая-2019

Яндекс.Метрика