«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История» » Ваш Выбор Инноваций

«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»

История 17-02-2018, 07:00 Викторина 162 0

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре


«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»


Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык.


Татарская литература в цифре?

На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений.

Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми.


Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.)

Чего у нас нет?

Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но.

Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь.

Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах.


Биографические сведения об имамах Тетюшского и Чистопольского уездов

Что уже есть в интернете?

После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны.

Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов.

Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту.

В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо.

Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много.

Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн.


«Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама».

Зачем все это нужно?

Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники).

Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста.

Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время.

Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу.

Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю.


Альфрид Бустанов
Справка


Альфрид Бустанов

  • Ph.D. (Amsterdam University, 2013)
  • Профессор факультета истории в Европейском университете в Санкт-Петербурге.
  • Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык. Татарская литература в цифре? На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений. Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми. Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.) Чего у нас нет? Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но. Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь. Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах. Биографические сведения об имамах Тетюшского и Чистопольского уездов Что уже есть в интернете? После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны. Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов. Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту. В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо. Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много. Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн. «Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама». Зачем все это нужно? Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники). Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста. Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время. Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу. Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю. Альфрид Бустанов Справка Альфрид Бустанов Ph.D. (Amsterdam University, 2013) Профессор факультета истории в Европейском университете в Санкт-Петербурге. Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Похожие новости
Гид по Советскому району Казани: от Клыковки до Царицыно - «Образование»

Малоизвестное о казанском районе рабочих, студентов и ученых Фото: pastvu.com Советский район Казани в...

Подробнее 0
«Промо-акция»: почему можно брать квартиру в бывшей промзоне - «Дайджест»

Мария Гуреева Источник: Domofond.ru В любом крупном городе есть промышленные площадки. Некоторые из них...

Подробнее 0
Тубдиспансер на «золотой земле» в центре Казани превратился в трущобу - «Медицина»

Казанцы возмущены плачевным состоянием 114-летнего здания противотуберкулезного диспансера, ставшего...

Подробнее 0
Далеко идущая планировка. Апартаменты могут подорожать на фоне их возможной легализации - «Дайджест»

Марина Трубилина Источник: Российская газета Возможная легализация апартаментов, о которой в четверг...

Подробнее 0

Оставить комментарий
Ваш Выбор Инноваций

Важнейшие события в России и в мире Фото: Олег Тихонов В 2017-м Казань снова приняла крупные международные...

Подробнее 08-янв-2020

Минниханов раскритиковал повестку федеральных СМИ и пригрозил тем, кто против Стратегии Путина Фото: Максим...

Подробнее 14-дек-2018

Казанский эксперт-филолог Татьяна Шахматова объясняет, в чем ошибочность сравнений реконструктора-убийцы с...

Подробнее 18-ноя-2019

Проект «Реального времени»: от Татарии — к Татарстану, часть 214-я Фото: предоставлено АО «Татспиртпром»...

Подробнее 19-мар-2020

Цикл интервью к 80-летию начала Второй мировой. Часть 14-я: Советско-финляндская война Фото: namednibook.ru...

Подробнее 10-ноя-2019

«Мозаика воспоминаний» татарстанского историка. Часть 3-я Фото: Максим Платонов Директор Института истории...

Подробнее 30-ноя-2019

«Аутотранспорт» краеведа Алексея Клочкова. Часть 35-я Фото: Н.А. Казем-Бек за рулем своей самоходной коляски...

Подробнее 18-авг-2020

Недвижимые туристические достопримечательности одной из крупнейших бизнес-династий Казани Фото: Из фондов...

Подробнее 26-ноя-2020

Яндекс.Метрика