«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История» » Ваш Выбор Инноваций

«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»

История 17-02-2018, 07:00 Викторина 154 0

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре


«Обессмертить» татарский язык: цифровые возможности для пытливого исследователя - «История»


Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык.


Татарская литература в цифре?

На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений.

Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми.


Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.)

Чего у нас нет?

Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но.

Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь.

Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах.


Биографические сведения об имамах Тетюшского и Чистопольского уездов

Что уже есть в интернете?

После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны.

Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов.

Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту.

В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо.

Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много.

Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн.


«Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама».

Зачем все это нужно?

Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники).

Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста.

Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время.

Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу.

Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю.


Альфрид Бустанов
Справка


Альфрид Бустанов

  • Ph.D. (Amsterdam University, 2013)
  • Профессор факультета истории в Европейском университете в Санкт-Петербурге.
  • Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».

Колонка историка-востоковеда Альфрида Бустанова о татарской литературе в цифре Колумнист «Реального времени» Альфрид Бустанов немало работает с арабографичными источниками. В сегодняшней авторской колонке, написанной для нашей интернет-газеты, исследователь рассматривает интернет-ресурсы, в которых можно найти старинные документы и образцы татарской литературы. По мнению исследователя, открытый доступ к древним текстам позволит сохранить родной язык. Татарская литература в цифре? На протяжении последних 15 лет почти каждый день моей жизни связан с чтением древних текстов на арабской графике. В бытность голодным студентом я работал непосредственно в архивах, а со временем стал все больше сканировать и работать с электронными файлами. На компьютере можно увеличить изображение рукописи многократно, отличить точки под буквой «п» от следов жуков и тараканов, да и вообще путешествовать с нужными книгами по всему свету. Цифровая революция изменила наш мир до неузнаваемости. Даже такие книжные черви, как я, не остаются в стороне от этих быстрых изменений. Работа с рукописными текстами — это увлекательное путешествие, требующее внимательности и опыта (чем больше начитанных текстов — тем лучше). В электронном мире тем не менее многое упрощается: на смену сотням редких словарей пришли базы данных и даже полнотекстовые варианты классической литературы. Сейчас за пару кликов в интернете можно найти тот или иной хадис, встречающийся в рукописи, или соответствующий стих из «Маснави» Джалал ад-Дина Руми. Фрагмент сочинения «История Золотой Орды» Галимджана Шарафа (1916 г.) Чего у нас нет? Все это вдохновляет и облегчает работу (на которую в прежние времена уходили бы недели упорных поисков). Тем не менее, есть одно но. Для текстологической работы в области татарской литературы электронная база текстов практически не существует. Да, при желании можно найти разной степени качества сканы и вордовские тексты, изданные в течение XX века, но это касается почти исключительно текстов на кириллице. Основная часть литературы на татарском языке, созданная между XV—XX веками на арабской графике, просто не существует в интернете. Фундаментальная работа по оцифровке и выработке алгоритмов по распознанию и классификации рукописных текстов требует огромных сил, финансов и времени. При этом мы реально находимся сейчас в положении, когда даже элементарная работа по каталогизации не доведена до какого-то удовлетворительного уровня (за исключением героической работы коллег по персидским коллекциям). Чтобы найти какие-то сведения в тысячах рукописных книг, по-прежнему нужно просматривать каждую из них и пробираться через лабиринты неизведанного. В электронный век такой стиль работы — невиданная роскошь. Я уверен, что любые вложения в направлении оцифровки, электронной публикации и интерпретации больших массивов татарской литературы на арабской графике окупятся сторицей. Мало того, что речь идет о надежном сохранении богатейшего письменного наследия, перед нами открываются перспективы лингвистического, исторического и экономического анализа, попросту невозможные при традиционных филологических приемах. Биографические сведения об имамах Тетюшского и Чистопольского уездов Что уже есть в интернете? После ритуального плача о том, чего у нас нет, но хотелось бы иметь, я хотел бы сделать небольшой обзор тех инструментов, которые все-таки доступны тем, кто работает с тюркоязычной литературой на арабской графике. Думаю, что это будет полезно как для начинающих специалистов, так и для любителей, интересующихся прошлым нашей страны. Надо сказать, что Академия наук Республики Татарстан уже проводит большую работу по оцифровке арабографической литературы, вкупе с электронными базами словарей и другими «девайсами». Недавно АН РТ сделала нам подарок и выставила все имеющиеся продукты онлайн. Копии ряда рукописных книг представлены на портале Manuscripta Islamica Rossica. Выпуски знаменитого татарского журнала «Шура» доступны в формате pdf на сайте Российской национальной библиотеки. Посильную работу в деле электронной публикации религиозных текстов осуществляет проект «Дар ал-кутуб», где представлены pdf-копии дореволюционных изданий на татарском и арабском языках. Есть здесь и некоторые рукописи, но совершенно лишенные аннотаций. Кроме того, недавно нами был запущен проект «Исламская литература в России», где мы планируем выставлять набранные тексты, а также сканы письменных памятников из государственных и частных архивов. Мне кажется важным начинанием сайт «Шигърият», на котором любой желающий может найти образцы татарской поэзии, в том числе дореволюционного периода. Тексты, правда, представлены исключительно в кириллическом шрифте, но даже в таком виде можно идентифицировать рукописный текст по фрагменту. В своей работе я часто прибегаю к богатому Корпусу татарского языка. Здесь тоже нет текстов на арабской графике, но зато можно увидеть примеры словоупотреблений из достаточно широкой выборки текстов в основном XX века. Главная проблема, на мой взгляд, — база в основном опирается на журналистские статьи и художественную литературу, доступную для включения в Корпус. Религиозные тексты представлены в Корпусе очень слабо. Для тех, кто изучает виды арабской графики применительно к татарскому языку, можно посоветовать небольшой «технический» сайт, посвященный транслитерации из «иске имля» в кириллицу и обратно (правда, он уже исчез из онлайн-доступа). Что-то я мог упустить из виду или забыть, но подобных ресурсов в интернете в самом деле не так много. Все это, конечно, отдельные важные инициативы, но в целом мало сравнимые с аналогичными базами текстов на арабском и персидском языках, доступными онлайн. «Переписана эта книга муллой Габделмажитом в медресе муллы Габдессалама». Зачем все это нужно? Есть несколько самых очевидных направлений работы, которые напрашиваются сами. Первое — это история понятий. На протяжении столетий поколения людей говорили на татарском языке о каких-то вещах, важных для них в повседневной жизни. Обсуждение ключевых категорий культуры постепенно складывалось в некий пучок понятий, эволюционировавших вместе с обществом. Как понималась «справедливость» мишарами где-нибудь в Саратовской губернии? Что есть «совесть» и «честь» для татар в Астрахани середины XIX века? Обсуждение и эволюцию подобных понятий можно проследить на большом массиве данных из самых разных текстов, которые сохранились до наших дней (письма, закладные, работы по фикху, исторические хроники). Второе — это имена и биографии. В татарских рукописях отложились тысячи имен людей, их биографии, чувства и деяния. Кто-то из них включен в специальные биографические словари, а кто-то между делом упомянут на листе 78б одного из бесчисленных правовых трактатов. Все это можно собрать, классифицировать и анализировать с помощью оцифровки и распознания текста. Еще одно из очевидного — это география. В нашем распоряжении огромное количество упоминаемых топонимов, разбросанных по всей стране. Если распределить имеющиеся тексты на карте, то мы можем размышлять о том, почему те или иные формы творчества развивались в тех или иных регионах в то или иное время. Иными словами, перспективы огромны, как огромен и потенциал прироста знания. Особенно в том плане, что мы сейчас пока не знаем, какие вопросы можно будет задавать нашим рукописям завтра, когда они уже будут готовы к цифровому анализу. Самое главное, конечно, это возможность открыть бездонные ресурсы библиотек и архивов для широкого доступа — будь это исследователи или студенты в любой точке мира. У нас слишком много текстов и слишком мало специалистов, чтобы работать по старинке. Лучший способ «обессмертить» текст (а вместе с ним и язык) это сделать его максимально доступным современному читателю. Альфрид Бустанов Справка Альфрид Бустанов Ph.D. (Amsterdam University, 2013) Профессор факультета истории в Европейском университете в Санкт-Петербурге. Автор книг Soviet Orientalism and the Creation of Central Asian Nations (London — New York, 2015) и «Книжная культура сибирских мусульман» (Москва, 2012). Колумнист «Реального времени».
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
Похожие новости
Налог на недвижимость как профанация справедливости - «Недвижимость»

Люксовое имущество должно облагаться не символической оплатой в несколько сотен гривен, а нормальным налогом...

Подробнее 0
Региональный следком начал проверку по факту ЧП на шахте «Листвяжная» - «Происшествия»

Сюжет ЧП на шахте «Листвяжная» 25 ноября 2021 Следственный комитет РФ Кемерово, 25 ноября - АиФ-Кузбасс....

Подробнее 0
Зарубежная недвижимость: оплата налогов во время пандемии - «Зарубежная недвижимость»

Источник: HomesOverseas.ru Несмотря на то, открыты границы или закрыты, собственникам недвижимости за...

Подробнее 0
Ябанджи среди чужих: городу две тысячи лет (и еще 200) — это Бурса - «Инфраструктура»

Авторская колонка Радифа Кашапова о татарах Анатолии. Часть третья Фото: Радиф Кашапов (исторический район...

Подробнее 0

Оставить комментарий
Ваш Выбор Инноваций

Из книги «…Окаянная дщерь Златой орды…»: к 750-летию Улуса Джучи. Часть 1 Фото: Максим Платонов Историк и...

Подробнее 25-мар-2019

Чем примечательна дата 15 сентября Фото: Максим Платонов Сегодня, 15 сентября, в мире празднуют день...

Подробнее 15-сен-2021

С установкой статуи хану в Болгаре отказали, зато ей будут рады в Тетюшах Фото: Илья Репин Болгария...

Подробнее 30-авг-2018

Татарстанские коммунисты предложили губернатору Калужской области пройти медосмотр Фото: gossov.tatarstan.ru...

Подробнее 27-авг-2019

Историк Ильнур Миргалеев о формировании международной политики Золотой Орды в период ее становления. Часть 2...

Подробнее 15-апр-2019

Из истории татарского предпринимательства Фото: редакция и типография газеты «Баянуль-хак». Начало XX века В...

Подробнее 30-апр-2021

Подготовка переворота в Азербайджане, зарубежная недвижимость и Сусурлук-гейт Фото: dpa/Lehtikuva Wennström...

Подробнее 09-мар-2020

История пенного напитка в Казани: от Ивана Грозного до «Белого Кремля» Фото: Олег Тихонов Летом в Чистополе...

Подробнее 24-апр-2018

Яндекс.Метрика