Опережая время: татарский онлайн-переводчик заинтересовал башкир - «Образование» » Ваш Выбор Инноваций

Опережая время: татарский онлайн-переводчик заинтересовал башкир - «Образование»

Образование 25-10-2019, 18:20 Calhoun 131 0

В Казани презентовали русско-татарский машинный переводчик «Татсофт»


Опережая время: татарский онлайн-переводчик заинтересовал башкир - «Образование»
Фото: Ринат Назметдинов


Казанские специалисты разработали русско-татарский машинный переводчик Tatsoft. С помощью сайта любой пользователь сможет переводить с языка Пушкина на язык Тукая и обратно. Презентация проекта состоялась сегодня в Казани. Что предлагает система, насколько она лучше «Яндекса» и чем заинтересовались в Уфе — в репортаже корреспондента «Реального времени».


Опередили время

Сегодня в Казани состоялась презентация русско-татарского машинного переводчика «Татсофт». Мероприятие прошло на площадке молодежного центра «Сэлэт». Сервис, работающий на основе нейросетевых технологий, представляет собой онлайн-переводчик с русского языка на татарский и с татарского на русский.

Чтобы перевести необходимую фразу с русского на татарский и наоборот, достаточно набрать ее в специальном поле на сайте translate.tatar и кликнуть «перевести». Кроме этого, система предлагает озвучивание результатов перевода на татарском и русском языках, двуязычный интерфейс и возможности оценки качества работы. Программа самообучающаяся.

Если пользователю перевод покажется некорректным, он может поставить «дизлайк». Это предложение или словосочетание попадет в специальную базу, которую рассмотрят специалисты, чтоб в последующем предложить правильный вариант перевода.

Проект разработан коллективом Института прикладной семиотики Академии наук Республики Татарстан (ИПС АН РТ). Как рассказал корреспонденту «Реального времени» директор ИПС АН РТ Джавдет Сулейманов, технологию разрабатывали пять человек. К работе привлекались филологи-лингвисты, переводчики, программисты.

В совокупности над сервисом трудились порядка 60 человек. И над этим проектом специалисты работали 30 лет.

— Более акцентированно мы начали работать над ним с начала 2014 года в рамках государственной программы, — отметил заместитель директора института Ринат Гильмуллин в беседе с нашим корреспондентом. — По нашим обязательствам мы должны были показать свой продукт в следующем году. Но мы опередили время.

Пять лет назад татарстанские айтишники начали сотрудничество с компаниями ABBYY и «Яндекс». В 2018 году ИПС АН РТ разработал первую версию переводчика. В основе подхода была выбрана архитектура encoder-decoder-attention. В 2019 году система была обновлена: построены модели на базе архитектуры Transformer, использовались алгоритмы внедрения языковых моделей в нейросеть. Впервые для русско-татарской пары были проведены эксперименты по использованию параллельных данных для других языков с целью переноса знаний (transfer learning).

Неосвоенный «птичий язык»

В качестве основных обучающих данных используется созданный параллельный корпус объемом 983,3 тыс. пар русско-татарских предложений, включающий тексты новостей, художественную литературу, нормативно-правовые акты. В планах — набрать 10 млн пар предложений.

Как сообщил Сулейманов, всего на создание базы переводчика ушло порядка 40 млн рублей.

По его словам, сайт смогли запустить благодаря АО «СМП-Нефтегаз», которое предоставило им мощный сервер стоимостью 18 млн рублей.

Во время презентации старший научный сотрудник ИПС АН РТ Айдар Хусаинов подчеркнул, что переводчик пригодится 5 млн носителям татарского языка, тем, кто желает освоить «туган тел», журналистам, переводчикам, школьникам и студентам. Кроме того, в Татарстане татарский наряду с русским является государственным, поэтому документы, надписи дублируются на двух языках.

Более того, он предложил присутствующим сказать какую-нибудь фразу на русском или татарском и опробовать переводчик в деле. Собравшиеся предлагали как простые предложения, так и довольно сложные. В целом сервис достойно справился. Даже смог неплохо перевести пушкинские строки из стихотворения «К***»: «Я помню чудное мгновенье…».

Заминка произошла при переводе на русский названия лакомства «кош теле». Система упорно предлагала варианты «птичий язык» и «язык птиц». Хотя те, кто пробовал это блюдо, понимают, что речь идет о сладком хворосте.

— Разным названиям, именам собственным, фразеологизмам программе еще предстоит учиться, — выкрутился Хусаинов.

Заинтересовались в Башкирии

Подобный сервис (русско-татарский переводчик) есть и у компании «Яндекс». Но Сулейманов и Гильмуллин уверены, что их разработка лучше всех аналогов. Поэтому продукт заинтересовал и другие регионы. Например, в Башкортостане (АН РБ и УФИЦ РАН) теперь тоже хотят взять на вооружение ноу-хау казанцев.

— Башкиры хотят вместе с нами создать свой переводчик — русско-башкирский, — говорит Сулейманов. — Этот проект мы готовы предложить всем народам Российской Федерации, поскольку мы знаем, как это делать. Наши технологии могут работать в любых парах.

В частности, уфимский создатель Машинного фонда башкирского языка Зиннур Сиразетдинов, заведующий лабораторией лингвистики и информационных технологий УФИЦ РАН, хочет работать с казанскими коллегами. Также к татарстанцам обращались ученые из республик Средней Азии.


Тимур Рахматуллин, фото Рината Назметдинова
Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.
В Казани презентовали русско-татарский машинный переводчик «Татсофт» Фото: Ринат Назметдинов Казанские специалисты разработали русско-татарский машинный переводчик Tatsoft. С помощью сайта любой пользователь сможет переводить с языка Пушкина на язык Тукая и обратно. Презентация проекта состоялась сегодня в Казани. Что предлагает система, насколько она лучше «Яндекса» и чем заинтересовались в Уфе — в репортаже корреспондента «Реального времени». Опередили время Сегодня в Казани состоялась презентация русско-татарского машинного переводчика «Татсофт». Мероприятие прошло на площадке молодежного центра «Сэлэт». Сервис, работающий на основе нейросетевых технологий, представляет собой онлайн-переводчик с русского языка на татарский и с татарского на русский. Чтобы перевести необходимую фразу с русского на татарский и наоборот, достаточно набрать ее в специальном поле на сайте translate.tatar и кликнуть «перевести». Кроме этого, система предлагает озвучивание результатов перевода на татарском и русском языках, двуязычный интерфейс и возможности оценки качества работы. Программа самообучающаяся. Если пользователю перевод покажется некорректным, он может поставить «дизлайк». Это предложение или словосочетание попадет в специальную базу, которую рассмотрят специалисты, чтоб в последующем предложить правильный вариант перевода. Проект разработан коллективом Института прикладной семиотики Академии наук Республики Татарстан (ИПС АН РТ). Как рассказал корреспонденту «Реального времени» директор ИПС АН РТ Джавдет Сулейманов, технологию разрабатывали пять человек. К работе привлекались филологи-лингвисты, переводчики, программисты. В совокупности над сервисом трудились порядка 60 человек. И над этим проектом специалисты работали 30 лет. — Более акцентированно мы начали работать над ним с начала 2014 года в рамках государственной программы, — отметил заместитель директора института Ринат Гильмуллин в беседе с нашим корреспондентом. — По нашим обязательствам мы должны были показать свой продукт в следующем году. Но мы опередили время. Пять лет назад татарстанские айтишники начали сотрудничество с компаниями ABBYY и «Яндекс». В 2018 году ИПС АН РТ разработал первую версию переводчика. В основе подхода была выбрана архитектура encoder-decoder-attention. В 2019 году система была обновлена: построены модели на базе архитектуры Transformer, использовались алгоритмы внедрения языковых моделей в нейросеть. Впервые для русско-татарской пары были проведены эксперименты по использованию параллельных данных для других языков с целью переноса знаний (transfer learning). Неосвоенный «птичий язык» В качестве основных обучающих данных используется созданный параллельный корпус объемом 983,3 тыс. пар русско-татарских предложений, включающий тексты новостей, художественную литературу, нормативно-правовые акты. В планах — набрать 10 млн пар предложений. Как сообщил Сулейманов, всего на создание базы переводчика ушло порядка 40 млн рублей. По его словам, сайт смогли запустить благодаря АО «СМП-Нефтегаз», которое предоставило им мощный сервер стоимостью 18 млн рублей. Во время презентации старший научный сотрудник ИПС АН РТ Айдар Хусаинов подчеркнул, что переводчик пригодится 5 млн носителям татарского языка, тем, кто желает освоить «туган тел», журналистам, переводчикам, школьникам и студентам. Кроме того, в Татарстане татарский наряду с русским является государственным, поэтому документы, надписи дублируются на двух языках. Более того, он предложил присутствующим сказать какую-нибудь фразу на русском или татарском и опробовать переводчик в деле. Собравшиеся предлагали как простые предложения, так и довольно сложные. В целом сервис достойно справился. Даже смог неплохо перевести пушкинские строки из стихотворения «К***»: «Я помню чудное мгновенье…». Заминка произошла при переводе на русский названия лакомства «кош теле». Система упорно предлагала варианты «птичий язык» и «язык птиц». Хотя те, кто пробовал это блюдо, понимают, что речь идет о сладком хворосте. — Разным названиям, именам собственным, фразеологизмам программе еще предстоит учиться, — выкрутился Хусаинов. Заинтересовались в Башкирии Подобный сервис (русско-татарский переводчик) есть и у компании «Яндекс». Но Сулейманов и Гильмуллин уверены, что их разработка лучше всех аналогов. Поэтому продукт заинтересовал и другие регионы. Например, в Башкортостане (АН РБ и УФИЦ РАН) теперь тоже хотят взять на вооружение ноу-хау казанцев. — Башкиры хотят вместе с нами создать свой переводчик — русско-башкирский, — говорит Сулейманов. — Этот проект мы готовы предложить всем народам Российской Федерации, поскольку мы знаем, как это делать. Наши технологии могут работать в любых парах. В частности, уфимский создатель Машинного фонда башкирского языка Зиннур Сиразетдинов, заведующий лабораторией лингвистики и информационных технологий УФИЦ РАН, хочет работать с казанскими коллегами. Также к татарстанцам обращались ученые из республик Средней Азии. Тимур Рахматуллин, фото Рината Назметдинова
Похожие новости
ДТП с участием Казанской иконы Божией Матери — чудо на Малой Проломной - «История»

Забытая история из жизни дореволюционной весенней Казани Фото: Роман Хасаев Государственный праздник День...

Подробнее 0
Хорошего понемножку. Производственная недвижимость в Петербурге и Ленобласти - «Новости регионов»

Евгения Иванова Источник: NSP.RU Производственная недвижимость – самый закрытый сегмент рынка коммерческих...

Подробнее 0
Фотомарафон «100-летие ТАССР»: на обессоливании нефти, Шугурово, 1962 год - «История»

Проект «Реального времени»: от Татарии — к Татарстану. Часть 180-я Фото: из фондов Музея нефти (НГДУ...

Подробнее 0
«Их нравы»: как османские султаны обрели зеленый рай на Земле - «История»

Колумнист «Реального времени» об одной из столиц Османской империи — городе Бурсе Фото: wikipedia.org...

Подробнее 0

Оставить комментарий
Ваш Выбор Инноваций

Афиша мероприятий с 16 по 22 апреля Фото: ugraclassic.ru Вторая декада апреля будет пестрить событиями....

Подробнее 15-апр-2018

Взаимодействие компании «Сименс» с предприятиями Татарстана началось еще в советские годы Фото: reuters.com...

Подробнее 06-дек-2017

Одно из самых востребованных подразделений вуза — Институт международных отношений, истории и востоковедения...

Подробнее 31-мая-2018

Как в Казани проходит финальный этап литературной премии для детей и подростков «Глаголица» Фото: Екатерина...

Подробнее 29-авг-2025

Как Пелевин жаловался, что в Татарстане мало роботов, и обещал в будущем господство «темных заводов» Фото:...

Подробнее 17-апр-2018

Как фанатики от ислама «воюют» со школьной программой Фото: info-islam.ru Пока одни родители спорят о...

Подробнее 29-окт-2017

Перед началом учебного года татарстанским родителям советуют не давить на ребенка, подружиться с учителем и...

Подробнее 28-авг-2019

Опыт регионов в борьбе с пандемией, почему закрываются школы, и какое будущее у нефтехимии после объединения...

Подробнее 16-авг-2021

Яндекс.Метрика