Томский политехнический университет (ТПУ) совместно с коллегами из других вузов приступил к исследованию двух исчезающих обско-угорских языков — ваховского хантыйского и сосьвинского мансийского. Проект, поддержанный грантом Российского научного фонда (РНФ), направлен на создание цифрового корпуса данных, который станет основой для разработки онлайн-тренажеров и языковых моделей, сообщили в пресс-службе вуза.
Оба языка, входящие в число 136 исчезающих языков России, имеют статус «серьезно уязвимые». На хантыйском языке говорит около 9,5 тысяч человек, а на мансийском — всего около тысячи. Исследователи отмечают, что нарушена естественная межпоколенная передача языка, а среди учителей недостаточно носителей, способных обучать детей.
В рамках проекта ученые собирают живую речь носителей языка и обрабатывают аудиофайлы с разметкой на глоссы и переводом на русский язык. Полученные данные будут загружены в лингвистическую лабораторию «Лингводок». По словам Виктории Воробьевой, руководителя проекта, исследование позволит уточнить морфологические характеристики языков и создать новые продукты, такие как этимологические онлайн-словарь и тренажеры для обучения.
Исследование также направлено на изучение взаимосвязей между грамматическими структурами хантыйского и мансийского языков. Ученые планируют продолжить сбор данных в местах проживания коренного населения, чтобы сохранить уникальное языковое наследие для будущих поколений.
