fbpx
Сегодня
19:59 30 Мар 2023

Украинский стартап тренирует нейросеть распознавать крымскотатарский язык: как работает это решение

Фото: tommaso1979/Depositphots

Украинский стартап Respeecher тренирует нейросеть для распознавания крымскотатарского языка.

Об этом рассказали основатели проекта для "Украинской правды. Жизнь".

В чем проблема?

Еще во времена Второй мировой войны крымско-татарский народ испытывал унижение и пережил депортацию. В наше время, когда россия аннексировала Крым, коренное население снова подвергается притеснениям. Жилища татар обыскивают, их преследуют. Упадок испытал и крымско-татарский язык.

Какое решение?

Голосовые помощники, такие как Siri или Alexa, смогут распознавать команды, переводить текст, искать информацию.

По мнению авторов проекта, это поспособствует популяризации языка среди носителей. Команда Respeecher создавала синтезированные голоса для Голливуда, в частности, голос Дарта Вейдера и Люка Скайвокера для фильмов Star Wars.

Но в настоящее время разработчики ставят в приоритете популяризацию крымскотатарского языка.

Как это работает?

"Процесс сбора и анализа информации достаточно затратный: может занять от нескольких недель до нескольких месяцев, в зависимости от качества аудио. Впрочем, наша команда хочет, чтобы этот ресурс был бесплатным и доступным в открытых источниках. Верим, что это поможет в популяризации использования как украинского, так и крымскотатарского языка", – говорит технический директор и соучредитель Respeecher Дмитрий Белевцов.

Для того, чтобы научить нейросети, нужно около тысячи часов с записями на этом языке. Отправить свою аудиозапись можно через форму.

В стартапе просят делать запись в тихой комнате с минимально возможным количеством фоновых шумов.

"Чем больше отличных акцентов и тональностей модель искусственного интеллекта проанализирует, тем точнее будет результат распознавания языка", – отмечают разработчики.

Они уверяют, что никакие данные конкретных лиц не будут храниться, а по записям не будут синтезировать чужие голоса.

Их используют исключительно для обучения нейросети целому и лучшего распознавания крымскотатарской.

Этим ресурсом могут воспользоваться, как отдельные разработчики, чтобы улучшить аудио восприятие украинского языка в своем продукте, так и крупные корпорации, вроде Facebook, Google или помощники типа Siri.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Загрузить еще

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: