Украинский стартап тренирует нейросеть распознавать крымскотатарский язык: как работает это решение

Украинский стартап Respeecher тренирует нейросеть для распознавания крымскотатарского языка.

Об этом рассказали основатели проекта для «Украинской правды. Жизнь».

В чем проблема?

Еще во времена Второй мировой войны крымско-татарский народ испытывал унижение и пережил депортацию. В наше время, когда россия аннексировала Крым, коренное население снова подвергается притеснениям. Жилища татар обыскивают, их преследуют. Упадок испытал и крымско-татарский язык.

Какое решение?

Голосовые помощники, такие как Siri или Alexa, смогут распознавать команды, переводить текст, искать информацию.

По мнению авторов проекта, это поспособствует популяризации языка среди носителей. Команда Respeecher создавала синтезированные голоса для Голливуда, в частности, голос Дарта Вейдера и Люка Скайвокера для фильмов Star Wars.

Но в настоящее время разработчики ставят в приоритете популяризацию крымскотатарского языка.

Как это работает?

«Процесс сбора и анализа информации достаточно затратный: может занять от нескольких недель до нескольких месяцев, в зависимости от качества аудио. Впрочем, наша команда хочет, чтобы этот ресурс был бесплатным и доступным в открытых источниках. Верим, что это поможет в популяризации использования как украинского, так и крымскотатарского языка«, – говорит технический директор и соучредитель Respeecher Дмитрий Белевцов.

Для того, чтобы научить нейросети, нужно около тысячи часов с записями на этом языке. Отправить свою аудиозапись можно через форму.

В стартапе просят делать запись в тихой комнате с минимально возможным количеством фоновых шумов.

«Чем больше отличных акцентов и тональностей модель искусственного интеллекта проанализирует, тем точнее будет результат распознавания языка«, – отмечают разработчики.

Они уверяют, что никакие данные конкретных лиц не будут храниться, а по записям не будут синтезировать чужие голоса.

Их используют исключительно для обучения нейросети целому и лучшего распознавания крымскотатарской.

Этим ресурсом могут воспользоваться, как отдельные разработчики, чтобы улучшить аудио восприятие украинского языка в своем продукте, так и крупные корпорации, вроде Facebook, Google или помощники типа Siri.

Свіжі дописи

  • Новини

В украинского завода проект USAID заказал 300 вагонов-зерновозов: в чем решение

В этом году USAID у украинской компании "Карпаты" заказала 300 вагонов, что составляет 45% годового… Читати більше

Thursday May 16th, 2024
  • Новини

День уличной музыки и спорта: в Киев возвращается крупнейший благотворительный фестиваль

18 мая в Киеве состоится День уличной музыки и спорта — крупнейший благотворительный музыкальный фестиваль,… Читати більше

Thursday May 16th, 2024
  • Новини

Артиллерия и ПВО: Дания выделила 750 млн евро на военную помощь Украине

16 мая датское правительство решило выделить Украине новый пакет военной помощи на 750 млн евро,… Читати більше

Thursday May 16th, 2024
  • Новини

Дуда во время поездки в Катар поощрял местный бизнес к восстановлению Украины

В ходе визита в Катар президент Польши Анджей Дуда рассказал о возможностях для местного бизнеса… Читати більше

Thursday May 16th, 2024
  • Новини

Среди раненых глава МВА: оккупанты кассетными боеприпасами обстреляли Волчанскую громаду

16 мая российские агрессоры ударили кассетными боеприпасами по селу Волчанской общины Харьковской области, в результате… Читати більше

Thursday May 16th, 2024
  • Новини

В нескольких областях и Киеве сегодня снова будут вводить графики отключения света, — ДТЭК

16 мая, начиная с 16:00 в Киеве, Киевской, Днепропетровской, Донецкой и Одесской областях будут применяться… Читати більше

Thursday May 16th, 2024

Цей сайт використовує Cookies.