Український стартап тренує нейромережу розпізнавати кримськотатарську мову: як працює це рішення

Український стартап Respeecher тренує нейромережу для розпізнавання кримськотатарської мови.

Про це розповіли засновники проєкту для "Української правди. Життя".

У чому проблема?

Ще за часів Другої світової війни кримсько-татарський народ зазнавав приниження та пережив депортацію. У наш час, коли росія анексувала Крим, корінне населення знову зазнає утисків. Оселі татар обшукують, їх переслідують. Занепаду зазнала і кримсько-татарська мова.

Яке рішення?

Голосові помічники, як-от Siri чи Alexa, зможуть розпізнавати команди, перекладати текст, шукати інформацію.

На думку авторів проєкту, це сприятиме популяризації мови серед носіїв. Команда Respeecher створювала синтезовані голоси для Голлівуду, зокрема голос Дарта Вейдера та Люка Скайвокера для фільмів Star Wars.

Але на цей час розробники ставлять в пріоритеті популяризацію кримськотатарської мови.

Як це працює?

"Процес збору та аналізу інформації є доволі часозатратний: може зайняти від кількох тижнів до кількох місяців, залежно від якості аудіо. Втім, наша команда хоче, щоб цей ресурс був безкоштовними і доступним у відкритих джерелах. Віримо, що це допоможе у популяризації використання, як української, так і кримськотатарської мови", – каже технічний директор та співзасновник Respeecher Дмитро Бєлєвцов.

Для того, щоб навчити нейромережу, треба близько тисячі годин із записами цією мовою. Надіслати свій аудіозапис можна через форму.

У стартапі просять робити запис у тихій кімнаті з мінімально можливою кількістю фонових шумів.

"Чим більше відмінних акцентів і тональностей модель штучного інтелекту проаналізує, тим точнішим буде результат розпізнавання мови", – зазначають розробники.

Вони запевняють, що жодні дані конкретних осіб не будуть зберігатися, а за записами не синтезуватимуть чужі голоси.

Їх використають виключно для навчання нейромережі цілому та кращого розпізнавання кримськотатарської.

Цим ресурсом можуть скористатись, як поодинокі розробники, щоб покращити аудіо сприйняття української мови у своєму продукті, так і великі корпорації, на кшталт, Facebook, Google чи помічники, на кшталт, Siri.

Свіжі дописи

  • Новини

Рішення для перемоги: в Києві запрацював перший рекрутинговий центр ССО

У столиці запрацював перший рекрутинговий центр Сил спеціальних операцій ЗСУ. Тут охочі долучитися до лав… Читати більше

Sunday May 19th, 2024
  • Новини

Як подолати кадрову кризу в енергетиці: освітній проєкт Глобального договору ООН в Україні 

Глобальний договір ООН в Україні в межах Ukraine Energy Initiative розпочав дослідження потреб енергетичних компаній… Читати більше

Sunday May 19th, 2024
  • Новини

У Запорізькому музеї вперше зафіксували рекорд України

Представники Національного реєстру рекордів України в Запорізькому обласному краєзнавчому музеї зафіксували найбільшу кількість предметів фалеристики… Читати більше

Sunday May 19th, 2024
  • Новини

Генштаб: найгарячіше на Покровському та Сіверському напрямках

Найгарячіша ситуація на Покровському та Сіверському напрямках. Загалом з початку 19 травня на фронті відбулося… Читати більше

Sunday May 19th, 2024
  • Новини

Словацькі слідчі перевіряють імовірну причетність інших осіб до замаху на Фіцо

У Словаччині слідчі перевіряють версію замаху на прем’єр-міністра Роберта Фіцо, згідно з якою нападник діяв… Читати більше

Sunday May 19th, 2024
  • Новини

МОК заборонив російським журналістам використовувати символіку країни на Олімпіаді в Парижі

Міжнародний олімпійський комітет заборонив журналістам з російської федерації використовувати символіку країни на літніх Олімпійських іграх… Читати більше

Sunday May 19th, 2024

Цей сайт використовує Cookies.