fbpx
Сьогодні
19:59 30 Бер 2023

Український стартап тренує нейромережу розпізнавати кримськотатарську мову: як працює це рішення

Фото: tommaso1979/Depositphots

Український стартап Respeecher тренує нейромережу для розпізнавання кримськотатарської мови.

Про це розповіли засновники проєкту для "Української правди. Життя".

У чому проблема?

Ще за часів Другої світової війни кримсько-татарський народ зазнавав приниження та пережив депортацію. У наш час, коли росія анексувала Крим, корінне населення знову зазнає утисків. Оселі татар обшукують, їх переслідують. Занепаду зазнала і кримсько-татарська мова.

Яке рішення?

Голосові помічники, як-от Siri чи Alexa, зможуть розпізнавати команди, перекладати текст, шукати інформацію.

На думку авторів проєкту, це сприятиме популяризації мови серед носіїв. Команда Respeecher створювала синтезовані голоси для Голлівуду, зокрема голос Дарта Вейдера та Люка Скайвокера для фільмів Star Wars.

Але на цей час розробники ставлять в пріоритеті популяризацію кримськотатарської мови.

Як це працює?

"Процес збору та аналізу інформації є доволі часозатратний: може зайняти від кількох тижнів до кількох місяців, залежно від якості аудіо. Втім, наша команда хоче, щоб цей ресурс був безкоштовними і доступним у відкритих джерелах. Віримо, що це допоможе у популяризації використання, як української, так і кримськотатарської мови", – каже технічний директор та співзасновник Respeecher Дмитро Бєлєвцов.

Для того, щоб навчити нейромережу, треба близько тисячі годин із записами цією мовою. Надіслати свій аудіозапис можна через форму.

У стартапі просять робити запис у тихій кімнаті з мінімально можливою кількістю фонових шумів.

"Чим більше відмінних акцентів і тональностей модель штучного інтелекту проаналізує, тим точнішим буде результат розпізнавання мови", – зазначають розробники.

Вони запевняють, що жодні дані конкретних осіб не будуть зберігатися, а за записами не синтезуватимуть чужі голоси.

Їх використають виключно для навчання нейромережі цілому та кращого розпізнавання кримськотатарської.

Цим ресурсом можуть скористатись, як поодинокі розробники, щоб покращити аудіо сприйняття української мови у своєму продукті, так і великі корпорації, на кшталт, Facebook, Google чи помічники, на кшталт, Siri.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.

Завантажити ще

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: