Український стартап тренує нейромережу розпізнавати кримськотатарську мову: як працює це рішення

Український стартап Respeecher тренує нейромережу для розпізнавання кримськотатарської мови.

Про це розповіли засновники проєкту для "Української правди. Життя".

У чому проблема?

Ще за часів Другої світової війни кримсько-татарський народ зазнавав приниження та пережив депортацію. У наш час, коли росія анексувала Крим, корінне населення знову зазнає утисків. Оселі татар обшукують, їх переслідують. Занепаду зазнала і кримсько-татарська мова.

Яке рішення?

Голосові помічники, як-от Siri чи Alexa, зможуть розпізнавати команди, перекладати текст, шукати інформацію.

На думку авторів проєкту, це сприятиме популяризації мови серед носіїв. Команда Respeecher створювала синтезовані голоси для Голлівуду, зокрема голос Дарта Вейдера та Люка Скайвокера для фільмів Star Wars.

Але на цей час розробники ставлять в пріоритеті популяризацію кримськотатарської мови.

Як це працює?

"Процес збору та аналізу інформації є доволі часозатратний: може зайняти від кількох тижнів до кількох місяців, залежно від якості аудіо. Втім, наша команда хоче, щоб цей ресурс був безкоштовними і доступним у відкритих джерелах. Віримо, що це допоможе у популяризації використання, як української, так і кримськотатарської мови", – каже технічний директор та співзасновник Respeecher Дмитро Бєлєвцов.

Для того, щоб навчити нейромережу, треба близько тисячі годин із записами цією мовою. Надіслати свій аудіозапис можна через форму.

У стартапі просять робити запис у тихій кімнаті з мінімально можливою кількістю фонових шумів.

"Чим більше відмінних акцентів і тональностей модель штучного інтелекту проаналізує, тим точнішим буде результат розпізнавання мови", – зазначають розробники.

Вони запевняють, що жодні дані конкретних осіб не будуть зберігатися, а за записами не синтезуватимуть чужі голоси.

Їх використають виключно для навчання нейромережі цілому та кращого розпізнавання кримськотатарської.

Цим ресурсом можуть скористатись, як поодинокі розробники, щоб покращити аудіо сприйняття української мови у своєму продукті, так і великі корпорації, на кшталт, Facebook, Google чи помічники, на кшталт, Siri.

Свіжі дописи

  • Новини

На Різдво у Львові почав курсувати святковий трамвай з колядками

З 25 грудня до 10 січня Львовом курсуватиме різдвяний трамвай з колядками. Він буде на маршруті… Читати більше

Wednesday December 25th, 2024
  • Новини

Миколаївський моделіст разом із сином створив новорічні кульки з моделями історичних споруд міста

Миколаївський краєзнавець, колекціонер, моделіст Андрій Шинкаренко разом зі своїм сином Андрієм розробили та виготовили оригінальні… Читати більше

Wednesday December 25th, 2024
  • Новини

Українців попереджають про фейкові повідомлення щодо заборгованості перед “Новою поштою”

Українці у середу, 25 грудня, могли отримати фейкові повідомлення про заборгованість перед "Новою поштою". Проте… Читати більше

Wednesday December 25th, 2024
  • Новини

Міноборони кодифікувало і допустило до постачання у ЗСУ безпілотний авіаційний комплекс “Щедрик”

Оборонне відомство кодифікувало і допустило до постачання у підрозділах Сил оборони безпілотний авіаційний комплекс «Щедрик»… Читати більше

Wednesday December 25th, 2024
  • Новини

У Харківському авіаінституті відновили пошкоджені через російські обстріли навчально-експериментальні майстерні

У Національному аерокосмічному університеті ім. Жуковського «Харківський авіаційний інститут» відновили приміщення навчально-експериментальних майстерень, пошкоджених російськими… Читати більше

Wednesday December 25th, 2024
  • Новини

Унаслідок падіння пасажирського літака в Казахстані загинуло 38 людей

На борту літака авіакомпанії Azerbaijan Airlines, який сьогодні зранку впав поблизу Актау в Казахстані, перебувало… Читати більше

Wednesday December 25th, 2024

Цей сайт використовує Cookies.