Проект по автоматизированному распознаванию казахской речи запустил институт умных систем и искусственного интеллекта «Назарбаев Университета», передает ИА «NewTimes.kz».
Сообщается, что с его помощью казахский язык можно активно внедрять в глобальное цифровое пространство.
Для реализации проекта ученые собрали самую большую базу голосовых данных на казахском языке — 300 часов записанной речи 2 тыс человек.
В пресс-службе университета сообщается, что применение новой разработки открывает большие возможности — распознавание казахской речи виртуальными помощниками, использование во всевозможных программах и технологии «умного дома».
Кроме того, этот проект даст большой толчок развитию инклюзии в Казахстане.
Новая технология может применяться в голосовых и текстовых программах, широко использующихся людьми с особыми потребностями.
«Прежде отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователями и цифровыми предпринимателями, чтобы максимизировать его положительное влияние на экономику и общество страны», — сказал профессор директор ISSAI NU Атакан Варол.
К слову, запуск проекта приурочен к первой годовщине создания института умных систем и искусственного интеллекта «Назарбаев Университета» — 14 сентября ISSAI отметил свой первый день рождения.
Здесь можно получить доступ к собранной базе данных, а также протестировать технологию распознавания казахской речи.