Вітаємо Вас на сайті!
Відділ розпізнавання та синтезу звукових образів Міжнародного науково-навчального центру інформаційних технологій та систем (МННЦІТС), м. Київ, з кінця 1960х займається тематикою розпізнавання та синтезу мовлення. За цей час ми безліч разів брали участь у державних науково-технічних програмах. Також маємо позитивний досвід співпраці зі стартапами.
Серед технологій, якими ми займаємося, є:
- розпізнавання мовлення (speech recognition);
- розпізнавання ключових слів (keyword spotting);
- ідентифікація голосу диктора (speaker recognition).
Вже застосовуються для: медіа-моніторинг, кол-центри.
Наявні моделі для української, російської, англійської, німецької, іспанської та казахської мов.
Якщо є якісь бажання потестувати наше розпізнавання пишіть на speech_ua at yahoo.com.
Демонстраційна програма розпізнавання медійних новин
Нижче наведено приклад розпізнавання телевізійних новин (ТСН, канал 1+1).
Для розпізнавання використовувалася українсько-російська модель.
Текст синхронізовано з аудіо, і натиснення на слово викличе зміну часу слайдера в плеєрі.
Також іншим кольором виділяється поточне слово.
Синім кольором позначені слова з пониженим значенням імовірності розпізнавання, відповідно з підвищеною вірогідністю помилки.
Вечірні новини ТСН за 12 листопада.