
Кипрский греческий получает голос в технологиях: создана первая ИИ-модель точного распознавания диалекта
Никосия, Кипр. Команда из трех специалистов разработала первую в своем роде ИИ-модель преобразования речи в текст, которая точно распознает кипрский греческий — диалект, с которым большинство глобальных голосовых систем традиционно не справляется.
Менеджер AI-продуктов Игорь Акимов совместно со стажерами Хуссейном Хадрой (Университет Никосии) и Никитой Марковым (UCLan Cyprus) создали автоматическую систему распознавания речи (ASR), специально адаптированную под фонетику и структуру кипрского диалекта.
Система позволяет пользователю говорить в микрофон, после чего алгоритм преобразует кипрскую речь в точный текст — и этот механизм уже может интегрироваться:
По словам разработчиков, модель имеет широкий спектр применения:
Команда столкнулась с ключевым вызовом: отсутствием качественных датасетов.
Исследовательские организации отказались помочь — у одних данные были утеряны, другие просили непомерные суммы. Даже Meta, собравшая корпус по 1600 языкам, не имела ни одного часа кипрской речи.
Чтобы построить корпус «с нуля», команда вручную собирала аудио:
Так был создан крупнейший в истории набор кипрско-греческих аудиоданных.
Все это реализовано при бюджете всего 150 долларов, благодаря оптимизации и использованию облачных сервисов.
Команда собрала уже около 300 часов кипрской речи, однако для создания лучшей в мире модели требуется значительно больше.
Каждый желающий может помочь, потратив 10–15 минут на проверку транскрипции аудио на платформе проекта:
По словам Акимова:
“Даже несколько минут работы волонтёров могут существенно улучшить модель. Мы хотим, чтобы каждый киприот мог говорить на своем диалекте — и быть при этом понятным технологиями”.
Как вы считаете, может ли такая инициатива стать основой для полноценного цифрового
Читать на kiprinform.com