Установка русского голоса festival для экранного диктора Orca

Дата публикации:2008
Twitter Facebook Vkontakte

за помощь в подготовке этой статьи автор выражает признательность Николаю Шмырёву, предоставившему всю необходимую информацию.

Проект русского голоса для Festival

Одним из препятствий на пути к Linux для незрячих пользователей является весьма ограниченный набор синтезаторов русской речи для этой системы и их невысокое качество в сравнении с решениями на платформе MS Windows. Входящий в дистрибутив Ubuntu синтезатор eSpeak не обладает достаточной разборчивостью речи и естественностью звучания. По этой причине любой проект, целью которого является создание синтезатора русской речи для Linux, вызывает неподдельный интерес у незрячих и слабовидящих пользователей.

Проект создания русского голоса для системы синтеза речи Festival был основан Николаем Шмырёвым и располагается по адресу http://festlang.berlios.de/docu/doku.php?id=russian . Проект продолжает развиваться, скоро будет готова новая версия русского голоса (последняя была представлена в марте 2008 года, для нее доступна демонстрационная запись).

Отличительной чертой этого голоса является естественность речи, за которую приходится расплачиваться размером дистрибутива -- он вместе с дополнениями превышает 200 Мб. Недостатки у голоса тоже есть -- это сбои, акустические шумы, ошибки в произношении, отсутствие регулировок скорости и высоты тона. Иноязычные слова озвучиваются "по-русски", что делает неудобным использование голоса для чтения смешанных текстов. В редких случаях ухудшается разборчивость речи. Но проект развивается и постепенно приближается к своей цели -- созданию качественного синтезатора русской речи.

Установка Festival

Все приводимые далее действия по установке Festival и русского голоса выполнялись для дистрибутива Ubuntu 8.04.

Для работы понадобится терминал GNOME, окно которого можно открыть, нажав Alt+F1 и перейдя по такому маршруту: Приложения -> Стандартные -> Терминал. Есть и другой способ: нажать Alt+F2 и набрать:

gnome-terminal

Прежде всего нужно установить festival версии 1.96 и speech-tools версии 1.96. Это можно выполнить в окне терминала командой:

sudo aptitude install festival speech-tools

В ходе установки пакетов придется подтвердить свое желание (поскольку положительный ответ подразумевается по умолчанию, то достаточно нажать клавишу Enter). После успешной установки пакетов можно вызвать диалог настройки параметров Orca, где на вкладке "Речь" в списке синтезаторов речи появится "festival gnome speech driver", а в списке голосов -- английский голос (он будет единственным).

Если используется русский интерфейс среды GNOME, то, после переключения на английский голос Festival, Orca перестанет озвучивать все элементы управления с русскими надписями.

Установка русского голоса

Внимание! В секции Дополнительные ссылки указаны ссылки на более свежие версии синтезатора.

По ссылке msu_ru_nsh_clunits-0.4.tar.gz ( 185 Мб) необходимо загрузить на компьютер архив. Обновления для голоса следует искать по ссылке http://forum.sources.ru/index.php?showtopic=204030view=showall . Мартовское обновление можно получить по ссылке msu_ru_nsh_clunits.tar.bz2 (~37 Мб) или по более "короткому" маршруту.

В дальнейшем будем считать, что все архивы размещены в домашнем каталоге.

Далее будут следовать операции с файлами, для которых необходим доступ root. Наиболее удобным вариантом для тех, кто недавно перешел от Windows к Linux, было бы запустить оконный файловый менеджер Nautilus с правами root, нажав Alt+F2 и набрав команду:

gksudo nautilus

К сожалению, на момент подготовки Orca еще не может озвучивать оконные приложения, запущенные с правами root. Так что оставим в стороне Nautilus и выполним необходимые действия через терминал GNOME.

Перейдем в каталог /usr/share/festival/voices/, создадим там вложенный каталог russian/, в который распакуем архивы, лежащие в домашнем каталоге:

cd /usr/share/festival/voices/
sudo mkdir russian
sudo tar -xf ~/msu_ru_nsh_clunits-0.4.tar.gz
sudo tar -xf ~/msu_ru_nsh_clunits.tar.bz2

В результате в каталоге russian появится каталог msu_ru_nsh_clunits с распакованным содержимым архивов.

Теперь необходимо перейти в каталог msu_ru_nsh_clunits/festvox/ и внести некоторые изменения в файл msu_ru_nsh_clunits. Поскольку gedit при запуске с правами root не озвучивается экранным диктором Orca, то воспользуемся проверенным vi:

cd msu_ru_nsh_clunits/festvox/
sudo vi msu_ru_nsh_clunits.scm

Теперь следует нажать прописную G, чтобы перейти в конец файла и клавишей со стрелкой вверх встать перед строкой

(provide 'msu_ru_nsh_clunits)

Перед этой строкой нужно поместить нижеследующий текст:

(proclaim_voice 
 'msu_ru_nsh_clunits 
 '((language russian) 
   (gender male) 
   (dialect moscow) 
   (coding utf-8) 
   (description 
    "Russian festival voice."))) 

В Firefox указанный текст можно выделить так же, как в обычном редакторе, и скопировать в буфер, нажав Control+C; затем следует перейти в окно терминала, где открыт vi, нажать i, чтобы включить режим вставки; затем вызвать контекстное меню и выбрать пункт "Вставить"; для завершения вставки нужно нажать Esc. После этого файл нужно сохранить и выйти, для чего достаточно набратьZZ (две прописные Z).

Теперь можно открыть диалог параметров Orca и на вкладке "Речь" выбрать синтезатор "festival gnome speech driver", а в качестве голоса -- "msu_ru_nsh_clunits" (это первый голос в списке). Если нужный голос в списке отсутствует, то выгрузите Orca по комбинации Insert+Q, а затем загрузить его снова: нажать Alt+F2 и набрать: orca. Если после перезагрузки голос в списке не появился, то, вероятнее всего, была допущена ошибка при редактировании файла msu_ru_nsh_clunits.scm. Вернитесь к этому файлу и проверьте правильность добавленных в него строк.

Чтобы настройки, сделанные в диалоге, вступили в силу, нужно нажать либо кнопку "Применить", либо кнопку "OK" (в последнем случае диалог настройки параметров закроется).

Через некоторое время новый голос сообщит о том, что параметры Orca перезагружены. Если, подождав какое-то время, вы не услышали этого сообщения, то просто начните перемещаться по элементам управления и Orca откликнется новым голосом.

Помощь проекту

Проект русского голоса Festival приглашает всех заинтересованных лиц (в том числе и незрячих пользователей) принять участие в тестировании синтезатора, разметке звуковых данных, подготовке словаря, отладке и разработке программного кода. Вся контактная информация находится на официальном сайте проекта.

Желающие поспособствовать развитию речевых технологий в Linux и созданию свободного речевого программного обеспечения могут предоставить записи своих голосов в распоряжение проекта http://voxforge.org.

Дополнительные ссылки


Проект осуществлен при поддержке компании RU-CENTER
Распространение материалов сайта означает, что распространитель принимает условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2017
Rambler's Top100
Рейтинг@Mail.ru