RSS
Новости
Реклама

ЗДЕСЬ МОГЛА БЫТЬ ВАША РЕКЛАМА!

Балаболка Часто задаваемые вопросы

Что такое SAPI, и зачем он нужен?
Speech Application Programming Interface или SAPI - это пакет речевых функций, разработанный корпорацией Microsoft для того, чтобы программы могли использовать компьютерный синтез речи. Существуют две основные версии SAPI (SAPI 4 и SAPI 5), которые не совместимы друг с другом.

Операционная система Windows 2000 содержала SAPI 4, Windows XP и все последующие версии - SAPI 5. Можно загрузить и установить обе версии SAPI на один компьютер; это позволит использовать все существующие речевые движки (старые и новые).
 
Где я могу найти SAPI 4?
Для того, чтобы использовать голоса SAPI 4, необходимо скачать и установить пакет функций Microsoft Speech API 4.0. Также, можно загрузить и установить Microsoft Speech Control Panel; после этого в панели управления добавится иконка панели настроек речи.
 
Где я могу найти SAPI 5?
Windows XP (и более поздние версии) уже содержит SAPI 5. Если на компьютере установлена предыдущая версия операционной системы, можно загрузить 32-битную версию пакета функций Microsoft Speech API 5.1.
 
Установил программу "Балаболка", но она читает только по-английски. Как заставить ее читать вслух по-русски?
"Балаболка" использует компьютерные голоса, установленные на компьютере пользователя. Компьютерный голос (его еще называют "синтезатор речи") - это отдельный программный продукт (бесплатный или платный). Существует множество различных компьютерных голосов, в том числе и русских. Ссылки на некоторые бесплатные голоса есть на сайте программы "Балаболка". Найти информацию о русских синтезаторах речи можно также здесь и здесь.
 
Как узнать, какие именно голоса установлены на моем компьютере?
Список установленных голосов можно посмотреть здесь: Control Panel (Панель управления) -> Speech (Речь) -> Speech Properties (Свойства речи) -> Text To Speech (Преобразование текста в речь) -> Voice selection (Выбор голоса).
 
Голос Katerina очень медленно читает текст. Как это исправить?
Настройки "по умолчанию" голосового движка ScanSoft (RealSpeak) Katerina заставляют ее произносить текст в замедленном темпе. Для устранения этого недостатка достаточно внести изменения в параметры голоса в реестре Windows. Загрузить файл с настройками можно здесь.
 
Как выполнить "тихую" установку программы?
Установка программы в автоматическом режиме без показа диалогов ("тихая" установка) возможна при указании ключа -silent в командной строке.
 
При запуске программы появляется сообщение "Не найден файл WMVCORE.DLL". Что делать?
Вам нужно скачать "Windows Media Format 9 Runtime" отсюда или отсюда (3,9 МБ).
 
У меня стоит "пиратская" сборка Windows XP, и ничего не работает - ни программа "Балаболка", ни компьютерные голоса. Что делать?
В "самодельных" вариантах операционной системы могут отсутствовать компоненты, необходимые для синтеза речи или для нормальной работы программы "Балаболка". Если в панели управления Windows отсутствует раздел "Речь" (Speech), можно восстановить его при помощи этого набора файлов. Затем необходимо загрузить и установить SAPI 4 и SAPI 5.
 
Открываю в программе файл в формате DjVu, но текст отсутствует. В чем дело?
Формат DjVu был разработан для хранения сканированных документов. То есть, в DjVu-файлах в сжатом виде хранятся графические изображения страниц книг, журналов и т.д. Также, формат DjVu предусматривает наличие текстового (OCR) слоя, который содержит текст со страницы. Файлы с текстовым слоем иногда обозначают как DjVu+OCR.

Программа "Балаболка" умеет извлекать данные лишь из текстового слоя. В случае, если текстовый слой недоступен, единственный метод получения текста - это выполнение оптического распознавания, например, в FineReader.
 
Голос Nicolai произносит "пространство" каждый раз, когда в тексте встречается неразрывный пробел (символ ALT+0160). Как это исправить?
Программа может автоматически заменять неразрывные пробелы обычными пробелами во время чтения. Выберите пункт главного меню "Настройки | Общие настройки", в открывшемся окне перейдите на закладку "Чтение" и поставьте "галочку" в пункте "Игнорировать символы во время чтения". Добавьте неразрывный пробел в список игнорируемых символов: нажмите клавишу ALT и напечатайте "0160" на цифровом блоке клавиатуры. Можно указать и другие символы, которые голоса произносят вслух ("кавычки", "тире" и т.д.).
 
В моем компьютере установлены две звуковые карты. Как выбрать нужное аудиоустройство для воспроизведения речи?
Можно осуществить выбор аудиоустройства в панели управления Windows; например, в разделе "Звук, речь, аудиоустройства", кнопка "Аудио выход" ("Audio Output"). Звуковую карту можно также выбрать в программе "Балаболка", при помощи пункта главного меню "Настройки | Выбор аудиоустройства".
 
У меня 64-битная версия Windows. Установил 64-битный модуль Runtime для Microsoft Speech Platform, а также русский голос Elena. Но в списке доступных голосов в программе "Балаболка" пусто. В чем дело?
Программа "Балаболка" является 32-битным приложением. Поэтому необходимо установить 32-битный модуль Runtime для Microsoft Speech Platform.
 
Хочу читать японские тексты на своем компьютере. У меня русская версия Windows. Что мне надо сделать?
Необходимо использовать версию 2.xx программы "Балаболка" с поддержкой формата Unicode. Также, понадобится шрифт, где присутствует набор символов японского языка; могу посоветовать шрифт Arial Unicode MS. Еще необходим японский речевой движок; например, RealSpeak (ScanSoft) Kyoko.
 
Как сделать так, чтобы каждая строка текстового файла записывалась в отдельный аудиофайл?
Могу предложить такой способ. Добавьте в текстовый файл по две пустых строки после каждой строки; это делается в MS Word: откройте файл в этом редакторе, откройте окно "Найти и заменить", в поле "Найти" напишите ^p, в поле "Заменить на" напишите ^p^p^p, нажмите кнопку "Заменить все". Сохраните текстовый файл.

Затем в программе "Балаболка" откройте пункт главного меню "Сохранить как несколько аудиофайлов". В появившемся диалоговом окне выберите способ деления текста: Искать две пустые строки подряд. Всё, можно начинать запись аудиофайлов.
 
Было бы замечательно, если в "Балаболке" появилась возможность создания каталога книг и открытие в "Балаболке" выбранной книги, аналогично тому, как это сделано в программах-каталогизаторах. Можно ли реализовать это?
У меня нет планов создания утилиты или модуля, осуществляющего каталогизацию электронных книг на компьютере пользователя. Уже существуют хорошие бесплатные программы, выполняющие данную функцию; почти все они позволяют использовать внешнюю программу для чтения текстовых файлов. Так что, нет никаких проблем для пользователя: можно хранить каталог книг в одной программе, а для просмотра текста и чтения вслух использовать другую программу.
 
Собираетесь ли добавить в программу возможность создания аудиокниг в формате DAISY?
Пока поддержка DAISY не планируется; этому есть несколько причин. У формата DAISY довольно сложная структура, которая еще не до конца устоялась. Также, меня настораживает, что среди специалистов существуют разные точки зрения на данный формат: Статья "за" и Статья "против"

Основной же проблемой является то, что программа "Балаболка" не умеет создавать оглавления для текстовых файлов (тем более - многоуровневые оглавления). Без такого инструмента теряется основное преимущество формата DAISY (это гибкая навигация по тексту). Как вариант, можно создавать оглавления при помощи именованных закладок; но это не сравнить с возможностями создания оглавлений, когда, например, файлы формата DAISY генерируются при помощи плагинов в Microsoft Word или OpenOffice.org.

Посмотрим, что произойдет с форматом DAISY в будущем. Если пользователи задают вопрос об этом формате, значит, есть повод внимательно следить за развитием ситуации.
 
Мне требуется удалить из текста тире, стоящие в начале строки. Как это сделать?
Воспользуйтесь пунктом главного меню "Правка | Заменить". В строке "Найти" напишите ^p—, в строке "Заменить на" укажите ^p. Программа позволяет использовать в окнах "Найти" и "Заменить" большинство из специальных кодов, которые применяются в Microsoft Word:

^p
знак абзаца
^t
знак табуляции
^nnn
знак ASCII (где nnn - код знака)
^0nnn
знак ANSI (где 0 - это ноль, а nnn - код знака)
^Unnnnn
знак в кодировке Юникод (где nnnnn - код знака)
^+
длинное тире ( — )
^=
короткое тире ( – )
^^
знак крышки
^s
неразрывный пробел
^?
любой знак (только в поле "Найти")
^#
любая цифра (только в поле "Найти")
^$
любая буква (только в поле "Найти")
^c
содержимое буфера обмена Windows (только в поле "Заменить на")
^&
содержимое поля "Найти" (только в поле "Заменить на")

 
Что такое Google Text-To-Speech?
При использовании сервиса перевода на сайте Google, рядом с переведенным текстом есть кнопка "Listen" ("Слушать"). При ее нажатии браузер скачивает с сайта Google звуковой файл в формате MP3 с озвученным переводом. Доступен синтез речи для более чем 30 языков. Сервис предоставляет возможность озвучивать тексты длиной не более 100 символов. Программа "Балаболка" позволяет обойти это ограничение: большие тексты делятся на мелкие части, для каждой части текста скачивается звуковой файл, затем все файлы объединяются в один аудиофайл (поддерживаются форматы WAV, MP3 и OGG).
 
Преобразую субтитры в звуковые файлы, используя голос Nicolai. В созданном аудиофайле весь текст произносится без пауз между репликами. В чем проблема?
Старые версии голосов могут неправильно обрабатывать теги пауз, применяемые для преобразования субтитров. Рекомендуется использовать новые компьютерные голоса (такие как Olga или Tatyana).
 
Открываю в программе электронную книгу, но текст в окне "Балаболки" отсутствует. В чем дело?
Этому может быть несколько объяснений. Во-первых, файл может представлять собой набор отсканированных изображений страниц бумажной книги. Во-вторых, электронная книга может иметь защиту DRM. Программа "Балаболка" не имеет возможности извлечь текст из книги с такой защитой (это было бы незаконно).
 
Меня не удовлетворяет, как программа "Балаболка" извлекает текст из файлов формата PDF. Могу я использовать другой способ для обработки файлов PDF?
Процесс извлечения текста из файлов формата PDF достаточно сложен, так как файл PDF не содержит обычный текст. Вы можете использовать для извлечения текста внешнюю программу, поддерживающую передачу параметров в командной строке. Например, утилиту pdftotext.exe из состава проекта Xpdf. Скопируйте pdftotext.exe в подкаталог "utils" в папке программы "Балаболка", выберите пункт главного меню "Настройки | Импорт текста", закладку "Внешние программы для импорта текста", и нажмите кнопку "Добавить". Задайте команду для использования pdftotext.exe:

%BFolder%\utils\pdftotext.exe -q -nopgbrk -enc UTF-8 %Input% %Output%

Введите имя для данного формата (например, "Xpdf Converter"), расширение файла ("PDF") и кодировку текста ("UTF-8"). После того, как будет выбран пункт Использовать вместо метода извлечения текста по умолчанию для данного формата файлов, программа сможет использовать внешнюю утилиту для извлечения текста из файлов формата PDF.
 
Что представляет собой "чтение по методу Spritz"?
Это технология скорочтения, разработанная американской компанией Spritz. Суть метода состоит в разбиении текста на отдельные слова и их последовательном показе с цветовым выделением точки оптимального распознавания. Это позволяет достичь скорости чтения до 1000 слов в минуту без специальных тренировок. Основной принцип технологии заключается в том, что значительное количество времени теряется на перемещении взгляда от одного слова к другому. Показывая пользователю заменяющие друг друга слова на одном и том же месте, технология Spritz добивается эффекта, когда движение глаз сводится почти к нулю. Остается лишь вопрос в скорости, с которой мозг человека способен обрабатывать прочитанные слова и связывать их между собой.
 

 


Дополнительную информацию по компьютерным голосам и работе с программой "Балаболка" можно найти на форуме "Искусственный голос и синтез речи".