www.tirinhas.com

domingo, 13 de setembro de 2009

Como converter pdf em fala

Algumas pessoas necessitam estudar ou se manterem informadas, mas não dispõem de muito tempo para isto. Uma solução viável, seria converter os arquivos para mp3, mas como fazê-lo?
A solução encontrada por mim se divide basicamente em três partes: extrair o texto de arquivos em pdf, "convertê-los" em arquivo de som, e , no fim, converter o arquivo wav para mp3.

Convertendo PDF para texto

Como visto neste blog , uma solução interessante é, simplesmente:

$ pdftotext arquivo.pdf arquivo.txt

Agora já temos extraído o texto do pdf. É bom dar uma olhada no arquivo gerado, para corrigir alguns erros que acabam surgindo.


Converter texto para fala

No Viva o Linux, achei um artigo que explica como fazer isto.Agora, instalaremos um sintetizador de voz chamado "espeak". Dependendo da sua distribuição pode ser necessário instalar dois pacotes, "espeak" e "espeak-data", este último contendo as vozes, incluindo o português do Brasil.
No gentoo, simplesmente:

# emerge espeak

Agora verificamos se o português do Brasil está listado:

$ espeak --voices

Procure pelo "pt". Se estiver ok, prossiga gerando o arquivo de som:

$ espeak -v pt -s150 -p60 -f arquivo.txt -w arquivo.wav

O parâmetro "s" indica o número de palavras por segundo, e o "p" expressa a freqüência do som: valores baixos são graves e valores altos são mais agudos. O "w" serve para gravar em um arquivo do tipo "wave".

Converter wav para mp3

O arquivo gerando pelo espeak torna-se grande demais. Podemos reduzí-lo, convertendo-o para mp3 com o lame:

$ lame arquivo.wav -b32 --scale 4 arquivo.mp3

Com o parâmetro "b" dizemos qual a taxa de bits que desejamos para o arquivo resultante. Com um valor positivo para o "--scale", aumentamos o "volume" do arquivo, e com um valor negativo, o reduzimos.

Nenhum comentário: