Dicas de jogos e programas Linux: pdftotext

domingo, 9 de maio de 2010

Como Agrupar Imagens em Pdf

Buscando uma maneira de criar um Pdf com as páginas de um livro que digitalizei, encontrei uma solução que consiste dos seguintes passos:
- reduzir a qualidade das imagens em Jpeg
- converter cada imagem em um arquivo Pdf
- Unir os Pdfs em um único arquivo
Para começar, é necessário que estejam instalados o imagemagick e o ghostscript. Feito isso, vamos ao que interessa:

Reduzir a qualidade das imagens

Inicialmente, para efeito de organização, criamos uma pasta onde colocaremos as imagens reduzidas:
$ mkdir reduzidas

Agora, reduziremos as imagens, a 20% do aquivo original. Você pode alterar esse valor, dependendo da qualidade da imagem original, se desejar.
$ for i in `ls *.jpg` ; do convert -quality 20% $i ./reduzidas/$i ; done

Supondo que o livro digitalizado tenha o tamanho de metade de uma folha A4, e, portanto as imagens estejam "de lado", deve-se rotacionar as imagens, nesse caso, 90º à esquerda:
$ for i in `ls *.jpg` ; do convert -quality 20% -rotate -90 $i ./reduzidas/$i ; done

Criar os arquivos Pdf
Entraremos na pasta com as imagens, criaremos outra para armazenar os Pdfs, e geraremos os tais arquivos:
$ cd reduzidas
$ mkdir pdf
$ for i in `ls *.jpg` ; do convert $i ./pdf/$i.pdf ; done

Agrupando os Pdfs
$ cd pdf
$ gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=finished.pdf *.pdf

Esse comando gerará um Pdf com o nome "finished.pdf"

Fonte: http://www.bestlinux.com.br/index.php/dicas/121/5432-como-juntar-varios-arquivos-pdf-no-linux

domingo, 13 de setembro de 2009

Como converter pdf em fala

Algumas pessoas necessitam estudar ou se manterem informadas, mas não dispõem de muito tempo para isto. Uma solução viável, seria converter os arquivos para mp3, mas como fazê-lo?
A solução encontrada por mim se divide basicamente em três partes: extrair o texto de arquivos em pdf, "convertê-los" em arquivo de som, e , no fim, converter o arquivo wav para mp3.

Convertendo PDF para texto

Como visto neste blog , uma solução interessante é, simplesmente:

$ pdftotext arquivo.pdf arquivo.txt

Agora já temos extraído o texto do pdf. É bom dar uma olhada no arquivo gerado, para corrigir alguns erros que acabam surgindo.

Converter texto para fala

No Viva o Linux, achei um artigo que explica como fazer isto.Agora, instalaremos um sintetizador de voz chamado "espeak". Dependendo da sua distribuição pode ser necessário instalar dois pacotes, "espeak" e "espeak-data", este último contendo as vozes, incluindo o português do Brasil.
No gentoo, simplesmente:

# emerge espeak

Agora verificamos se o português do Brasil está listado:

$ espeak --voices

Procure pelo "pt". Se estiver ok, prossiga gerando o arquivo de som:

$ espeak -v pt -s150 -p60 -f arquivo.txt -w arquivo.wav

O parâmetro "s" indica o número de palavras por segundo, e o "p" expressa a freqüência do som: valores baixos são graves e valores altos são mais agudos. O "w" serve para gravar em um arquivo do tipo "wave".

Converter wav para mp3

O arquivo gerando pelo espeak torna-se grande demais. Podemos reduzí-lo, convertendo-o para mp3 com o lame:

$ lame arquivo.wav -b32 --scale 4 arquivo.mp3

Com o parâmetro "b" dizemos qual a taxa de bits que desejamos para o arquivo resultante. Com um valor positivo para o "--scale", aumentamos o "volume" do arquivo, e com um valor negativo, o reduzimos.

Dicas de jogos e programas Linux

domingo, 9 de maio de 2010

Como Agrupar Imagens em Pdf

domingo, 13 de setembro de 2009

Como converter pdf em fala

Arquivo do blog

Tags

GuiaDoHardware.net

BR-Linux.org

Viva o Linux

Dicas de jogos e programas Linux

domingo, 9 de maio de 2010

Como Agrupar Imagens em Pdf

domingo, 13 de setembro de 2009

Como converter pdf em fala

Arquivo do blog

Tags

Inscrever-se

GuiaDoHardware.net

BR-Linux.org

Viva o Linux