Buscando uma maneira de criar um Pdf com as páginas de um livro que digitalizei, encontrei uma solução que consiste dos seguintes passos:
- reduzir a qualidade das imagens em Jpeg
- converter cada imagem em um arquivo Pdf
- Unir os Pdfs em um único arquivo
Para começar, é necessário que estejam instalados o imagemagick e o ghostscript. Feito isso, vamos ao que interessa:
Reduzir a qualidade das imagens
Inicialmente, para efeito de organização, criamos uma pasta onde colocaremos as imagens reduzidas:
$ mkdir reduzidas
Agora, reduziremos as imagens, a 20% do aquivo original. Você pode alterar esse valor, dependendo da qualidade da imagem original, se desejar.
$ for i in `ls *.jpg` ; do convert -quality 20% $i ./reduzidas/$i ; done
Supondo que o livro digitalizado tenha o tamanho de metade de uma folha A4, e, portanto as imagens estejam "de lado", deve-se rotacionar as imagens, nesse caso, 90º à esquerda:
$ for i in `ls *.jpg` ; do convert -quality 20% -rotate -90 $i ./reduzidas/$i ; done
Criar os arquivos Pdf
Entraremos na pasta com as imagens, criaremos outra para armazenar os Pdfs, e geraremos os tais arquivos:
$ cd reduzidas
$ mkdir pdf
$ for i in `ls *.jpg` ; do convert $i ./pdf/$i.pdf ; done
Agrupando os Pdfs
$ cd pdf
$ gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=finished.pdf *.pdf
Esse comando gerará um Pdf com o nome "finished.pdf"
Fonte: http://www.bestlinux.com.br/index.php/dicas/121/5432-como-juntar-varios-arquivos-pdf-no-linux
Mostrando postagens com marcador pdftotext. Mostrar todas as postagens
Mostrando postagens com marcador pdftotext. Mostrar todas as postagens
domingo, 9 de maio de 2010
domingo, 13 de setembro de 2009
Como converter pdf em fala
Algumas pessoas necessitam estudar ou se manterem informadas, mas não dispõem de muito tempo para isto. Uma solução viável, seria converter os arquivos para mp3, mas como fazê-lo?
A solução encontrada por mim se divide basicamente em três partes: extrair o texto de arquivos em pdf, "convertê-los" em arquivo de som, e , no fim, converter o arquivo wav para mp3.
Convertendo PDF para texto
Como visto neste blog , uma solução interessante é, simplesmente:
$ pdftotext arquivo.pdf arquivo.txt
Agora já temos extraído o texto do pdf. É bom dar uma olhada no arquivo gerado, para corrigir alguns erros que acabam surgindo.
Converter texto para fala
No Viva o Linux, achei um artigo que explica como fazer isto.Agora, instalaremos um sintetizador de voz chamado "espeak". Dependendo da sua distribuição pode ser necessário instalar dois pacotes, "espeak" e "espeak-data", este último contendo as vozes, incluindo o português do Brasil.
No gentoo, simplesmente:
# emerge espeak
Agora verificamos se o português do Brasil está listado:
$ espeak --voices
Procure pelo "pt". Se estiver ok, prossiga gerando o arquivo de som:
$ espeak -v pt -s150 -p60 -f arquivo.txt -w arquivo.wav
O parâmetro "s" indica o número de palavras por segundo, e o "p" expressa a freqüência do som: valores baixos são graves e valores altos são mais agudos. O "w" serve para gravar em um arquivo do tipo "wave".
Converter wav para mp3
O arquivo gerando pelo espeak torna-se grande demais. Podemos reduzí-lo, convertendo-o para mp3 com o lame:
$ lame arquivo.wav -b32 --scale 4 arquivo.mp3
Com o parâmetro "b" dizemos qual a taxa de bits que desejamos para o arquivo resultante. Com um valor positivo para o "--scale", aumentamos o "volume" do arquivo, e com um valor negativo, o reduzimos.
A solução encontrada por mim se divide basicamente em três partes: extrair o texto de arquivos em pdf, "convertê-los" em arquivo de som, e , no fim, converter o arquivo wav para mp3.
Convertendo PDF para texto
Como visto neste blog , uma solução interessante é, simplesmente:
$ pdftotext arquivo.pdf arquivo.txt
Agora já temos extraído o texto do pdf. É bom dar uma olhada no arquivo gerado, para corrigir alguns erros que acabam surgindo.
Converter texto para fala
No Viva o Linux, achei um artigo que explica como fazer isto.Agora, instalaremos um sintetizador de voz chamado "espeak". Dependendo da sua distribuição pode ser necessário instalar dois pacotes, "espeak" e "espeak-data", este último contendo as vozes, incluindo o português do Brasil.
No gentoo, simplesmente:
# emerge espeak
Agora verificamos se o português do Brasil está listado:
$ espeak --voices
Procure pelo "pt". Se estiver ok, prossiga gerando o arquivo de som:
$ espeak -v pt -s150 -p60 -f arquivo.txt -w arquivo.wav
O parâmetro "s" indica o número de palavras por segundo, e o "p" expressa a freqüência do som: valores baixos são graves e valores altos são mais agudos. O "w" serve para gravar em um arquivo do tipo "wave".
Converter wav para mp3
O arquivo gerando pelo espeak torna-se grande demais. Podemos reduzí-lo, convertendo-o para mp3 com o lame:
$ lame arquivo.wav -b32 --scale 4 arquivo.mp3
Com o parâmetro "b" dizemos qual a taxa de bits que desejamos para o arquivo resultante. Com um valor positivo para o "--scale", aumentamos o "volume" do arquivo, e com um valor negativo, o reduzimos.
Assinar:
Postagens (Atom)