Quindi mi sono imbattuto in un problema l'altro giorno in cui ho dovuto copiare del testo da un file PDF e incollarlo in una presentazione che stavo facendo. Il problema era che non potevo copiare il testo! Hmm, ho pensato, ci deve essere qualcosa di stupido che sto facendo poiché sono abbastanza sicuro di aver già copiato il testo da un file PDF.
Fortunatamente, non ero così stupido, dal momento che il file PDF aveva diverse pagine che erano state scansionate file bitmap che erano stati inseriti nel PDF. Quindi non era vero testo in primo luogo. In secondo luogo, dove c'era un testo reale che normalmente poteva essere copiato, questo PDF aveva una sorta di autorizzazioni di sicurezza impostate su di esso in modo che la copia del contenuto non fosse consentita! Grrrr!
Avevo ancora bisogno di quel testo e stavo per trovare un modo per ottenerlo. In questo articolo, descriverò il modo semplice per copiare il testo che funziona se il documento non è protetto e il testo non è un'immagine scansionata. Vedrò anche cosa fare nello scenario più difficile in cui non ti è permesso copiare il testo. Non è una soluzione ideale, ma è meglio di niente, soprattutto se devi copiare molto testo. Anche se puoi salvarti dal digitare manualmente l'80% di esso, è fantastico!
Selezione del testo in un PDF
In Adobe Reader, se il testo è in grado di copiare, tutto ciò che devi fare è selezionarlo e fare clic con il tasto destro del mouse e scegliere copia.
In altri programmi di visualizzazione PDF come Foxit, è necessario fare clic su Utensili e poi Seleziona il testo.
Ovviamente, se tu fossi in grado di farlo, non staresti leggendo questo post! Ma nel caso, è così che si seleziona il testo. Ora passiamo al più difficile problema di copiare il testo da immagini o file PDF protetti.
Utilizzare l'OCR per copiare il testo PDF
È possibile verificare rapidamente se un file PDF è protetto in Adobe Reader cercando nella barra del titolo e cercando la parola PROTETTO.
Puoi vedere le autorizzazioni specifiche facendo clic su modificare e quindi facendo clic su Protezione e poi Proprietà di sicurezza.
Nelle versioni più recenti di Adobe Reader e Acrobat, è necessario fare clic su Proteggere nel riquadro a destra per visualizzare le opzioni di protezione.
Quindi, fare clic su Più opzioni e vedrai Proprietà di sicurezza.
Come puoi vedere di seguito, la copia dei contenuti non è consentita e la sicurezza è protetta da una password. Se conosci la password, puoi rimuovere la sicurezza e copiare tutto ciò che desideri.
A meno che tu non sia un hacker, rompere la password non è un'opzione. Quindi l'unica altra cosa che puoi fare è prendere uno screenshot del testo e poi eseguirlo attraverso un programma OCR. Sembra troppo lavoro, ma in realtà non lo è. Puoi fare uno screenshot su un Mac o PC senza software aggiuntivo.
Mac - Premi semplicemente Command + Shift + 4 sulla tastiera
finestre - Basta usare lo strumento Snipping di Windows
Inoltre, se si possiede Adobe Acrobat, è possibile utilizzarlo per convertire automaticamente il testo dell'immagine in testo modificabile. Tutto ciò che devi fare è aprire il file PDF e fare clic sullo strumento Modifica PDF nel riquadro a destra. Scorrerà automaticamente l'intero documento utilizzando OCR e lo converte in un documento completamente modificabile.
Se si dispone di un'immagine con testo, copiarla negli Appunti e quindi aprire Adobe Acrobat e scegliere File - Crea - PDF dagli Appunti.
Basta fare clic su Modifica PDF nel riquadro di destra e convertirà l'immagine in testo modificabile.
Ecco uno screenshot di un testo che non è stato possibile copiare da un file PDF protetto:
Nota che quando fai lo screenshot, assicurati che lo zoom del documento sia impostato al 100% in modo che il testo sia nitido e chiaro. Una volta ottenuto lo screenshot, scaricare un programma OCR gratuito. Ci sono molte opzioni là fuori e i risultati varieranno selvaggiamente tra i programmi, quindi dovrai provarne un paio. Ecco due che ho usato in passato:
http://download.cnet.com/FreeOCR/3000-10743_4-10717191.html
https://www.simpleocr.com/OCR-Freeware
Notare che è anche possibile utilizzare Microsoft OneNote in quanto ha funzionalità OCR incorporate. Ovviamente, se hai già un software OCR, usa invece quel programma.
Il programma FreeOCR funziona bene, devi solo assicurarti che quando lo stai installando non accetti qualcuna delle "offerte" del software, che installeranno solo junk sul tuo computer. Ma finché lo fai, il software non ha spyware o qualcosa del genere. È anche testato da CNET per garantire questo.
Ad ogni modo, una volta installato il programma, fai clic sul grande Aperto pulsante e scegli la tua immagine.
Ti mostrerà un'anteprima dell'immagine nel riquadro a sinistra. Quindi fare clic su OCR e Avvia processo OCR.
Questo è tutto! Il testo verrà ora visualizzato sul lato destro e potrai copiarlo negli Appunti o esportarlo in Microsoft Word.
Nel complesso, il programma ha fatto un ottimo lavoro con alcuni errori minori qua e là. Mi ha risparmiato un sacco di tempo anche se non dover digitare manualmente tutto quel testo. Si spera che questo ti aiuterà a copiare il testo che ti serve da un documento PDF. Invia commenti o domande e risponderò. Godere!