2009-09-27 11:06:58 +0000 2009-09-27 11:06:58 +0000
40
40
Advertisement

Impossible de copier le texte d'un fichier pdf

Advertisement

J'utilise foxit PDF reader pour consulter mon manuel. J'aimerais copier le texte du fichier PDF dans un document Word, mais il ne me le permet pas. Je peux bien sélectionner le texte, mais l'option de copie du texte n'est pas disponible. Je peux copier le texte d'autres documents, mais pas certains. Y a-t-il un moyen de contourner cette protection dans les fenêtres ?

Advertisement
Advertisement

Réponses (10)

29
29
29
2009-09-27 11:22:46 +0000

Le fichier pdf a probablement été verrouillé contre la copie de texte. Vous trouverez ci-dessous deux façons de le déverrouiller : Si le fichier PDF n'a pas été verrouillé contre l'impression, vous pouvez l'imprimer sur une imprimante PDF virtuelle pour créer un fichier déverrouillé. Voir ce qui suit : “Supprimer le mot de passe et déverrouiller le PDF protégé qui permettait d'être imprimé sans connaître le secret” . 2. Si la fonction d'impression a été verrouillée, voir ceci : “Supprimer les restrictions et décrypter les fichiers PDF protégés par un mot de passe avec un déverrouilleur de PDF” .

25
25
25
2012-07-16 09:54:15 +0000
  1. Ouvrez le PDF dans Google Chrome (glissez-déposez le fichier PDF dans Chrome).
  2. Imprimez la page en question au format PDF ou ouvrez simplement l'aperçu avant impression.
  3. Vous pouvez maintenant copier le texte à partir de l'aperçu avant impression ou sortir le PDF. Mais vous ne pouvez pas copier le tableau directement.
12
Advertisement
12
12
2012-07-15 23:33:28 +0000
Advertisement

J'ai pu créer une version sans DRM de votre fichier PDF en utilisant Ghostscript (qui est disponible pour Windows).

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Le fichier stripped.pdf qui en résulte peut être chargé dans Adobe Reader, et ce dernier vous permettra volontiers d'en copier n'importe quelle partie. Il conserve également la majeure partie du formatage du tableau.

2
2
2
2012-07-15 21:19:08 +0000

J'ai pu copier le tableau de votre fichier PDF avec succès en utilisant Okular (pour Linux ; partie de KDE). Pour ce faire, j'ai dû aller dans les paramètres d'Okular et décocher “Obéir aux restrictions DRM”.

Je suis conscient que cela ne vous aide pas vraiment beaucoup puisque vous utilisez Windows, mais c'est une possibilité si vous avez une machine Linux à portée de main ou si vous êtes prêt à l'installer.

Malheureusement, il s'agissait de texte simple sans formatage, mais il semble qu'il ne devrait pas être trop difficile de recréer le tableau. Vous pouvez voir les résultats de mon aventure du copier-coller ici .

1
Advertisement
1
1
2012-07-27 07:58:44 +0000
Advertisement

Vous pouvez utiliser GT Text est un programme qui permet de traduire des images (également des instantanés pdf = image) en texte. Vous pouvez sélectionner la zone et la copier dans le presse-papiers. C'est gratuit

La page d'accueil officielle est http://gttext.googlecode.com

1
1
1
2019-04-15 08:05:52 +0000

si la copie est grisée, comme c'est maintenant le cas pour vous, alors le PDF est “verrouillé”, il peut être lu mais vous empêche effectivement de copier/coller quoi que ce soit à partir de celui-ci.

Ce site Internet déverrouillera un PDF https://smallpdf.com/unlock-pdf

0
Advertisement
0
0
2012-09-13 14:24:39 +0000
Advertisement

Une autre possibilité est Evince . Dans Windows , il semble que la copie soit prise en charge par défaut.

Sous Linux, la copie peut être activée en vérifiant le paramètre override_restrictions s'il ne l'est pas déjà, en suivant ces instructions (dconf-editor/org/gnome/evinceoverride_restrictions).

0
0
0
2015-09-09 19:49:19 +0000

Cela a permis de convertir le texte de base. Mais il s'est buté à des tableaux. http://www.onlineocr.net/documents

0
Advertisement
0
0
2012-07-15 21:07:35 +0000
Advertisement

Réponse à endolith :

Votre PDF est protégé contre la copie, mais n'est pas protégé contre l'impression.

J'ai donc imprimé la page contenant le tableau 6.15 dans un autre PDF qui n'est pas protégé contre la copie, j'ai sélectionné et copié le tableau, puis je l'ai collé dans Word. À ma grande surprise, le résultat du collage était complètement nul.

J'ai maintenant jeté un nouveau coup d'oeil à ce tableau et j'ai trouvé un résultat très surprenant : Ce n'est pas un tableau !

C'est en fait un montage de petits morceaux de texte, positionnés sur la page de manière à ressembler à un tableau. Mais ce n'est pas un vrai tableau.

Le mieux que vous puissiez faire est soit de réécrire le tout sous forme de tableau, soit d'utiliser dans votre travail une capture d'écran de ce texte assemblé en forme de tableau.

Voici ma capture d'écran du tableau, telle qu'elle est tirée de mon document pdf d'une page généré :

0
0
0
2012-07-11 17:34:13 +0000

Si vous cherchez juste de courts extraits, vous pouvez souvent taper quelques mots dans google entre guillemets et trouver la citation exacte déjà scannée dans un autre format ou tapée par quelqu'un d'autre.

Une autre option est “Document from Photo” dans l'application Android de Google Docs, qui met le texte entre guillemets. Bien entendu, cette option est sujette à des erreurs.

J'aimerais que la fonctionnalité de verrouillage des PDF n'ait jamais existé :(

Advertisement

Questions connexes

19
7
12
9
5
Advertisement