Hallo,
ich möchte das Thema nochmal aufwärmen, weil es mich heute wieder ärgert.
Prinzipiell möchte ich PDFs, die mein MuFu-Drucker erstellt, durchsuchbar machen. Das klappt mit ocrmypdf auch recht gut. Ist die Vorlage okay, ist das Ergebnis zufriedenstellend.
Wenn ich aber z.B. mit Okular in dem PDF Text markieren will, um ihn zu kopieren, passt die Auswahl nicht zum Originaltext. Es fehlt rechts immer was bzw. wenn ich bis zum vermeintlich letzten Buchstaben markiere, hab ich zu viel Text. Oder ich suche ein Wort, das im PDF enthalten ist, und erhalte optisch zu wenig markiert. Der Textlayer passt einfach nicht zur gescannten Vorlage.
Ich habe mal ein Screenshot angehangen, das mein Problem hoffentlich verständlich zeigt:
Es ist eine Rechnung, die ich nach der Konvertierung mit ocrmypdf in Okular geladen und nach dem Wort Rechnung durchsucht habe. Ihr seht, dass der letzte Buchstabe nicht markiert wird, obwohl ich nach dem vollständigen Wort gesucht habe. Das ist jetzt nur die Optik. Drücke ich Strg+c habe ich das Wort Rechnung in der Zwischenablage.
Wenn ich aber mit der Maus das Wort Rechnung markieren will, passiert dasselbe. Es fehlt optisch das g. Will ich das auch noch erwischen und ziehe die Maus weiter nach rechts, markiere ich die nächste Zeile mit. Ich darf also nicht alles markieren und muss beim Einfügen hoffen, dass ich doch alles verwischt habe, was ich markieren wollte. Das stört besonders arg, wenn ich einen Textblock auf einem Textabschnitt kopieren will.
Ist das nur bei mir so? Ich habe die Doku schon rauf und runter gelesen. Ich finde nix, um das Ergebnis zu verbessern.
P.S. Ich habe das PDF auch im Firefox und Chromium geladen und erhalte bei den Aktionen exakt dasselbe Ergebnis.
Edit: Screenshot angehängt