Print side | Luk vindue

Udtrække tekster fra PDF-filer med VBA

Udskrevet fra: Dansk Regneark Forum
Kategori: Hjælp til regneark.
Forum navn: Makro og VBA
Forum beskrivelse: Hjælp til Makroer og VBA-programmering
Web-adresse: https://forum.excel-regneark.dk/forum_posts.asp?TID=2669
Udskrevet den: 05.Maj.2024 kl. 16:03


Emne: Udtrække tekster fra PDF-filer med VBA
Besked fra: maxzpad
Emne: Udtrække tekster fra PDF-filer med VBA
Posteringsdato: 11.Aug.2016 kl. 09:38
Jeg vil høre, om nogen i forummet kender til bedre løsninger end min egen til at udtrække tekst/linjer fra PDF-filer ved hjælp af VBA.

Jeg bruger Windows Script Host Object Model-referencebiblioteket til at kalde et eksternt kommandolinjeprogram, pdftotext.exe, som dumper PDF-filens tekster ud i en rå tekstfil, som jeg efterfølgende læser ind linje for linje i et array ved hjælp af VBA. Jeg looper så arrayet igennem et antal gange for at "smage" på teksterne/linjerne ud fra en kortere eller længere logik.

I alt væsentligt virker det faktisk fint, og performance/runtime er egentlig også ganske tålelig - selv med store PDF-filer, men i min evige jagt på mere effektive løsninger, vil jeg høre, om nogen kender til bedre/hurtigere løsninger - eller måske "mere korrekte" løsninger set ud fra et programmeringsteknisk synspunkt (jeg er selvlært i VBA) eller i forhold til mulighederne med reference til Adobe Acrobat Library eller lignende.


Mvh Max



Print side | Luk vindue