Dansk Regneark Forum
  Hjælp Hjælp  Søg i forum   Arrangementer   Opret ny bruger Opret ny bruger  Log ind Log ind


Emne lukketUdtrække tekster fra PDF-filer med VBA

 Besvar Besvar
Forfatter
maxzpad Se dropdown
Guld bruger
Guld bruger
Avatar

Medlem: 04.Aug.2016
Land: Danmark
Status: Offline
Point: 569
Direkte link til dette indlæg Emne: Udtrække tekster fra PDF-filer med VBA
    Sendt: 11.Aug.2016 kl. 09:38
Jeg vil høre, om nogen i forummet kender til bedre løsninger end min egen til at udtrække tekst/linjer fra PDF-filer ved hjælp af VBA.

Jeg bruger Windows Script Host Object Model-referencebiblioteket til at kalde et eksternt kommandolinjeprogram, pdftotext.exe, som dumper PDF-filens tekster ud i en rå tekstfil, som jeg efterfølgende læser ind linje for linje i et array ved hjælp af VBA. Jeg looper så arrayet igennem et antal gange for at "smage" på teksterne/linjerne ud fra en kortere eller længere logik.

I alt væsentligt virker det faktisk fint, og performance/runtime er egentlig også ganske tålelig - selv med store PDF-filer, men i min evige jagt på mere effektive løsninger, vil jeg høre, om nogen kender til bedre/hurtigere løsninger - eller måske "mere korrekte" løsninger set ud fra et programmeringsteknisk synspunkt (jeg er selvlært i VBA) eller i forhold til mulighederne med reference til Adobe Acrobat Library eller lignende.


Mvh Max
Til top



Til top
 Besvar Besvar

Skift forum Forum tilladelser Se dropdown

© 2010 - 2024 Dansk Regneark Forum - en del af Excel-regneark.dk