nl.phhsnews.com


nl.phhsnews.com / Afbeeldingen uit een PDF-bestand extraheren en opslaan in Linux

Afbeeldingen uit een PDF-bestand extraheren en opslaan in Linux


U kunt PDF-bestanden eenvoudig converteren naar bewerkbare tekst in Linux met behulp van het opdrachtregelhulpprogramma "pdftotext". Als er echter afbeeldingen in het originele PDF-bestand staan, worden deze niet geëxtraheerd. Als u afbeeldingen uit een PDF-bestand wilt extraheren, kunt u een ander opdrachtregelprogramma gebruiken met de naam "pdfimages".

OPMERKING: Wanneer we zeggen dat u iets in dit artikel typt en er zijn aanhalingstekens rond de tekst, typt u de aanhalingstekens niet, tenzij we anders opgeven.

De tool "pdfimages" maakt deel uit van het pakket poppler-utils. U kunt controleren of het op uw systeem is geïnstalleerd en installeer het indien nodig met behulp van de stappen die in dit artikel worden beschreven.

Om afbeeldingen uit een PDF-bestand met pdfimages te extraheren, drukt u op "Ctrl + Alt + T" om een ​​terminalvenster te openen . Typ de volgende opdracht bij de prompt.

pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

RELATED: Een PDF-bestand converteren naar bewerkbare tekst met de opdrachtregel in Linux

OPMERKING: vervang voor alle opdrachten in dit artikel het eerste pad in de opdracht en de PDF-bestandsnaam naar het pad en de bestandsnaam voor uw originele PDF-bestand. Het tweede pad moet het pad naar de hoofdmap zijn waarin u de geëxtraheerde afbeeldingen wilt opslaan. Het woord "afbeelding" aan het einde van het tweede pad staat voor alles waarmee u uw bestandsnaam wilt invoegen. De bestandsnamen van de afbeeldingen zijn automatisch genummerd (000, 001, 002, 003, etc.). Als u tekst aan het begin van elke afbeelding wilt toevoegen, voert u die tekst aan het einde van het tweede pad in. In ons voorbeeld begint elke bestandsnaam van een afbeelding met "image", zoals image-001.ppm, image-002.ppm, enz. Een streepje wordt toegevoegd tussen de tekst die u opgeeft en het nummer.

Het standaard afbeeldingsformaat is PPM (portable pixmap) voor niet-monochrome afbeeldingen of PBM (portable bitmap) voor monochrome afbeeldingen. Deze indelingen zijn ontworpen om eenvoudig tussen platforms te worden uitgewisseld. OPMERKING: mogelijk krijgt u twee afbeeldingsbestanden voor elke afbeelding in uw PDF-bestand. De tweede afbeelding voor elke afbeelding is leeg, dus u kunt aan de afbeelding in Bestandsbeheer zien welke afbeeldingen de afbeeldingen uit het bestand bevatten.

Om .jpg-afbeeldingsbestanden te maken, voegt u " -j "optie voor de opdracht, zoals hieronder weergegeven.

pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

OPMERKING: U kunt ook de standaarduitvoer wijzigen naar PNG met de "-png" -optie of TIFF met de "-tiff" -optie.

Het hoofdbeeldbestand voor elke afbeelding wordt opgeslagen als een .jpg-bestand. De tweede lege afbeelding is nog steeds een bestand van .ppm of .pbm.

Als u alleen afbeeldingen op en na een bepaalde pagina wilt converteren, gebruikt u de optie "-f" met een nummer om de eerste pagina aan te geven die moet worden geconverteerd, zoals weergegeven in de onderstaande voorbeeldopdracht.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

OPMERKING: We hebben de optie "-j" gecombineerd met de "-f" optie zodat we .jpg afbeeldingen zouden krijgen en hetzelfde deden met de "-l" optie hieronder.

Om alle afbeeldingen vóór en op een bepaalde pagina te converteren, gebruikt u de "-l" ( een kleine letter "L", niet de nummer "1") optie met een cijfer om de laatste te converteren pagina aan te geven, zoals hieronder getoond.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

OPMERKING: U kunt de "-f" en "-l" -opties samen gebruiken om afbeeldingen in een bepaald paginabereik in het midden van uw document te converteren.

Als er een eigenaar wachtwoord op het PDF-bestand, ons e de "-opw" -optie en het wachtwoord in enkele aanhalingstekens, zoals hieronder weergegeven. Als het wachtwoord van het PDF-bestand een gebruikerswachtwoord is, gebruikt u in plaats daarvan de "-upw" -optie met het wachtwoord.

OPMERKING: zorg ervoor dat er enkele aanhalingstekens rond uw wachtwoord staan ​​in de opdracht.

pdfimages -opw 'wachtwoord '-j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

Voor meer informatie over het gebruik van de opdracht pdfimages, typ "pdfimages" bij de prompt in een Terminal-venster en druk op "Enter" ”. Het gebruik van de opdracht wordt weergegeven met een lijst met beschikbare opties voor gebruik in de opdracht.


Hoe u video op uw Apple TV met VLC afspeelt

Hoe u video op uw Apple TV met VLC afspeelt

Als het gaat om het afspelen van video, is de platformonafhankelijke toepassing VLC een echte Zwitsers zakmes. Het is al geruime tijd populair op Windows, Mac en Linux, maar nu kun je diezelfde geweldige spelen - alles onder de zon - krijgen op je Apple TV. Zoals de meeste set-top mediaspelers, is de Apple TV is super goed in het afspelen van inhoud die wordt aangeboden door het moederbedrijf (Apple), maar vereist een beetje finesse om inhoud uit andere bronnen (zoals uw verzameling van persoonlijke media, internet of andere streamingbronnen) af te spelen.

(how-to)

Fillable-formulieren maken met Microsoft Word

Fillable-formulieren maken met Microsoft Word

Formulieren maken met Microsoft Word is eenvoudig, maar de uitdaging zit erin wanneer u invulbare formulieren maakt met opties die u naar mensen kunt verzenden en hebben ze vullen digitaal in. Of u nu een formulier nodig hebt voor het verzamelen van informatie over mensen of als u een enquête probeert uit te voeren om gebruikersreacties op software of een nieuw product te testen, MS Word heeft de oplossing voor u.

(how-to)