
Wanneer uw documenten voornamelijk uit tekst bestaan, lijkt het erop dat de bestandsgrootten voor de versies .docx en .pdf moeten zijn redelijk vergelijkbaar wanneer opgeslagen, maar dat is niet altijd het geval. De SuperUser Q & A-post van vandaag biedt het antwoord op de nieuwsgierige vragen van lezers over het grote verschil in bestandsgroottes.
De vraag en antwoordsessie van vandaag komt tot ons dankzij SuperUser - een onderdeel van Stack Exchange, een door de gemeenschap gestuurde groep van Q & A-websites .
Bokshandschoenen clip-art met dank aan Clker.com.
SuperUser-lezer Borek wil weten waarom PDF-bestanden die door Microsoft Word worden gegenereerd zo groot zijn:
Ik heb een eenvoudig Microsoft Word-document gemaakt met alleen deze zin, niets anders:
- Dit is een klein document.
Daarna heb ik het document opgeslagen als .docx- en .pdf-bestanden. Hier zijn de bestandsgroottes:
- .docx: 12 kB
- .pdf: 89 kB
Het verschil tussen de twee bestanden is enorm (technisch) en het stoort me echt wanneer documenten die meestal tekstueel van aard zijn slechts tientallen kB in .docx-indeling, maar zijn honderden kB groot als ze naar PDF-bestanden worden geconverteerd. Wat is er zo inefficiënt aan het PDF-formaat? Is het gewoon Microsoft Word met behulp van een verschrikkelijk uitvoeralgoritme?
Trouwens, de PDF-uitvoerinstellingen van mijn Microsoft Office-installatie zijn ingesteld om de kleinst mogelijke bestanden te maken:
Waarom zijn PDF-bestanden die door Microsoft Word worden gegenereerd zo groot?
SuperUser-bijdrager heeft het antwoord voor ons:
Als u het PDF-bestand opent in Notepad ++, vindt u:
En dat object wordt hier aan het eind vermeld in de / FontFile2-instructie :
De lettertypen die door een Microsoft Word-document worden gebruikt, zijn ingesloten in PDF-bestanden, zodat ze op zichzelf staan. Ik heb dit dia-deck van Adobe gebruikt om de PDF-instructies te ontcijferen.
Als u wilt voorkomen dat lettertypen worden ingesloten in een PDF-bestand, moet u ervoor zorgen dat uw Microsoft Word-documenten gebruikmaken van een van de 14 standaardlettertypen die beschikbaar zijn in PDF kijkers (Bron: Wikipedia).
- Times New Roman> Times (v3) (in normale, cursieve, vetgedrukte en vet cursieve)
- Courier New> Courier (in normale, schuine, bold en bold oblique)
- Arial> Helvetica (v3) (in normale, schuine, bold en bold oblique)
- Symbol> Symbol
- Wingdings> Zapf Dingbats
Heb je iets toe te voegen aan de uitleg? Geluid uit in de reacties. Wilt u meer antwoorden van andere technisch onderlegde Stack Exchange-gebruikers lezen? Bekijk hier de volledige discussiethread
Alles wat u moet weten over Aan de slag met de Raspberry Pi
Nu meer dan vier jaar oud, heeft de Raspberry Pi, een goedkope creditcardcomputer, de wereld van computers en doe-het-zelf overgenomen storm. Lees verder terwijl we u begeleiden van alles, van kopen tot stroomvoorziening tot het uitvoeren van de kleine dynamo. Wat is de Raspberry Pi? De Raspberry Pi is een computer met een creditcard die is ontworpen en geproduceerd door de Raspberry Pi Foundation, een organisatie zonder winstoogmerk die zich bezighoudt met het zo breed mogelijk toegankelijk maken van computers en programmeerinstructie.
Hoe browsers de identiteit van de website verifiëren en beschermen tegen Imposters
Is het u ooit opgevallen dat uw browser soms de naam van een website op een gecodeerde website weergeeft? Dit is een teken dat de website een uitgebreid validatiecertificaat heeft, waarmee wordt aangegeven dat de identiteit van de website is geverifieerd. EV-certificaten bieden geen extra coderingssterkte; in plaats daarvan geeft een EV-certificaat aan dat uitgebreide verificatie van de identiteit van de website plaatsgevonden.