Wanneer uw documenten voornamelijk uit tekst bestaan, lijkt het erop dat de bestandsgrootten voor de versies .docx en .pdf moeten zijn redelijk vergelijkbaar wanneer opgeslagen, maar dat is niet altijd het geval. De SuperUser Q & A-post van vandaag biedt het antwoord op de nieuwsgierige vragen van lezers over het grote verschil in bestandsgroottes.
De vraag en antwoordsessie van vandaag komt tot ons dankzij SuperUser - een onderdeel van Stack Exchange, een door de gemeenschap gestuurde groep van Q & A-websites .
Bokshandschoenen clip-art met dank aan Clker.com.
SuperUser-lezer Borek wil weten waarom PDF-bestanden die door Microsoft Word worden gegenereerd zo groot zijn:
Ik heb een eenvoudig Microsoft Word-document gemaakt met alleen deze zin, niets anders:
- Dit is een klein document.
Daarna heb ik het document opgeslagen als .docx- en .pdf-bestanden. Hier zijn de bestandsgroottes:
- .docx: 12 kB
- .pdf: 89 kB
Het verschil tussen de twee bestanden is enorm (technisch) en het stoort me echt wanneer documenten die meestal tekstueel van aard zijn slechts tientallen kB in .docx-indeling, maar zijn honderden kB groot als ze naar PDF-bestanden worden geconverteerd. Wat is er zo inefficiënt aan het PDF-formaat? Is het gewoon Microsoft Word met behulp van een verschrikkelijk uitvoeralgoritme?
Trouwens, de PDF-uitvoerinstellingen van mijn Microsoft Office-installatie zijn ingesteld om de kleinst mogelijke bestanden te maken:
Waarom zijn PDF-bestanden die door Microsoft Word worden gegenereerd zo groot?
SuperUser-bijdrager heeft het antwoord voor ons:
Als u het PDF-bestand opent in Notepad ++, vindt u:
En dat object wordt hier aan het eind vermeld in de / FontFile2-instructie :
De lettertypen die door een Microsoft Word-document worden gebruikt, zijn ingesloten in PDF-bestanden, zodat ze op zichzelf staan. Ik heb dit dia-deck van Adobe gebruikt om de PDF-instructies te ontcijferen.
Als u wilt voorkomen dat lettertypen worden ingesloten in een PDF-bestand, moet u ervoor zorgen dat uw Microsoft Word-documenten gebruikmaken van een van de 14 standaardlettertypen die beschikbaar zijn in PDF kijkers (Bron: Wikipedia).
- Times New Roman> Times (v3) (in normale, cursieve, vetgedrukte en vet cursieve)
- Courier New> Courier (in normale, schuine, bold en bold oblique)
- Arial> Helvetica (v3) (in normale, schuine, bold en bold oblique)
- Symbol> Symbol
- Wingdings> Zapf Dingbats
Heb je iets toe te voegen aan de uitleg? Geluid uit in de reacties. Wilt u meer antwoorden van andere technisch onderlegde Stack Exchange-gebruikers lezen? Bekijk hier de volledige discussiethread
Uw Windows Server Cipher Suite voor betere beveiliging bijwerken
U voert een respectabele website uit die uw gebruikers kunnen vertrouwen. Rechts? Misschien wil je dat twee keer controleren. Als uw site op Microsoft Internet Information Services (IIS) wordt uitgevoerd, kunt u een verrassing verwachten. Wanneer uw gebruikers proberen verbinding te maken met uw server via een beveiligde verbinding (SSL / TLS), biedt u deze mogelijk geen veilige optie.
HTG evalueert de Netgear Nighthawk X6: een beefy tri-band router voor een druk, modern huis
Als u op zoek bent naar een upgrade van de router (we kijken naar die van u nog steeds schommelt de router die je ISP jaren geleden gaf), de Nighthawk X6 is een ultra-premium doe-het-allemaal router met snelheid en functies die je maar kunt missen. Verder lijkt het op een experiment van een gekke wetenschapper waarbij een kever wordt gekruist met de Batmobile.