
Wanneer uw documenten voornamelijk uit tekst bestaan, lijkt het erop dat de bestandsgrootten voor de versies .docx en .pdf moeten zijn redelijk vergelijkbaar wanneer opgeslagen, maar dat is niet altijd het geval. De SuperUser Q & A-post van vandaag biedt het antwoord op de nieuwsgierige vragen van lezers over het grote verschil in bestandsgroottes.
De vraag en antwoordsessie van vandaag komt tot ons dankzij SuperUser - een onderdeel van Stack Exchange, een door de gemeenschap gestuurde groep van Q & A-websites .
Bokshandschoenen clip-art met dank aan Clker.com.
SuperUser-lezer Borek wil weten waarom PDF-bestanden die door Microsoft Word worden gegenereerd zo groot zijn:
Ik heb een eenvoudig Microsoft Word-document gemaakt met alleen deze zin, niets anders:
- Dit is een klein document.
Daarna heb ik het document opgeslagen als .docx- en .pdf-bestanden. Hier zijn de bestandsgroottes:
- .docx: 12 kB
- .pdf: 89 kB
Het verschil tussen de twee bestanden is enorm (technisch) en het stoort me echt wanneer documenten die meestal tekstueel van aard zijn slechts tientallen kB in .docx-indeling, maar zijn honderden kB groot als ze naar PDF-bestanden worden geconverteerd. Wat is er zo inefficiënt aan het PDF-formaat? Is het gewoon Microsoft Word met behulp van een verschrikkelijk uitvoeralgoritme?
Trouwens, de PDF-uitvoerinstellingen van mijn Microsoft Office-installatie zijn ingesteld om de kleinst mogelijke bestanden te maken:
Waarom zijn PDF-bestanden die door Microsoft Word worden gegenereerd zo groot?
SuperUser-bijdrager heeft het antwoord voor ons:
Als u het PDF-bestand opent in Notepad ++, vindt u:
En dat object wordt hier aan het eind vermeld in de / FontFile2-instructie :
De lettertypen die door een Microsoft Word-document worden gebruikt, zijn ingesloten in PDF-bestanden, zodat ze op zichzelf staan. Ik heb dit dia-deck van Adobe gebruikt om de PDF-instructies te ontcijferen.
Als u wilt voorkomen dat lettertypen worden ingesloten in een PDF-bestand, moet u ervoor zorgen dat uw Microsoft Word-documenten gebruikmaken van een van de 14 standaardlettertypen die beschikbaar zijn in PDF kijkers (Bron: Wikipedia).
- Times New Roman> Times (v3) (in normale, cursieve, vetgedrukte en vet cursieve)
- Courier New> Courier (in normale, schuine, bold en bold oblique)
- Arial> Helvetica (v3) (in normale, schuine, bold en bold oblique)
- Symbol> Symbol
- Wingdings> Zapf Dingbats
Heb je iets toe te voegen aan de uitleg? Geluid uit in de reacties. Wilt u meer antwoorden van andere technisch onderlegde Stack Exchange-gebruikers lezen? Bekijk hier de volledige discussiethread
Wat is RFID en is het echt een beveiligingsprobleem?
RFID is een technologie die ons elke dag omringt. Het zit in onze creditcards, paspoorten en sommige van de producten die we kopen. Zelfs veel van onze huisdieren hebben RFID-chips erin! RFID is in wezen een vorm van een elektronische bar-tag - een die veel kleiner kan zijn. Een lezer in de buurt kan radiogolven gebruiken om de RFID-tag te lezen zonder visueel contact.
Gebruik de verborgen 'DIAL'-functie van uw tv om Netflix en YouTube te casten zonder een Chromecast
'Veel moderne smart-tv's hebben ondersteuning voor het ingebouwde Chromecast-achtige DIAL-protocol. U kunt video's casten naar uw Tv van YouTube en Netflix - op je telefoon of computer - zonder een Chromecast te ontvangen. Dit werkt zowel met de YouTube- en Netflix-websites op je computer als met de mobiele YouTube- en Netflix-apps op een smartphone of tablet.