Waarom zijn PDF-bestanden die worden gegenereerd door Microsoft Word zo groot?
Wanneer uw documenten voornamelijk uit tekst bestaan, lijkt het erop dat de bestandsgroottes voor .docx- en .pdf-versies redelijk vergelijkbaar moeten zijn wanneer ze worden opgeslagen, maar dat is niet altijd het geval. De SuperUser Q & A-post van vandaag heeft het antwoord op de vragen van een nieuwsgierige lezer over het grote verschil in bestandsgroottes.
De Question & Answer-sessie van vandaag komt tot ons dankzij SuperUser - een onderdeel van Stack Exchange, een gemeenschapsgedreven groep van Q & A-websites.
Bokshandschoenen clip-art met dank aan Clker.com.
De vraag
SuperUser-lezer Borek wil weten waarom PDF-bestanden die door Microsoft Word worden gegenereerd zo groot zijn:
Ik heb een eenvoudig Microsoft Word-document gemaakt met alleen deze zin, verder niets:
- Dit is een klein document.
Daarna heb ik het document opgeslagen als .docx- en .pdf-bestanden. Hier zijn de bestandsgrootten:
- .docx: 12 kB
- .pdf: 89 kB
Het verschil tussen de twee bestanden is enorm (technisch) en het stoort me echt wanneer documenten die voornamelijk tekstueel van aard zijn slechts tientallen kB in .docx-indeling hebben, maar honderden kB groot zijn wanneer ze naar PDF-bestanden worden geconverteerd. Wat is er zo inefficiënt aan het PDF-formaat? Is het gewoon Microsoft Word met behulp van een verschrikkelijk output-algoritme?
Trouwens, de PDF-uitvoerinstellingen van mijn Microsoft Office-installatie zijn ingesteld om de kleinst mogelijke bestanden te maken:
Waarom zijn PDF-bestanden die worden gegenereerd door Microsoft Word zo groot??
Het antwoord
SuperUser contributor rene heeft het antwoord voor ons:
Als u het PDF-bestand opent in Notepad ++, vindt u:
En dat object wordt hier aan het eind in de / FontFile2-instructie vermeld:
De lettertypen die door een Microsoft Word-document worden gebruikt, zijn ingesloten in PDF-bestanden, zodat ze op zichzelf staan. Ik heb dit dia-deck van Adobe gebruikt om de PDF-instructies te ontcijferen.
Als u wilt voorkomen dat lettertypen worden ingesloten in een PDF-bestand, moet u ervoor zorgen dat uw Microsoft Word-documenten gebruikmaken van een van de 14 standaardlettertypen die beschikbaar zijn in PDF-viewers (Bron: Wikipedia).
- Times New Roman> Times (v3) (in normaal, cursief, vet en vet cursief)
- Courier Nieuw> Courier (in normale, schuine, bold en bold oblique)
- Arial> Helvetica (v3) (in normale, schuine, bold en bold oblique)
- Symbool> Symbool
- Wingdings> Zapf Dingbats
Heb je iets toe te voegen aan de uitleg? Geluid uit in de reacties. Wilt u meer antwoorden van andere technisch onderlegde Stack Exchange-gebruikers lezen? Bekijk hier de volledige discussiethread.