Startpagina » hoe » Waarom zijn PDF-bestanden die worden gegenereerd door Microsoft Word zo groot?

    Waarom zijn PDF-bestanden die worden gegenereerd door Microsoft Word zo groot?

    Wanneer uw documenten voornamelijk uit tekst bestaan, lijkt het erop dat de bestandsgroottes voor .docx- en .pdf-versies redelijk vergelijkbaar moeten zijn wanneer ze worden opgeslagen, maar dat is niet altijd het geval. De SuperUser Q & A-post van vandaag heeft het antwoord op de vragen van een nieuwsgierige lezer over het grote verschil in bestandsgroottes.

    De Question & Answer-sessie van vandaag komt tot ons dankzij SuperUser - een onderdeel van Stack Exchange, een gemeenschapsgedreven groep van Q & A-websites.

    Bokshandschoenen clip-art met dank aan Clker.com.

    De vraag

    SuperUser-lezer Borek wil weten waarom PDF-bestanden die door Microsoft Word worden gegenereerd zo groot zijn:

    Ik heb een eenvoudig Microsoft Word-document gemaakt met alleen deze zin, verder niets:

    • Dit is een klein document.

    Daarna heb ik het document opgeslagen als .docx- en .pdf-bestanden. Hier zijn de bestandsgrootten:

    • .docx: 12 kB
    • .pdf: 89 kB

    Het verschil tussen de twee bestanden is enorm (technisch) en het stoort me echt wanneer documenten die voornamelijk tekstueel van aard zijn slechts tientallen kB in .docx-indeling hebben, maar honderden kB groot zijn wanneer ze naar PDF-bestanden worden geconverteerd. Wat is er zo inefficiënt aan het PDF-formaat? Is het gewoon Microsoft Word met behulp van een verschrikkelijk output-algoritme?

    Trouwens, de PDF-uitvoerinstellingen van mijn Microsoft Office-installatie zijn ingesteld om de kleinst mogelijke bestanden te maken:

    Waarom zijn PDF-bestanden die worden gegenereerd door Microsoft Word zo groot??

    Het antwoord

    SuperUser contributor rene heeft het antwoord voor ons:

    Als u het PDF-bestand opent in Notepad ++, vindt u:

    En dat object wordt hier aan het eind in de / FontFile2-instructie vermeld:

    De lettertypen die door een Microsoft Word-document worden gebruikt, zijn ingesloten in PDF-bestanden, zodat ze op zichzelf staan. Ik heb dit dia-deck van Adobe gebruikt om de PDF-instructies te ontcijferen.

    Als u wilt voorkomen dat lettertypen worden ingesloten in een PDF-bestand, moet u ervoor zorgen dat uw Microsoft Word-documenten gebruikmaken van een van de 14 standaardlettertypen die beschikbaar zijn in PDF-viewers (Bron: Wikipedia).

    • Times New Roman> Times (v3) (in normaal, cursief, vet en vet cursief)
    • Courier Nieuw> Courier (in normale, schuine, bold en bold oblique)
    • Arial> Helvetica (v3) (in normale, schuine, bold en bold oblique)
    • Symbool> Symbool
    • Wingdings> Zapf Dingbats

    Heb je iets toe te voegen aan de uitleg? Geluid uit in de reacties. Wilt u meer antwoorden van andere technisch onderlegde Stack Exchange-gebruikers lezen? Bekijk hier de volledige discussiethread.