Afbeeldingen, tekst en ingesloten bestanden uit Word-, Excel- en PowerPoint-documenten extraheren
Stel dat iemand je een Word-document heeft gestuurd met veel afbeeldingen en je wilt dat je die afbeeldingen op je harde schijf bewaart. U kunt afbeeldingen uit een Microsoft Office-document extraheren met een eenvoudige truc.
Als u een Word- (.docx), Excel- (.xlsx) of PowerPoint-bestand (.pptx) met ingesloten afbeeldingen of andere bestanden hebt, kunt u deze extraheren (evenals de tekst van het document), zonder ze afzonderlijk op te slaan . En het beste van alles is dat u geen extra software nodig heeft. De op Office XML gebaseerde bestandsindelingen - docx, xlsx en pptx - zijn in feite gecomprimeerde archieven die u kunt openen zoals elk normaal ZIP-bestand met Windows. Van daaruit kunt u afbeeldingen, tekst en andere ingesloten bestanden extraheren. Je kunt de ingebouwde .zip-ondersteuning van Windows gebruiken of een app zoals 7-Zip als je dat liever hebt.
Als u bestanden uit een ouder kantoordocument moet extraheren, zoals een .doc-, .xls- of .ppt-bestand, kunt u dat doen met een klein stukje gratis software. We zullen dat proces aan het einde van deze handleiding beschrijven.
De inhoud van een nieuw Office-bestand extraheren (.docx, .xlsx of .pptx)
Om de interne inhoud van een op XML gebaseerd Office-document te openen, opent u File Explorer (of Windows Explorer in Windows 7), navigeert u naar het bestand waaruit u de inhoud wilt extraheren en selecteert u het bestand.
Druk op "F2" om het bestand een nieuwe naam te geven en de extensie (.docx, .xlsx of .pptx) in ".zip" te wijzigen. Laat het grootste deel van de bestandsnaam alleen. Druk op "Enter" als u klaar bent.
In het volgende dialoogvenster wordt u gewaarschuwd voor het wijzigen van de extensie. Klik op "Ja".
Windows herkent het bestand automatisch als een gecomprimeerd bestand. Als u de inhoud van het bestand wilt uitpakken, klikt u met de rechtermuisknop op het bestand en selecteert u 'Alles uitpakken' in het pop-upmenu.
In het dialoogvenster "Bestanden selecteren en bestanden extraheren" wordt het pad weergegeven waar de inhoud van het zip-bestand wordt uitgepakt in het vak "Bestanden worden geëxtraheerd naar deze map". Standaard wordt een map met dezelfde naam als de naam van het bestand (zonder de bestandsextensie) gemaakt in dezelfde map als het ZIP-bestand. Om de bestanden naar een andere map te extraheren, klikt u op "Bladeren".
Navigeer naar de plaats waar u de inhoud van het zip-bestand wilt ophalen en klik op "Nieuwe map" om zo nodig een nieuwe map te maken. Klik op "Selecteer map".
Als u een Verkenner (of Windows Verkenner) venster wilt openen met de map met de uitgepakte bestanden die worden weergegeven nadat ze zijn uitgepakt, schakelt u het selectievakje 'Gehaalde bestanden weergeven wanneer voltooid' in, zodat er een vinkje in het vakje staat. Klik op 'Uitpakken'.
Toegang verkrijgen tot de geëxtraheerde afbeeldingen
Inbegrepen in de geëxtraheerde inhoud is een map met de naam "woord", als uw originele bestand een Word-document is (of "xl" voor een Excel-document of "ppt" voor een PowerPoint-document). Dubbelklik op de map "word" om deze te openen.
Dubbelklik op de map "media".
Alle afbeeldingen van het originele bestand bevinden zich in de map "media". De uitgepakte bestanden zijn de originele afbeeldingen die door het document worden gebruikt. In het document kunnen resizing of andere eigenschappen worden ingesteld, maar de uitgepakte bestanden zijn de onbewerkte afbeeldingen zonder dat deze eigenschappen worden toegepast.
Toegang krijgen tot de geëxtraheerde tekst
Als Office niet op uw pc is geïnstalleerd en u tekst uit een Word- (of Excel- of PowerPoint) -bestand moet extraheren, krijgt u toegang tot de geëxtraheerde tekst in het bestand "document.xml" in de map "word".
U kunt dit bestand openen in een teksteditor, zoals Kladblok of WordPad, maar het is gemakkelijker te lezen in een speciale XML-editor, zoals het gratis programma, XML Kladblok. Alle tekst uit het bestand is beschikbaar in stukjes platte tekst, ongeacht de stijl en / of opmaak die in het document zelf is toegepast. Natuurlijk, als je gratis software gaat downloaden om deze tekst te bekijken, kun je net zo goed LibreOffice downloaden, dat Microsoft Office-documenten kan lezen.
Ingesloten OLE-objecten of bijgevoegde bestanden uitpakken
Als u ingesloten bestanden in een Word-document wilt openen wanneer u geen toegang tot Word hebt, opent u eerst het Word-bestand in WordPad (dat is ingebouwd in Windows). Mogelijk merkt u dat sommige ingesloten bestandspictogrammen niet worden weergegeven, maar ze zijn er nog steeds. Sommige ingesloten bestanden hebben mogelijk gedeeltelijke bestandsnamen. WordPad ondersteunt niet alle functies van Word, dus sommige inhoud kan onjuist worden weergegeven. Maar je zou toegang moeten hebben tot de bestanden.
Als we met de rechtermuisknop op een van de ingesloten bestanden in ons voorbeeld Word-bestand klikken, is een van de opties "Open PDF-object". Hiermee opent u het PDF-bestand in het standaard PDF-lezerprogramma op uw pc. Van daaruit kunt u het PDF-bestand opslaan op uw harde schijf.
Als WordPad geen optie heeft om uw bestand te openen, noteert u hier het bestandstype. Ons tweede bestand in dit document is bijvoorbeeld een mp3-bestand.
Ga vervolgens terug naar de map "Bestanden uit [Document]" en dubbelklik op de map "embeddings" in de map "word".
Helaas worden de bestandstypes niet bewaard in de bestandsnamen. Ze hebben allemaal een ".bin" bestandsextensie. Als u weet welke soorten bestanden in het bestand zijn ingesloten, kunt u waarschijnlijk afleiden welk bestand overeenkomt met het formaat van het bestand. In ons voorbeeld hadden we een PDF-bestand en een MP3-bestand ingebed in ons document. Omdat het MP3-bestand waarschijnlijk groter is dan het PDF-bestand, kunnen we achterhalen welk bestand dat is door naar de grootte van de bestanden te kijken en ze vervolgens te hernoemen met de juiste extensies. Hieronder hernoemen we het MP3-bestand.
Houd er rekening mee dat niet alle bestanden via dit proces automatisch worden geopend, ons PDF-bestand bijvoorbeeld correct geopend vanuit WordPad, maar we konden het niet openen door het .bin-bestand te hernoemen..
Nadat u de inhoud van het gezipte bestand hebt uitgepakt, kunt u de extensie van het oorspronkelijke bestand terugzetten naar .docx, .xlsx of .pptx. Het bestand blijft intact en kan normaal worden geopend in het bijbehorende programma.
Afbeeldingen uit oudere Office-documenten extraheren (.doc, .xls of .ppt)
Als u afbeeldingen uit een Office 2003 (of eerder) document wilt extraheren, is er een gratis tool genaamd Office Image Extraction Wizard die deze taak gemakkelijk maakt. Met dit programma kunt u afbeeldingen uit meerdere documenten (van dezelfde of verschillende typen) tegelijk extraheren. Download het programma en installeer het (er is ook een draagbare versie beschikbaar als u deze liever niet installeert).
Voer het programma uit en het welkomstscherm wordt weergegeven. Klik volgende".
Eerst moeten we het bestand selecteren waarvan u de afbeeldingen wilt extraheren. Klik in het scherm Invoer en uitvoer op de knop "Bladeren" (mappictogram) rechts van het bewerkingsvak Document.
Navigeer naar de map met het gewenste document, selecteer het en klik op "Openen".
De map die het geselecteerde bestand bevat, wordt automatisch de map Uitvoer. Als u een submap binnen die map met dezelfde naam als het geselecteerde bestand wilt maken, vinkt u het selectievakje 'Een map hier maken' aan, dus er staat een vinkje in het vakje. Klik vervolgens op "Volgende".
Klik in het scherm Ready to Start op "Start" om te beginnen met het uitpakken van de afbeeldingen.
Het volgende scherm verschijnt tijdens het extractieproces.
Klik in het scherm Voltooid op de map "Klik hier om de doelmap te openen" om de resulterende afbeeldingsbestanden te bekijken.
Omdat we ervoor hebben gekozen om een submap te maken, krijgen we een map met de afbeeldingsbestanden die uit het bestand zijn geëxtraheerd.
U ziet alle afbeeldingen als genummerde bestanden.
U kunt ook afbeeldingen uit meerdere bestanden tegelijk extraheren. Klik hiervoor in het scherm Invoer en uitvoer op het selectievakje "Batchmodus", zodat er een vinkje in het vakje staat.
Het scherm Batch invoer en uitvoer wordt weergegeven. Klik op "Bestanden toevoegen".
Navigeer in het dialoogvenster Openen naar de map met de bestanden waaruit u afbeeldingen wilt extraheren, selecteer de bestanden met de toets "Shift" of "Ctrl" om meerdere bestanden te selecteren en klik op "Openen".
U kunt bestanden uit een andere map toevoegen door opnieuw op "Bestanden toevoegen" te klikken, naar de map in het dialoogvenster Openen te navigeren, de gewenste bestanden te selecteren en op "Openen" te klikken..
Nadat u alle bestanden hebt toegevoegd waaruit u afbeeldingen wilt extraheren, kunt u ervoor kiezen om een afzonderlijke map voor elk document in dezelfde map te maken als elk document waarin de afbeeldingsbestanden zullen worden opgeslagen door te klikken op "Een map maken voor elk document "aankruisen zodat er een vinkje in het vakje staat.
U kunt ook de Uitvoermap opgeven als de "Gelijk aan de invoermap van elk bestand" of u kunt een aangepaste map invoeren of selecteren met behulp van het invoervak en de knop "Bladeren" onder die optie. Klik op "Volgende" als u de gewenste opties hebt geselecteerd.
Klik op "Start" in het scherm Ready to Start.
In het volgende scherm wordt de extractievoortgang weergegeven.
Het aantal geëxtraheerde afbeeldingen wordt weergegeven op het scherm Voltooid. Klik op "Sluiten" om de Office Image Extraction Wizard te sluiten.
Als u ervoor kiest om voor elk document een afzonderlijke map te maken, ziet u mappen met dezelfde namen als de bestanden die de afbeeldingen bevatten, afhankelijk van welke uitvoermap (len) u hebt opgegeven.
Nogmaals, we krijgen alle afbeeldingen als genummerde bestanden voor elk document.
Nu kunt u de afbeeldingen hernoemen, verplaatsen en gebruiken in uw eigen documenten. Zorg ervoor dat u over de rechten beschikt om ze legaal te gebruiken.