Tools om het web vast te leggen en te converteren

Hoe converteert GrabzIt HTML naar DOCX

HTML kan veel ingewikkelde structuren weergeven, zoals inline DIV's of SPAN's naast elkaar. HTML-elementen overlappen elkaar en randen worden toegepast op verschillende HTML-elementen. Voor het grootste deel zou dit geen verstandige aanpak zijn in DOCX, terwijl het wel mogelijk zou zijn om dit te creëren floatAls je HTML-elementen met tekstvakken zou combineren, zou dit ertoe leiden dat bijna alle inhoud in tekstvakken zou worden opgenomen, wat zou resulteren in een zeer lelijk en rommelig Word-document.

Het is vanwege dit probleem dat we het negeren floating van HTML-elementen en randen van de meeste HTML-elementen. We respecteren echter wel de randen van sommige HTML-elementen, zoals tabelcellen en de uitlijning van afbeeldingselementen.

Betekent dit dat je de inhoud niet naast elkaar kunt plaatsen? Nee. Dit is nog steeds mogelijk door gebruik te maken van kolom CSS-kenmerken, HTML-tabellen en tabstops zoals hieronder beschreven.

Als u wilt dat een HTML-document precies wordt vastgelegd zoals het op het scherm wordt weergegeven, kunt u dat beter doen converteer de HTML naar PDF omdat het PDF-bestandsformaat absolute positionering gebruikt.

Tabstops

Tabstops zijn een speciale DOCX-functie die wordt geactiveerd als floatHTML-elementen met tekstuitlijning bevinden zich in een HTML-element met een breedte van 100% dat zelf geen specifieke tekstuitlijning heeft. Dit is belangrijk omdat dit betekent dat normale uitlijning niet mag worden toegepast op de onderliggende elementen. Dit gebeurt door gebruik te maken van text-align:start. Houd er rekening mee dat tabstops niet werken binnen een tabel of lijst.

Een voorbeeld hiervan ziet u hieronder.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>

Teksttaal

Om ervoor te zorgen dat tekst in het DOCX-document een bepaalde taal heeft. De HTML tag-element van het HTML-document moet een lang attribuut. Of een ander HTML-element in het HTML-document, zoals a P Voor de tag moet een taal zijn opgegeven.

Als voor het onderliggende HTML-element geen lang-tag is opgegeven, valt de taal terug naar de documentstandaard. Als er niets is opgegeven, wordt Engels gebruikt.