Tools om het web vast te leggen en te converteren

Webpagina's en HTML converteren naar PDF

Python API

Bij het converteren van webpagina's en HTML naar PDF GrabzIt's Python API biedt de volgende functies die helpen integrate GrabzIt into uw systeem zo gemakkelijk mogelijk. Onthoud echter voordat u begint dat nadat u de URLToPDF, HTMLToPDF or FileToPDF methoden de Save or SaveTo methode moet worden aangeroepen om de PDF-schermafbeelding te maken.

Basisopties

Vaak bij het converteren van een webpagina intoa een PDF-document, er worden veel pagina's geproduceerd om de hele webpagina weer te geven. Er is slechts één parameter vereist om een ​​webpagina te converteren intoa PDF-document of naar HTML omzetten naar PDF zoals weergegeven in de onderstaande voorbeelden.

grabzIt.URLToPDF("https://www.tesla.com")
# Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>")
# Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html")
# Then call the Save or SaveTo method

Aangepaste identificatie

U kunt een aangepaste identificatie doorgeven aan de PDF methoden zoals hieronder weergegeven, wordt deze waarde vervolgens teruggegeven aan uw GrabzIt Python-handler. Deze aangepaste identificatie kan bijvoorbeeld een database-identificatie zijn, waardoor een screenshot kan worden gekoppeld aan een bepaald database-record.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.URLToPDF("https://www.tesla.com", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")
from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.customId = "123456"

grabzIt.FileToPDF("example.html", options)
# Then call the Save method
grabzIt.Save("http://www.example.com/handler.py")

Kop- en voetteksten

Wanneer u een PDF-screenshot maakt, kunt u een verzoek indienen om een ​​bepaalde toe te passen sjabloon naar de gegenereerde PDF. Deze sjabloon moet zijn saved van tevoren en specificeert de inhoud van de kop- en voettekst samen met eventuele speciale variabelen. In de onderstaande voorbeeldcode gebruikt de gebruiker zijn sjabloon met de naam "mijn sjabloon".

Als de boven- of ondermarge niet groot genoeg is voor respectievelijk de kop- of voettekst, wordt deze niet in de PDF weergegeven. In het onderstaande voorbeeld hebben we de boven- en ondermarge ingesteld op 20 om voldoende ruimte te bieden.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.marginTop = 20
options.marginBottom = 20
options.templateId = "my template"

grabzIt.FileToPDF("example.html", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Converteer HTML-element naar PDF

Als u gewoon een HTML-element zoals een div of span direct wilt converteren inteen PDF-document dat u kunt met de Python-bibliotheek van GrabzIt. Je moet het passeren CSS-selector van het HTML-element dat u wilt converteren naar de targetElement parameter.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

In dit voorbeeld willen we alle inhoud vastleggen in de reeks met de id van Article, daarom geven we dit door aan GrabzIt zoals hieronder weergegeven.

from GrabzIt import GrabzItPDFOptions
from GrabzIt import GrabzItClient

grabzIt = GrabzItClient.GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret")

options = GrabzItPDFOptions.GrabzItPDFOptions()
options.targetElement = "#Article"

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options)
# Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf")

Hoe een PDF wordt bijgesneden bij het targeten van een HTML-element kan zijn gecontroleerd met behulp van deze technieken.