Een veel voorkomende taak is om afbeeldingen van een website te downloaden met GrabzIt is Web Scraper Dit is makkelijk. Maak eerst een nieuwe scrape met de normale details zoals de startpagina van de scrape en eventuele andere opties.
Ga dan naar de Schraapinstructies Tab en klik op de knop knop. Dit komt in de
Page
trefwoord into de schraapinstructies en zal een drop-down openen. kiezen getTagAttributes
van de lijst. Volgende toevoegen 'src'
als de eerste parameter vertelt dit de Web Scraper het src-kenmerk te extraheren en vervolgens een komma te typen.
Klik vervolgens op de Hiermee kunt u de Web Scraper vertellen uit welke elementen het src-kenmerk moet worden geëxtraheerd. Zorg ervoor dat in het filtervenster het type is ingesteld op 'Webpagina' en dat de beperking 'tagnaam' en 'gelijk aan' is. Voer vervolgens in
img
in het tekstvak en klik vervolgens op de knop Toevoegen en vervolgens op Filter invoegen. Voltooi de instructie door een puntkomma aan het einde van de regel toe te voegen.
Je zou moeten blijven zitten met zoiets als wat hieronder wordt getoond.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
De bovenstaande code haalt alle afbeeldings-URL's uit de webpagina, maar we moeten nu die afbeeldings-URL's gebruiken om save die afbeeldingen als bestanden. Om dit te doen zullen we dit commando minus de puntkomma in een wikkelen Data.saveFile
commando. Ga hiervoor naar het begin van de regel en selecteer de knop. Selecteer vervolgens in de vervolgkeuzelijst
saveFile
, ga dan naar het einde van de regel en voeg een toe )
voor de puntkomma.
U zou nu de volgende schraapinstructies moeten hebben.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Als u nu de scrape uitvoert, haalt u alle afbeeldingen van de website. Veel van deze zelfstudie had ook kunnen worden bereikt met behulp van de wizardknop op de werkbalk Schraapinstructies.