Tools om het web vast te leggen en te converteren
GrabzIt is een online community

Beginner die hulp nodig heeft (oorspronkelijk in het verkeerde gebied gepost)

Stel vragen over het gebruik van de screenshot-tool van GrabzIt.

Hallo gemeenschap,

Vergeef alstublieft mijn onwetendheid. Ik ben een zakenman, geen techneut. Ik weet zeker dat dit terugkomt in mijn vragen.

Is het mogelijk om de robuustere selectie- en controleparameters in de Web Scrape-tool te gebruiken, zoals URL-patroon (meest kritieke) en Lines volgen-besturingsinstellingen met de screenshot-tool. Het enige dat ik wil is een basis-URL en uitgebreide domeinen vanaf die URL crawlen, met beperkingen voor het aantal lagen dat de crawl zal ondergaan. Mijn doel is alleen maar om nieuwsartikelen uit een bepaalde domeinset te verzamelen. Ik zou liever alleen de tekst als uitvoer nemen, maar ik kan ermee leven dat de afbeeldingen in de docx worden afgeleverd. De uitvoer van de screenshot-tool is geweldig voor mij met mijn basisvereiste, maar de selectie- en besturingsfunctionaliteit is te beperkt. Ik zou alle subdomeinen en artikelnamen moeten kennen om de standaardinvoer van die tool te kunnen gebruiken, en dat is niet realistisch.

Ik dacht dat de schraper geweldig zou zijn en ik begon hem te gebruiken, maar toen kwam ik er al snel achter dat de prijzen en beperkingen voor dat hulpmiddel aanzienlijk zijn! Het is voor mij niet haalbaar om dat te gebruiken op basis van die kostenstructuur.

Let op, ik heb een programmeur die Python schrijft en die met de API aan het spelen is, maar zij heeft geen kennis van deze tool en we hebben problemen om duidelijk met elkaar te communiceren over mijn verwachtingen, dus ik ben bang dat haar werk in een richting gaat die zal voor mij niet optimaal. Ik heb haar specifiek verteld dat ik dezelfde invoerbesturingselementen wil hebben als de webschraper, maar dan voor de screeshot-tool. maar ik denk niet dat ze mijn probleem begrijpt of waardeert. Is het mogelijk om de API te gebruiken om gebruik te maken van de robuuste selectiecriteria zonder de waanzinnig hoge prijzen voor websrapter te betalen?

Om het even welke begeleiding zou zeer gewaardeerd worden.

Alvast bedankt!!!
Gevraagd door anoniem op 1 februari 2024

Gevraagd door anoniem op 1 februari 2024

Hoi,

Geen probleem, ik zal mijn best doen om uw vragen te beantwoorden.

Over het algemeen is een webscrape beperkt tot een website of URL-patroon, anders vanwege de aard van de intAls u links volgt, zou het webscrapen nooit eindigen.

De screenshot-tool maakt eenmalig screenshots van opgegeven URL's, volgens een schema of wanneer de webpagina's veranderen. Als u een lijst met URL's heeft die u wilt vastleggen, kan deze worden geïmporteerd into de screenshot-tool.

Met de API kunt u uw eigen logica gebruiken om een ​​screenshot te activeren. Dus voor wat je doet, denk ik dat je een soort aangepaste webschraper nodig hebt, die de API zou activeren. 

Ik hoop dat dit helpt.

Beantwoord door GrabzIt-ondersteuning op 1 februari 2024