Tools om het web vast te leggen en te converteren
Hoe de intraproxy maakt mogelijk intranet schermafbeeldingen

Intranet- en localhost-websites vastleggen of schrapen

An intranet-website kan net zo belangrijk zijn als elke andere website en moet mogelijk een screenshot, scraping of conversie nodig hebben into een offline versie. Helaas is het vastleggen van een intranet of localhost-website is ingewikkelder dan het maken van een screenshot van een normale website op het web.

De eenvoudigste manier om dit te doen, is door GrabzIt's te gebruiken IntraProxy, waarmee u al uw intalle websites naar alleen de servers van GrabzIt. De IntraProxy zorgt vervolgens voor de routering van verzoeken van en naar uw intalgemene websites voor u zoals weergegeven in het diagram.

Om gebruikers te verzekeren van de veiligheid van de IntraProxy hebben we de code gemaakt open source beide zodat mensen kunnen zien wat het doet en om bugfixes en verdere verbeteringen aan te moedigen.

Voornaam* download de proxy van Github. U moet Java 1.6+ hebben geïnstalleerd. Navigeer vervolgens met de opdrachtregel naar de map met intraproxy.jar. Gebruik dan het volgende commando.

java -jar "intraproxy.jar" 

Vervolgens kunt u zien of de IntraProxy actief is door op uw router de poort 10000 door te sturen naar het IP-adres van de machine waarop de GrabzIt IntraProxy is geïnstalleerd. Vraag ons alstublieft niet hoe u dit moet doen, informatie over het configureren van uw router moet beschikbaar zijn op internet.

Bezoek http://localhost:10000/grabzit://dashboard.html voor meer informatie over het configureren en gebruiken van de IntraProxy.

Nadat dit is geconfigureerd, kan het door al onze tools worden gebruikt, inclusief onze API, Schermafbeeldingstool en Webschraper. Omdat alle aanvragen voor het IP-adres en de poort van de router nu worden opgelost intalgemene website. Bijvoorbeeld als uw website zich bevindt op http://localhost/mywebsite/index.html en het IP-adres van uw router is 123.123.123.123 om uw website extern op te lossen, kunt u slagen http://123.123.123.123:10000/http://localhost/mywebsite/index.html naar de API of tools van GrabzIt.

Evenzo, als u de GrabazItDemo lokaal hebt geïnstalleerd en waarnaar de callback-handler moet worden geroepen http://localhost/GrabzItDemo/handler.php je zou kunnen passeren http://123.123.123.123:10000/http://localhost/GrabzItDemo/handler.php als een callback-handler-URL.

Vergeet niet om dit URL-voorvoegsel te verwijderen als u uw website openbaar maakt op internet!

Eisen

  • Staat alleen toegang toe vanaf de servers van GrabzIt
  • Vereist Java 1.6 +

Een alternatieve methode

Voor intranet- of localhost-websites die geen absolute URL's hebben pointing naar bronnen, zoals CSS-, afbeeldings- en JavaScript-bestanden, die niet toegankelijk zijn op het Internet eenvoudigste optie zou zijn om port forwarding in te stellen naar uw intalgemene website. U moet dit echter alleen doen voor websites waarvan u het niet erg vindt om het Internet. Bovendien zou het waarschijnlijk niet geschikt zijn als je er een groot aantal hebt intalgemene websites om vast te leggen.

U moet zich aanmelden bij uw router en een regel voor poort doorsturen toevoegen om alle aanvragen van die het IP-adres en de poort van de router ontvangen door te sturen naar de computer waarop uw website wordt gehost. U moet vervolgens uw webserver configureren om oproepen te accepteren op de poort waarnaar u doorstuurt.

Bijvoorbeeld als het IP-adres van uw router dat is 222.222.222.222 u kunt een port forwarding voor poort 12345 toevoegen aan de computer waarop de website wordt gehost en deze poort toevoegen aan uw webserverconfiguratie als een van de poorten waarnaar wordt geluisterd.

Meer informatie over het configureren van uw webserver en router moet beschikbaar zijn op de internet. Zodra dit is gedaan, belt u een adres zoals http://222.222.222.222:12345/mypage.html zou uw website moeten laden.