Skip to main content

crusom reshared this.


Archiwizacja (poufnych 😉) stron internetowych


Jak zarchiwizować pojedynczą stronę (url), którą podejrzewamy, że może szybko zniknąć ? Najlatwiej przez internowe archiwum https://web.archive.org .
A jak zrobić to samo ale z całym serwisem (czyli treść, media, skrypty) ?
Np narzędziem wget - dostępnym standardowo w (prawie) każdej dystrybucji linuxa:
$ wget \
--recursive \
--wait=1
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains poufnarozmowa.com \
--no-parent \
https://poufnarozmowa.com

#poufnarozmowa #mafiapis


This entry was edited (3 months ago)
a nie prościej „- - mirror” ?
@Piotr Sikora samo --mirror jest odpowiednikiem --timestamping --recursive --level=inf --no-remove-listing .
Czyli trochę inny zestaw niż powyżej.