Przejdź do głównej zawartości


Archiwizacja (poufnych 😉) stron internetowych


Jak zarchiwizować pojedynczą stronę (url), którą podejrzewamy, że może szybko zniknąć ? Najlatwiej przez internowe archiwum https://web.archive.org .
A jak zrobić to samo ale z całym serwisem (czyli treść, media, skrypty) ?
Np narzędziem wget - dostępnym standardowo w (prawie) każdej dystrybucji linuxa:
$ wget \
--recursive \
--wait=1
--no-clobber \
--page-requisites \
--html-extension \
--convert-links \
--restrict-file-names=windows \
--domains poufnarozmowa.com \
--no-parent \
https://poufnarozmowa.com

#poufnarozmowa #mafiapis
Ten wpis został zedytowany (3 lata temu)

crusomudostępnił to.

Osobiście polecam `httrack` - potrafi śledzić kilka adresów, aktualizować w miarę potrzeby i mam wrażenie, że jest łatwiejszy w obsłudze ;)
też właśnie chciałem sugerować, robi robotę
@miklo
a nie prościej „- - mirror” ?
@Piotr Sikora samo --mirror jest odpowiednikiem --timestamping --recursive --level=inf --no-remove-listing .
Czyli trochę inny zestaw niż powyżej.