Pagina 1 van 1

Archive.org

Geplaatst: 28 feb 2006 18:08
door Are-Design.nl
Volgens mij klopt er iets niet bij het onderwerp Archive.org.

Archive.org heeft namelijk alleen de website van Google gekopieerd, maar niet de database waar alle website's instaan. Dus wanneer je nu op die oude googlepagina je zoekopdracht intypt ga je automatisch naar de nieuwe website van Google.

Wanneer Google de pagina dus uit de index haalt is het niet meer mogelijk om via Archive.org deze alsnog op te vragen.

Dat die man dus heel stoer in de uitzending zegt dat de informatie "tot het einde der tijden" op internet blijft staan klopt dus niet.

Als dit niet klopt zeg t maar even. :wink:

Re: Archive.org

Geplaatst: 28 feb 2006 18:10
door Gast
voor google klopt het wel..

Maar kijk maar eens naar andere website's.. Probeer wat uit en zie :P

Re: Archive.org

Geplaatst: 01 mar 2006 09:45
door Stiertje
Klopt, voor Google geld dat de index contstant veranderd en dus nooit in zijn geheel opgeslagen zal worden in archive.org. In de uitzending bedoelde men ook niet Google maar juist andere pagina's. Ga maar op zoek naar een pagina die al langer bestaat en zoek met de exacte URL in archive.org. Dan kom je deze pagina's vaak nog wel tegen....

Re: Archive.org

Geplaatst: 02 mar 2006 09:31
door keesbruinsma
Informatie tot het einde der tijden op het internet, echnie.
Wie kan zijn wp4.2 documenten nu nog lezen? Wie kan over 10 jaar nog html pagina's lezen? Kom op zeg, die problematiek is nog lang niet opgelost.

Los daarvan: Archive.org heeft de hele index van Google inderdaad niet opgeslagen. En als het in archive.org er toch in komt - redelijke kans, er zit nu al 55 biljoen webpagina's in, dan kun je het daar ook uit laten halen (http://www.archive.org/about/terms.php)

Re: Archive.org

Geplaatst: 02 mar 2006 09:55
door Snowbie
Zojuist heb ik even mijn oude website bij http://www.archive.org/ opgezocht. Het lijkt erop dat:
* Niet altijd alle pagina's worden opgenomen.
* De website struikelt wanneer de website in PHP gebruik maakt van $_SESSION's.

Echt lekker rondsurfen in de verouderde versie was er dus niet bij. Ik kwam voortdurend m'n huidige pagina tegen. :P [/url]

Re: Archive.org

Geplaatst: 02 mar 2006 10:32
door Cihangir
Beste mensen,

Als je http://www.archive.org/about/faqs.php#2 bekijkt kun je zien hoe je uit de archive kunt worden verwijderd.

Door het plaatsen van een simpele robots.txt kun je vermijden om ooit nog te worden opgenomen. Voor de paranoia onder ons dan. :P

Dus mensen wil je niet meer gevonden worden, spendeer een weekendje achter de computer en bezoek alle zoekmachines en stuur mailtjes naar website's die jouw informatie vermelden!