Veamos sus características, aplicaciones y sitios web de referencia.
Que es un Sitio Archivo
Un sitio archivo es un tipo de sitio Web que almacena información sobre páginas web del presente y pasado para que cualquiera las pueda ver.
Puede usarse un web crawler. El servicio no dependerá de una comunidad activa para su contenido, y por tanto se construirá una base de datos más grande más rápido, lo que normalmente resulta en que también la comunidad se haga más grande. Sin embargo, los administradores de sistemas y desarrolladores de sitios web tienen la capacidad de bloquear el acceso de estos robots a [algunas] páginas web (usando un robots.txt).
También se puede hacer a través de envíos de usuarios. Aunque puede ser difícil empezar estos servicios debido a las tasas potencialmente bajas de envío de los usuarios, este sistema puede rendir los mejores resultados. Recorriendo páginas web sólo es posible obtener la información que el público se haya ocupado de publicar en la Internet. Puede que no se hayan preocupado de enviarla debido a pensar que nadie estaría interesada en ella, falta de un medio adecuado, etc. Sin embargo, si ven que alguien quiere su información entonces pueden estar más dispuestos a enviarla.
Algunos sitios de referencia
Google Groups
Grupos de Google es un servicio gratuito creado por Google Inc. en el cual se crean foros de discusión, incluye grupos de noticias Usenet basados en intereses comunes. Se creó en 1995 como Deja News, se convirtió en Google Groups en febrero de 2001 después de su compra.
Internet Archive
Internet Archive es una biblioteca digital gestionada por una organización sin ánimo de lucro dedicada a la preservación de archivos, capturas de sitios públicos de la Web, recursos multimedia y también software.
TextFiles.com
Text Files es un sitio web dedicado a preservar los documentos digitales que contienen la historia del mundo del sistema de tablones de anuncios y varias subculturas.