viernes, 23 de octubre de 2015
Web superficial y web profunda
EL GRAN INTERNET
El ancho oceáno que nos presenta internet podría dividirse en dos grandes bloques: la web superficial o visible y la web profunda.
Adentrémonos en ese interesante tema.
LA SUPERFICIAL
En la web superficial la información se obtiene de buscadores tradicionales; es una pequeña parte de lo que existe online.
El experto Alfons Cornella calcula que hay en la internet visible unos 2.000 millones de páginas.
Google es el mejor de los buscadores populares y cuenta con unas 1000 millones de páginas indizadas. Obviamente un porcentaje ínfimo del total.
La superficial se caracteriza porque su información no está en bases de datos, es de libre acceso, no se requiere registro y está integrada, en su mayoría, por páginas o archivos con una URL estática o fija
LA PROFUNDA O INVISIBLE
Esta es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenidos de sitios que demandan un logín.
Cornella considera que en el internet profunda puede haber unas 500 mil millones de páginas.
La web invisible es el término que se emplea para describir todala información que no proviene de los buscadores convencionales.
La información proviene de bases de datos, responden a una pregunta y no tienen una URL fija.
LA WEB OPACA
Sherman y Price dividen en cuatro tipos los contenidos invisibles en la web.
LA OPACA: está compuesta por archivos que si bien podrian estar en los índices de los buscadores, no lo están por la extensión de la indización, la frecuencia de ésta o las URL están desconcetadas.
LA PRIVADA: Son las que se excluyen deliberadamente, las que ponen contraseñas y archivos de no robots para que no las ubiquen.
LA PROPIETARIA: En esas páginas es necesario registrarse para acceder al contenido.
LA INVISIBLE: Se compone de páginas que no pueden ser indizadas, es la red realmente invisible.. Son páginas generadas dinámicamente, a partir de datos que proporciona el usuario; es información almacenada en bases de datos relacionales, que no pueden extraerse a menos que se haga una petición específica.
Algunos recusos de búsqueda en la red profunda son el WWW Virtual Library, el más antiguo e iniciado por Tim Berners-Lee, el creador de la web.
Lluis Codina asegura que "red invisible" es un nombre inadecuado. Que debe llamarse "red no indizable".
Suscribirse a:
Enviar comentarios (Atom)
No hay comentarios:
Publicar un comentario