viernes, 23 de octubre de 2015

Web superficial y web profunda



 EL GRAN INTERNET



El ancho oceáno que nos presenta internet podría dividirse en dos grandes bloques: la web superficial o visible y la web profunda.
Adentrémonos en ese interesante tema.








 LA SUPERFICIAL


En la web superficial la información se obtiene de buscadores tradicionales; es una pequeña parte de lo que existe online.
El experto  Alfons Cornella calcula que hay en la internet visible unos 2.000 millones de páginas.

Google es el mejor de los buscadores populares y cuenta con unas 1000 millones de páginas indizadas. Obviamente un porcentaje ínfimo del total.

La superficial se caracteriza porque su información no está en bases de datos, es de libre acceso, no se requiere registro y está integrada, en su mayoría, por páginas o archivos con una URL estática o fija


LA PROFUNDA O INVISIBLE  

                                                                                Esta es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenidos de sitios que demandan un logín.

Cornella considera que en el internet profunda puede haber unas 500 mil millones de páginas.

La web invisible  es el término que se emplea para describir todala información que no proviene de los buscadores convencionales.
La información proviene de bases de datos, responden a una pregunta y no tienen una URL fija.



LA WEB OPACA



Sherman y Price dividen en cuatro tipos los contenidos invisibles en la web.

LA OPACA:  está compuesta por archivos que si bien podrian estar en los índices de los buscadores, no lo están por la extensión de la indización, la frecuencia de ésta o las URL están desconcetadas.

LA PRIVADA: Son las que se excluyen deliberadamente, las que ponen contraseñas y archivos de no robots para que no las ubiquen.

LA PROPIETARIA: En esas páginas es necesario registrarse para acceder al contenido.


LA INVISIBLE: Se compone de páginas que no pueden ser indizadas, es la red realmente invisible.. Son páginas generadas dinámicamente, a partir de datos que proporciona el usuario; es información almacenada en bases de datos relacionales, que no pueden extraerse a menos que se haga una petición específica.

Algunos recusos de búsqueda en la red profunda son el WWW Virtual Library, el más antiguo e iniciado por Tim Berners-Lee, el creador de la web.

Lluis Codina asegura que "red invisible" es un nombre inadecuado. Que debe llamarse "red no indizable".

No hay comentarios:

Publicar un comentario