Web Visible Invisible

9

Click here to load reader

Transcript of Web Visible Invisible

Page 1: Web Visible Invisible

La WebLa Web

Visible Vs InvisibleVisible Vs Invisible

Miguelina Ojeda

Page 2: Web Visible Invisible

Internet Visible o web superficialInternet Visible o web superficial

Es aquella parte de la red cuyo Es aquella parte de la red cuyo contenido puede ser indizado, contenido puede ser indizado, y por tanto recuperado, por los y por tanto recuperado, por los motores de búsqueda.motores de búsqueda.

Page 3: Web Visible Invisible

Características Características

La información no está contenida en bases La información no está contenida en bases de datosde datos

Es de libre accesoEs de libre acceso No requiere la realización de un proceso No requiere la realización de un proceso

de registro para accederde registro para acceder

Page 4: Web Visible Invisible

Internet invisible o profundaInternet invisible o profunda

Corresponde a toda esa información Corresponde a toda esa información presente en Internet pero que no presente en Internet pero que no puede ser indizada ni recuperada por puede ser indizada ni recuperada por los motores de búsqueda los motores de búsqueda tradicionales.tradicionales.

Page 5: Web Visible Invisible

Internet invisible o profundaInternet invisible o profundaContienen:Contienen:

Catálogos, revistas digitales, blogs, Catálogos, revistas digitales, blogs, entradas a diccionarios, contenido de sitios entradas a diccionarios, contenido de sitios que demandan un login, (aunque sea que demandan un login, (aunque sea gratuito), entre otros tipos de contenido gratuito), entre otros tipos de contenido que no aparecen entre los resultados de que no aparecen entre los resultados de una búsqueda convencional. una búsqueda convencional.

Es 400 a 550 veces más grande que el Es 400 a 550 veces más grande que el World Wide WebWorld Wide Web

Page 6: Web Visible Invisible

Clasificación de los contenidos Clasificación de los contenidos de la web “invisible”de la web “invisible”

Bases de datos bibliográficas: incluidos los catálogos Bases de datos bibliográficas: incluidos los catálogos de bibliotecas, las bases de datos de referencias de bibliotecas, las bases de datos de referencias bibliográficas, gratuitas o de pago, etc.bibliográficas, gratuitas o de pago, etc.

Bases de datos alfanuméricas y a texto completo. Bases de datos alfanuméricas y a texto completo. También se incluyen en esta categoría las obras de También se incluyen en esta categoría las obras de referencia, tipo enciclopedia o diccionarios.referencia, tipo enciclopedia o diccionarios.

Revistas electrónicas y archivos de documentos: tanto Revistas electrónicas y archivos de documentos: tanto las de acceso gratuito, que normalmente exigen las de acceso gratuito, que normalmente exigen registro previo, como las de pago (acceso a través de registro previo, como las de pago (acceso a través de IP o palabra clave), son invisibles a los motores de IP o palabra clave), son invisibles a los motores de búsqueda.búsqueda.

Documentos en formatos no indizables, esto es, Documentos en formatos no indizables, esto es, ficheros no HTML o textuales desarrollados con ficheros no HTML o textuales desarrollados con formatos más elaborados (pdf; ppt; doc; etc)formatos más elaborados (pdf; ppt; doc; etc)

Page 7: Web Visible Invisible

La web privadaLa web privadaSon páginas web que podrían estar indizadas en Son páginas web que podrían estar indizadas en los motores de búsqueda pero son excluidas por los motores de búsqueda pero son excluidas por

alguna de estas causas:alguna de estas causas: Las páginas están protegidas por Las páginas están protegidas por

contraseñas (contraseñas (passwordspasswords).). Contienen un archivo “robots.txt” para Contienen un archivo “robots.txt” para

evitar ser indizadas.evitar ser indizadas. Contienen un campo “noindex” para evitar Contienen un campo “noindex” para evitar

que el buscador indice la parte que el buscador indice la parte correspondiente al cuerpo de la página.correspondiente al cuerpo de la página.

Page 8: Web Visible Invisible

La Web propietariaLa Web propietaria

En estas páginas es necesario registrarse En estas páginas es necesario registrarse para tener acceso al contenido, ya sea de para tener acceso al contenido, ya sea de forma gratuita o pagada. forma gratuita o pagada.

Se dice que al menos 95% de la Web Se dice que al menos 95% de la Web profunda contiene información de acceso profunda contiene información de acceso público y gratuito.público y gratuito.

Page 9: Web Visible Invisible

La Web realmente invisible:La Web realmente invisible: Se compone de páginas que no pueden ser indizadas Se compone de páginas que no pueden ser indizadas

por limitaciones técnicas de los buscadores, como las por limitaciones técnicas de los buscadores, como las siguientes:siguientes:

Páginas web que incluyen formatos como PDF, Páginas web que incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos.archivos comprimidos.

Páginas generadas dinámicamente, es decir, que se Páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario.generan a partir de datos que introduce el usuario.

Información almacenada en bases de datos Información almacenada en bases de datos relacionales, que no puede ser extraída a menos que relacionales, que no puede ser extraída a menos que se realice una petición específica. Otra dificultad se realice una petición específica. Otra dificultad consiste en la variable estructura y diseño de las bases consiste en la variable estructura y diseño de las bases de datos, así como en los diferentes procedimientos de datos, así como en los diferentes procedimientos de búsqueda.de búsqueda.