Web Visible Invisible
Click here to load reader
-
Upload
maria-ojeda -
Category
Technology
-
view
979 -
download
0
Transcript of Web Visible Invisible
La WebLa Web
Visible Vs InvisibleVisible Vs Invisible
Miguelina Ojeda
Internet Visible o web superficialInternet Visible o web superficial
Es aquella parte de la red cuyo Es aquella parte de la red cuyo contenido puede ser indizado, contenido puede ser indizado, y por tanto recuperado, por los y por tanto recuperado, por los motores de búsqueda.motores de búsqueda.
Características Características
La información no está contenida en bases La información no está contenida en bases de datosde datos
Es de libre accesoEs de libre acceso No requiere la realización de un proceso No requiere la realización de un proceso
de registro para accederde registro para acceder
Internet invisible o profundaInternet invisible o profunda
Corresponde a toda esa información Corresponde a toda esa información presente en Internet pero que no presente en Internet pero que no puede ser indizada ni recuperada por puede ser indizada ni recuperada por los motores de búsqueda los motores de búsqueda tradicionales.tradicionales.
Internet invisible o profundaInternet invisible o profundaContienen:Contienen:
Catálogos, revistas digitales, blogs, Catálogos, revistas digitales, blogs, entradas a diccionarios, contenido de sitios entradas a diccionarios, contenido de sitios que demandan un login, (aunque sea que demandan un login, (aunque sea gratuito), entre otros tipos de contenido gratuito), entre otros tipos de contenido que no aparecen entre los resultados de que no aparecen entre los resultados de una búsqueda convencional. una búsqueda convencional.
Es 400 a 550 veces más grande que el Es 400 a 550 veces más grande que el World Wide WebWorld Wide Web
Clasificación de los contenidos Clasificación de los contenidos de la web “invisible”de la web “invisible”
Bases de datos bibliográficas: incluidos los catálogos Bases de datos bibliográficas: incluidos los catálogos de bibliotecas, las bases de datos de referencias de bibliotecas, las bases de datos de referencias bibliográficas, gratuitas o de pago, etc.bibliográficas, gratuitas o de pago, etc.
Bases de datos alfanuméricas y a texto completo. Bases de datos alfanuméricas y a texto completo. También se incluyen en esta categoría las obras de También se incluyen en esta categoría las obras de referencia, tipo enciclopedia o diccionarios.referencia, tipo enciclopedia o diccionarios.
Revistas electrónicas y archivos de documentos: tanto Revistas electrónicas y archivos de documentos: tanto las de acceso gratuito, que normalmente exigen las de acceso gratuito, que normalmente exigen registro previo, como las de pago (acceso a través de registro previo, como las de pago (acceso a través de IP o palabra clave), son invisibles a los motores de IP o palabra clave), son invisibles a los motores de búsqueda.búsqueda.
Documentos en formatos no indizables, esto es, Documentos en formatos no indizables, esto es, ficheros no HTML o textuales desarrollados con ficheros no HTML o textuales desarrollados con formatos más elaborados (pdf; ppt; doc; etc)formatos más elaborados (pdf; ppt; doc; etc)
La web privadaLa web privadaSon páginas web que podrían estar indizadas en Son páginas web que podrían estar indizadas en los motores de búsqueda pero son excluidas por los motores de búsqueda pero son excluidas por
alguna de estas causas:alguna de estas causas: Las páginas están protegidas por Las páginas están protegidas por
contraseñas (contraseñas (passwordspasswords).). Contienen un archivo “robots.txt” para Contienen un archivo “robots.txt” para
evitar ser indizadas.evitar ser indizadas. Contienen un campo “noindex” para evitar Contienen un campo “noindex” para evitar
que el buscador indice la parte que el buscador indice la parte correspondiente al cuerpo de la página.correspondiente al cuerpo de la página.
La Web propietariaLa Web propietaria
En estas páginas es necesario registrarse En estas páginas es necesario registrarse para tener acceso al contenido, ya sea de para tener acceso al contenido, ya sea de forma gratuita o pagada. forma gratuita o pagada.
Se dice que al menos 95% de la Web Se dice que al menos 95% de la Web profunda contiene información de acceso profunda contiene información de acceso público y gratuito.público y gratuito.
La Web realmente invisible:La Web realmente invisible: Se compone de páginas que no pueden ser indizadas Se compone de páginas que no pueden ser indizadas
por limitaciones técnicas de los buscadores, como las por limitaciones técnicas de los buscadores, como las siguientes:siguientes:
Páginas web que incluyen formatos como PDF, Páginas web que incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos.archivos comprimidos.
Páginas generadas dinámicamente, es decir, que se Páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario.generan a partir de datos que introduce el usuario.
Información almacenada en bases de datos Información almacenada en bases de datos relacionales, que no puede ser extraída a menos que relacionales, que no puede ser extraída a menos que se realice una petición específica. Otra dificultad se realice una petición específica. Otra dificultad consiste en la variable estructura y diseño de las bases consiste en la variable estructura y diseño de las bases de datos, así como en los diferentes procedimientos de datos, así como en los diferentes procedimientos de búsqueda.de búsqueda.