Presentaciã³n deep web

TRABAJO SOBRE LA DEEP WEB

Trabajo elaborado por: LUIS HELI ÁLVAREZ VILLARRAGA: id 455613

BRAYAN ANDRES CAÑAVERAL BARBOSA: id 473962

Área: Gestión básica de la información Tutora: DIANA VÉLASQUEZ ROMERO

Programa: contaduría pública-distanciaGrupo: 1C

D E E P W E B ( in te rn e t p ro fu n d a o in v is ib le )

DEEP WEB

Internet profunda o invisible, contenido de internet que no forma parte del internet superficial.

CAUSAS:

• Páginas y sitios web protegidos con contraseñas o códigos establecidos.

• Enciclopedias, diccionarios, revistas en las que para acceder a la información hay que interrogar a la base de datos, como por ejemplo la base de datos de la RAE

• Documentos en formatos no indexables

TAMAÑO

Se estima que la Internet Profunda es 500 veces mayor que la Internet Superficial, siendo el 95% de esta información públicamente accesible. En 2010 se estimó que la información que se encuentra en la Internet profunda es de 7,500 terabytes, lo que equivale a aproximadamente 550 billones de documentos individuales. El contenido de la internet profunda es de 400 a 550 veces mayor de lo que se puede encontrar en la Internet superficial. En comparación, se estima que la Internet superficial contiene solo 19 terabytes de contenido y un billón de documentos individuales.

DENOMINACIÓN

Son páginas de texto, archivos, o en ocasiones información a la cual se puede acceder por medio de la world wide web que los buscadores de uso general no pueden, debido a limitaciones o deliberadamente, agregar a sus índices de páginas webs.

RASTREANDO LA INTERNET

PROFUNDA

• La selección de valores de

entrada, para que las

entradas de búsqueda de

texto acepten palabras clave.

• La identificación de los

insumos que aceptan sólo

valores específicos (por

ejemplo, fecha).

• La selección de un pequeño

número de combinaciones de

entrada que generan URLS

adecuadas para su inclusión

en el índice de búsqueda

Web.

INGRESANDO A LA RED PROFUNDA

• Las arañas(web crawler): Son bots inteligentes que van haciendo búsquedas por en laces de hipertexto de página en página, registrando la información ahí disponible

• Tor: Es un proyecto diseñado e implementado por la marina de los Estados Unidos lanzado el 20 de septiembre de 2002. A diferencia de los navegadores de Internet convencionales, Tor le permite a los usuarios navegar por la Web de forma anónima.

• Bitcoin: En estos sitios, se pueden encontrar drogas, armas, o incluso asesinos a sueldo. Se utiliza la moneda digital llamada bitcoin, que tiene sus orígenes en 2009, pero que se ha vuelto todo un fenómeno desde 2012, que se intercambia a través de billeteras digitales entre el usuario y el vendedor, lo que hace que sea prácticamente imposible de rastrear.

RECURSOS DE LA INTERNET

• Contenido de Acceso limitado: los sitios que limitan el acceso a sus páginas de una manera técnica (Por ejemplo, utilizando el estándar de exclusión de robots o captcha, que prohíben los motores de búsqueda de la navegación por y la creación de copias en caché

• Contenido Dinámico: Las páginas dinámicas que devuelven respuesta a una pregunta presentada o acceder a través de un formulario, especialmente si se utilizan elementos de entrada en el dominio abierto como campos de texto.

• Contenido No Vinculado: páginas que no están conectadas con otras páginas, que pueden impedir que los programas de rastreo web tengan acceso al contenido. Este material se conoce como páginas sin enlaces entrantes.

• Contenido Programado: páginas que sólo son accesibles a través de enlaces producidos por JavaScript, así como el contenido descargado de forma dinámica a partir de los servidores web a través de soluciones de Flash o Ajax

• Sin contenido HTML: contenido textual codificado en multimedia (imagen o video) archivos o formatos de archivo específicos no tratados por los motores de búsqueda

• Web privada: los sitios que requieren de registro y de una contraseña para iniciar sesión

• Web contextual: páginas con contenidos diferentes para diferentes contextos de acceso (por ejemplo, los rangos de direcciones IP de clientes o secuencia de navegación anterior).

http://es.wikipedia.org/wiki/RAE

¿Cómo hacer un buen uso de la DEEP WEB? Crear una cuenta con un código o contraseña Buscar contenido confiable y bueno para hacer de la web buen uso Buscar vínculos con páginas de buena información que tengan compatibilidad A la hora de usar la moneda( bitcoin) para pagos, utilizarla correctamente y legalmente

¿Qué mecanismos se utilizan en la DEEP WEB?• Las arañas ( web crawler) • Tor • Bitcoin

¿Cómo se accede a la DEEP WEB?No se puede entrar desde google, yahoo o buscadores convencionales, se tiene que usar programas especiales como el TOR que es un navegador que oculta nuestra IP para entrar de una forma anónima.

Presentaciã³n deep web

Education

Transcript of Presentaciã³n deep web