Warren McCulloch

25
Warren Warren McCulloch McCulloch Walter Pitts Walter Pitts Por FRANCISCO MARÍN MIRA

Transcript of Warren McCulloch

Page 1: Warren McCulloch

Warren Warren McCullochMcCulloch

Walter PittsWalter Pitts

Por

FRANCISCO MARÍN MIRA

Page 2: Warren McCulloch

1899: Nacimiento de Warren Sturgis 1899: Nacimiento de Warren Sturgis McCullochMcCulloch

1923: Nacimiento de Walter Pitts1923: Nacimiento de Walter Pitts 1927: McCulloch: Doctorado en psicología. 1927: McCulloch: Doctorado en psicología. 1943: Se propone uno de los primeros 1943: Se propone uno de los primeros

modelos matemáticos de la neuronamodelos matemáticos de la neuronaMcCulloch-Pitts. McCulloch-Pitts. ““A logical calculus of the A logical calculus of the ideas immanent in nervous activityideas immanent in nervous activity””

1947: McCullch-Pitts. “1947: McCullch-Pitts. “How we know How we know universals: the perception of visual and universals: the perception of visual and auditory forms”auditory forms”

1949: Donald Hebb propone una de las 1949: Donald Hebb propone una de las primeras reglas de aprendizajeprimeras reglas de aprendizaje

Introducción (I)Introducción (I)

Page 3: Warren McCulloch

1956: Se acuña el término de Inteligencia 1956: Se acuña el término de Inteligencia ArtificialArtificial

1957: Frank Rosenblatt presentó el 1957: Frank Rosenblatt presentó el PerceptrónPerceptrón

Años 60: modelos basados en el Años 60: modelos basados en el Perceptrón: Adaline y MadalinePerceptrón: Adaline y Madaline

1969: Mueren McCulloch y Pitts1969: Mueren McCulloch y Pitts 1969: Back propagation1969: Back propagation Posteriormente, otros modelos permiten Posteriormente, otros modelos permiten

un aprendizaje no supervisado (mapa un aprendizaje no supervisado (mapa auto-organizativo de Kohonen, los basados auto-organizativo de Kohonen, los basados en la Teoría de Resonancia Adaptativa en la Teoría de Resonancia Adaptativa (ART) de Grossberg y Carpenter, o los (ART) de Grossberg y Carpenter, o los modelos de control motor de Bullock, modelos de control motor de Bullock, Gaudiano y Grossberg, entre otros) Gaudiano y Grossberg, entre otros)

Introducción (II)Introducción (II)

Page 4: Warren McCulloch

McCulloch y Pitts impulsaron el nacimiento de la I.A. McCulloch y Pitts impulsaron el nacimiento de la I.A. proponiendo la definición de la neuronaproponiendo la definición de la neurona

Con estas ideas nace la cibernética y más tarde el término Con estas ideas nace la cibernética y más tarde el término Inteligencia ArtificialInteligencia Artificial

McCulloch y Pitts. McCulloch y Pitts. A logical calculus of the ideas immanent A logical calculus of the ideas immanent in nervous activity:in nervous activity: una Máquina de Turing podría ser implementada en una red una Máquina de Turing podría ser implementada en una red

finita de neuronas formalesfinita de neuronas formales 1947: aproximaciones para diseñar “redes nerviosas” para 1947: aproximaciones para diseñar “redes nerviosas” para

reconocer entradas visuales reconocer entradas visuales Las redes neuronales actuales se basan en el modelo de Las redes neuronales actuales se basan en el modelo de

neurona descrito en este artículoneurona descrito en este artículo Cada neurona consta de un conjunto de entradas y una sola Cada neurona consta de un conjunto de entradas y una sola

salida. Cada entrada está afectada por un coeficiente, salida. Cada entrada está afectada por un coeficiente, denominado peso.denominado peso.

La cantidad calculada como la suma del producto de cada La cantidad calculada como la suma del producto de cada entrada multiplicada por su respectivo peso se denomina entrada multiplicada por su respectivo peso se denomina activación de la neurona activación de la neurona

Una de las primeras arquitecturas neuronales donde se Una de las primeras arquitecturas neuronales donde se aplica es el Perceptrónaplica es el Perceptrón

Los pesos de las neuronas se modifican sometiendo a la red Los pesos de las neuronas se modifican sometiendo a la red a un entrenamiento, mediante una regla de aprendizaje.a un entrenamiento, mediante una regla de aprendizaje.

Page 5: Warren McCulloch

Se puede decir que la Inteligencia Artificial Se puede decir que la Inteligencia Artificial empezó a surgir en 1943 cuando empezó a surgir en 1943 cuando Warren Warren McCulloch y Walter PittsMcCulloch y Walter Pitts propusieron un propusieron un modelo de neurona del cerebro modelo de neurona del cerebro humano y animalhumano y animal, una abstracción que , una abstracción que proporcionó una representación simbólica proporcionó una representación simbólica de la actividad cerebral.de la actividad cerebral.

Podríamos situar el origen de los modelos Podríamos situar el origen de los modelos conexionistas con la conexionistas con la definición de la definición de la neurona formal neurona formal dada por McCulloch y Pitts dada por McCulloch y Pitts en en 19431943 como un como un dispositivo binario con dispositivo binario con varias entradas y salidasvarias entradas y salidas. .

Más adelante, Más adelante, Norbert WienerNorbert Wiener elaboró elaboró con estas ideascon estas ideas junto con otras, dentro del junto con otras, dentro del mismo campo, lo que se llamó mismo campo, lo que se llamó ““cibernéticacibernética”. De aquí nacería, sobre los ”. De aquí nacería, sobre los años 50, la Inteligencia Artificial.años 50, la Inteligencia Artificial.

Page 6: Warren McCulloch

McCulloch (I)McCulloch (I) Warren Sturgis McCullochWarren Sturgis McCulloch ( 1899 - 1969( 1899 - 1969 ) ) Nació en Orange, New Jersey el Nació en Orange, New Jersey el

16 de Noviembre de 1899. 16 de Noviembre de 1899. Neurofisiólogo y CibernéticoNeurofisiólogo y Cibernético Estudió en Yale (filosofía y Estudió en Yale (filosofía y

psicología hasta 1921)psicología hasta 1921)y en Columbia (psicología, graduado en y en Columbia (psicología, graduado en 1923). Recibiendo su doctorado en 1927 en Nueva 1923). Recibiendo su doctorado en 1927 en Nueva York.York.

Page 7: Warren McCulloch

McCulloch (II)McCulloch (II)

Recordado por su trabajo con Dusser de Barenne (en Recordado por su trabajo con Dusser de Barenne (en Yale) y después con Walter Pitts (en Illinois) que Yale) y después con Walter Pitts (en Illinois) que posibilitó la fundación de ciertas teorías de la posibilitó la fundación de ciertas teorías de la inteligencia en un número de artículos clásicos, inteligencia en un número de artículos clásicos, incluyendo incluyendo “A logical calculus of the ideas immanent in “A logical calculus of the ideas immanent in nervous activity”nervous activity” (1943) y (1943) y “How we know universals: the “How we know universals: the perception of visual and auditory forms”perception of visual and auditory forms” (1947), ambos (1947), ambos en el “en el “Bulletin of Mathematical Biophysics”Bulletin of Mathematical Biophysics”. .

En el artículo de 1943 demostraron que una Máquina de En el artículo de 1943 demostraron que una Máquina de Turing podría ser implementada en una red finita de Turing podría ser implementada en una red finita de neuronas formales, donde la neurona es la unidad base neuronas formales, donde la neurona es la unidad base lógica del cerebro. En el artículo de 1947 ofrecieron lógica del cerebro. En el artículo de 1947 ofrecieron aproximaciones para diseñar “redes nerviosas” para aproximaciones para diseñar “redes nerviosas” para reconocer entradas visuales a pesar de los cambios de reconocer entradas visuales a pesar de los cambios de orientación o de tamaño.orientación o de tamaño.

Page 8: Warren McCulloch

McCulloch (III)McCulloch (III) Desde 1952 trabajó en el Laboratorio de Desde 1952 trabajó en el Laboratorio de

Investigación de Electrónica del MIT (Instituto de Investigación de Electrónica del MIT (Instituto de Tecnología de Massachusetts), principalmente en Tecnología de Massachusetts), principalmente en modelado de Redes Neuronales.modelado de Redes Neuronales.

Su equipo examinó el sistema visual de la rana, en Su equipo examinó el sistema visual de la rana, en consideración con el artículo de 1947, consideración con el artículo de 1947, descubriendo que el ojo proporciona al cerebro descubriendo que el ojo proporciona al cerebro información que es, en cierto sentido, organizada e información que es, en cierto sentido, organizada e interpretada, en vez de únicamente transmitir la interpretada, en vez de únicamente transmitir la imagen.imagen.

McCulloch fue miembro de la American Society for McCulloch fue miembro de la American Society for Cybernetics y su primer presidente desde 1967 al Cybernetics y su primer presidente desde 1967 al 1968. 1968.

Page 9: Warren McCulloch

McCulloch (IV)McCulloch (IV) Conoció a Alan Turing, que discrepó con él llegando Conoció a Alan Turing, que discrepó con él llegando

a llamarle charlatán.a llamarle charlatán.

Warren McCulloch tiene un notable rango de Warren McCulloch tiene un notable rango de intereses y talentos. A parte de sus contribuciones intereses y talentos. A parte de sus contribuciones a la ciencia, escribió poesía (sonetos) y diseñó a la ciencia, escribió poesía (sonetos) y diseñó edificios y un embalse para su granja de Old Lyme, edificios y un embalse para su granja de Old Lyme, Conneticut.Conneticut.

Murió en Cambridge en 1969.Murió en Cambridge en 1969.

Page 10: Warren McCulloch

Pitts (I)Pitts (I) Walter PittsWalter Pitts ( 1923 - 1969( 1923 - 1969 ) ) Nació en Detroit el 23 de AbrilNació en Detroit el 23 de Abril

de 1923.de 1923. Matemático que trabajó en el campoMatemático que trabajó en el campo

de la psicología cognitiva.de la psicología cognitiva. Aparentemente escapó de su casaAparentemente escapó de su casa

a los 15 años.a los 15 años. Aprendió por su cuenta lógica yAprendió por su cuenta lógica y

matemáticas y era capaz de leer en matemáticas y era capaz de leer en numerosos lenguajes, incluyendonumerosos lenguajes, incluyendoGriego y Latin.Griego y Latin.

Page 11: Warren McCulloch

Pitts (II)Pitts (II) Con 12 años pasó tres dias en una biblioteca leyendo Con 12 años pasó tres dias en una biblioteca leyendo

“Principia Mathematica” y mandó una carta a Bertrand “Principia Mathematica” y mandó una carta a Bertrand Russell indicandole lo que él consideraba problemas Russell indicandole lo que él consideraba problemas serios en la primera mitad del primer volumen. Russell serios en la primera mitad del primer volumen. Russell se mostró agradecido y le invitó a estudiar en el Reino se mostró agradecido y le invitó a estudiar en el Reino Unido. Aunque esta oferta fue aparentemente Unido. Aunque esta oferta fue aparentemente rechazada, Pitts decidió estudiar lógica.rechazada, Pitts decidió estudiar lógica.

Acudió a clases de la Universidad de Chicago, sin Acudió a clases de la Universidad de Chicago, sin inscribirse como estudiante.inscribirse como estudiante.

Obtuvo un trabajo en la universidad gracias a un filósofo Obtuvo un trabajo en la universidad gracias a un filósofo alemán (Rudolf Carnap) al que le presentó su propio alemán (Rudolf Carnap) al que le presentó su propio libro de lógica lleno de correcciones. Pitts por ese libro de lógica lleno de correcciones. Pitts por ese tiempo no tenía hogar ni ningún ingreso.tiempo no tenía hogar ni ningún ingreso.

Page 12: Warren McCulloch

Pitts (III)Pitts (III) Más tarde Warren McCulloch llegó a la Universidad y, a Más tarde Warren McCulloch llegó a la Universidad y, a

principios de 1942, invitó a Pitts, que seguía sin hogar, a vivir principios de 1942, invitó a Pitts, que seguía sin hogar, a vivir con su familia.con su familia.

McCulloch y Pitts trabajaban juntos. Pitts estaba familiarizado McCulloch y Pitts trabajaban juntos. Pitts estaba familiarizado con el trabajo en informática de Gottfried Leibniz y con el trabajo en informática de Gottfried Leibniz y consideraron la cuestión de si el sistema nervioso podía ser consideraron la cuestión de si el sistema nervioso podía ser considerado un tipo de maquina de computación universal, considerado un tipo de maquina de computación universal, como la describida por Leibniz. Esto llevó a su determinante como la describida por Leibniz. Esto llevó a su determinante artículo de redes neuronales artículo de redes neuronales “A Logical Calculus of Ideas “A Logical Calculus of Ideas Immanent in Nervous Activity”.Immanent in Nervous Activity”.

En 1943, Jerome Lettvin, con el que Pitts obtuvo una gran En 1943, Jerome Lettvin, con el que Pitts obtuvo una gran amistad en la universidad, le presentó a Norbert Wiener en el amistad en la universidad, le presentó a Norbert Wiener en el MIT, quien había perdido a su “mano derecha”. Su primer MIT, quien había perdido a su “mano derecha”. Su primer encuentro, en el que estuvieron discutiendo el trabajo de encuentro, en el que estuvieron discutiendo el trabajo de Wiener, fue tan bien que Pitts se trasladó a Boston para Wiener, fue tan bien que Pitts se trasladó a Boston para trabajar con Wiener. trabajar con Wiener.

En 1944 Pitts fue contratado por Kellex Corp., parte del En 1944 Pitts fue contratado por Kellex Corp., parte del Proyecto de Energía Atómica.Proyecto de Energía Atómica.

Page 13: Warren McCulloch

Pitts (IV)Pitts (IV) En 1951 Wiener convenció a Jerry Wiesner para En 1951 Wiener convenció a Jerry Wiesner para

contratar algunos científicos del sistema nervioso. Un contratar algunos científicos del sistema nervioso. Un grupo fue estrablecido con Pitts, Lettvin, McCulloch y Pat grupo fue estrablecido con Pitts, Lettvin, McCulloch y Pat Wall.Wall.

Pitts escribió una larga tesis de las propiedades de las Pitts escribió una larga tesis de las propiedades de las redes neuronales conectadas en tres dimensiones. redes neuronales conectadas en tres dimensiones. Lettvin le describió como el genio del grupo.Lettvin le describió como el genio del grupo.

Pitts también es descrito como un excéntrico, negando Pitts también es descrito como un excéntrico, negando que su nombre se hiciese público. Rechazó todas las que su nombre se hiciese público. Rechazó todas las ofertas de graduados avanzados o posiciones oficiales ofertas de graduados avanzados o posiciones oficiales en el MIT ya que tendría que firmar con su nombre.en el MIT ya que tendría que firmar con su nombre.

Page 14: Warren McCulloch

Pitts (V)Pitts (V) Wiener inesperadamente se puso en contra de McCulloch, a cuenta Wiener inesperadamente se puso en contra de McCulloch, a cuenta

de su mujer que odiaba a McCulloch, y separó las relaciones con de su mujer que odiaba a McCulloch, y separó las relaciones con cualquiera que estubiese relacionado con él, incluido Pitts. Esto cualquiera que estubiese relacionado con él, incluido Pitts. Esto empujó a Pitts a un “suicidio cognitivo”, un aislamiento social del empujó a Pitts a un “suicidio cognitivo”, un aislamiento social del que nunca se recuperaría. Pitts quemó el manuscrito sobre las redes que nunca se recuperaría. Pitts quemó el manuscrito sobre las redes tridimensionales y prestó poco más interés en el trabajo. La única tridimensionales y prestó poco más interés en el trabajo. La única excepción fué una colaboración con Robert Gesteland que produjo excepción fué una colaboración con Robert Gesteland que produjo un artículo sobre el olfato.un artículo sobre el olfato.

Pitts murió en 1969.Pitts murió en 1969.

El modelo matemático de una neurona se llama actualmente la El modelo matemático de una neurona se llama actualmente la neurona de McCulloch-Pitts. La formulación teórica de la actividad neurona de McCulloch-Pitts. La formulación teórica de la actividad neuronal del cerebro es el legado permanente de Walter Pitts y neuronal del cerebro es el legado permanente de Walter Pitts y Warren McCullch a las ciencias cognitivas.Warren McCullch a las ciencias cognitivas.

Page 15: Warren McCulloch

La Neurona McCulloch-La Neurona McCulloch-Pitts (I)Pitts (I)

McCulloch y Pitts propusieron en 1943 uno de los primeros McCulloch y Pitts propusieron en 1943 uno de los primeros modelos matemáticos de una neurona, del que se basan las modelos matemáticos de una neurona, del que se basan las redes neuronales actuales.redes neuronales actuales.

En este modelo, cada neurona consta de un conjunto de En este modelo, cada neurona consta de un conjunto de entradas, Si, y una sola salida Sj. Cada entrada i está entradas, Si, y una sola salida Sj. Cada entrada i está afectada por un coeficiente que se denomina peso y que se afectada por un coeficiente que se denomina peso y que se representa por wij. El subíndice i refleja que el peso afecta a representa por wij. El subíndice i refleja que el peso afecta a la entrada i, y el subíndice j que se trata de la neurona j.la entrada i, y el subíndice j que se trata de la neurona j.

La cantidad calculada como la suma del producto de cada La cantidad calculada como la suma del producto de cada entrada multiplicada por su respectivo peso se denomina entrada multiplicada por su respectivo peso se denomina activación de la neurona xj. La salida Sj de la neurona es una activación de la neurona xj. La salida Sj de la neurona es una función de la activación de ésta. Es decir:función de la activación de ésta. Es decir:

xj = Si*wij + Qjxj = Si*wij + QjSj = f(xj)Sj = f(xj)

Donde el término Qj es un valor umbral y f(xj) es una función Donde el término Qj es un valor umbral y f(xj) es una función de la activación de la neurona.de la activación de la neurona.

Page 16: Warren McCulloch

La Neurona McCulloch-La Neurona McCulloch-Pitts (II)Pitts (II)

Una de las primeras arquitecturas neuronales Una de las primeras arquitecturas neuronales donde se aplica es el Perceptrón, que utiliza la donde se aplica es el Perceptrón, que utiliza la siguiente función de salida:siguiente función de salida:

Sj=0Sj=0 si xj < hsi xj < hSj=1Sj=1 si xj>=hsi xj>=h

donde la constante h se denomina donde la constante h se denomina umbralumbral. Esta es . Esta es una función de salida de tipo binaria, y existen una función de salida de tipo binaria, y existen otras de tipo lineal puro, lineal con umbral, y otras de tipo lineal puro, lineal con umbral, y sigmoidea, entre otras. sigmoidea, entre otras.

Page 17: Warren McCulloch

La Neurona McCulloch-Pitts (III)La Neurona McCulloch-Pitts (III)

En este modelo tan sencillo puede verse que la activación de En este modelo tan sencillo puede verse que la activación de la neurona depende del valor que tomen los pesos y las la neurona depende del valor que tomen los pesos y las entradas, de forma que la variación de éstos origina distintas entradas, de forma que la variación de éstos origina distintas salidas para la misma entrada a la neurona. salidas para la misma entrada a la neurona.

En la práctica, los pesos de las neuronas se modifican En la práctica, los pesos de las neuronas se modifican sometiendo a la red a un entrenamiento, permitiendo que la sometiendo a la red a un entrenamiento, permitiendo que la red realice una función determinada. Esta es la característica red realice una función determinada. Esta es la característica que diferencia a una red neuronal de una máquina que diferencia a una red neuronal de una máquina algorítmica clásica: una red neuronal no se programa, se algorítmica clásica: una red neuronal no se programa, se «educa». «educa».

La red es capaz de retener y asociar el conocimiento a través La red es capaz de retener y asociar el conocimiento a través de la adaptación de los pesos de las neuronas siguiendo de la adaptación de los pesos de las neuronas siguiendo una una regla de aprendizajeregla de aprendizaje. Estas reglas son ecuaciones expresadas . Estas reglas son ecuaciones expresadas en función de las entradas y salidas de las neuronas y en función de las entradas y salidas de las neuronas y describen la forma de variación de los pesos. En definitiva, describen la forma de variación de los pesos. En definitiva, son el instrumento empleado por las neuronas para adaptarse son el instrumento empleado por las neuronas para adaptarse a la información que se le presenta. a la información que se le presenta.

Page 18: Warren McCulloch

La Neurona McCulloch-La Neurona McCulloch-Pitts (IV)Pitts (IV)

El aprendizaje de una red se puede producir de tres formas:El aprendizaje de una red se puede producir de tres formas:

Aprendizaje supervisadoAprendizaje supervisado: consiste en introducir una serie de : consiste en introducir una serie de patrones de entrada a la red y a su vez mostrar la salida que se patrones de entrada a la red y a su vez mostrar la salida que se quiere tener. La red es capaz de ajustar los pesos de las quiere tener. La red es capaz de ajustar los pesos de las neuronas de forma que a la presentación posterior de esos neuronas de forma que a la presentación posterior de esos patrones de entrada la red responde con salida memorizada.patrones de entrada la red responde con salida memorizada.

Aprendizaje no supervisadoAprendizaje no supervisado: se presentan los patrones de : se presentan los patrones de entrada a la red y ésta los clasifica en categorías según sus entrada a la red y ésta los clasifica en categorías según sus rasgos más sobresalientes.rasgos más sobresalientes.

Aprendizaje autosupervisadoAprendizaje autosupervisado: la propia red corrige los errores : la propia red corrige los errores en la interpretación empleando una realimentación.en la interpretación empleando una realimentación.

Una de las primeras reglas de aprendizaje fue propuesta por Donald Una de las primeras reglas de aprendizaje fue propuesta por Donald Hebb en 1949.Hebb en 1949.

Esta se basa en un hecho biológico constatado: cuando dos Esta se basa en un hecho biológico constatado: cuando dos neuronas se activan simultáneamente su conexión se refuerza.neuronas se activan simultáneamente su conexión se refuerza.

Page 19: Warren McCulloch

Historia Redes Historia Redes Neuronales (I)Neuronales (I)

Partiendo de que las redes neuronales se Partiendo de que las redes neuronales se fundamentan en el sistema nervioso humano fundamentan en el sistema nervioso humano deberíamos remontarnos a los tiempos de Galeno deberíamos remontarnos a los tiempos de Galeno en los que ya se tenía un conocimiento en los que ya se tenía un conocimiento considerable de éste. Sin embargo, los verdaderos considerable de éste. Sin embargo, los verdaderos avances en neurología se produjeron a partir de la avances en neurología se produjeron a partir de la segunda mitad del siglo XIX. Investigadores ilustres segunda mitad del siglo XIX. Investigadores ilustres de esta época son Jackson, Ramón y Cajal y Golgi de esta época son Jackson, Ramón y Cajal y Golgi entre otros. entre otros.

Fue en 1943 cuando Warren McCulloch y Walter Fue en 1943 cuando Warren McCulloch y Walter Pitts propusieron el clásico modelo de neurona en Pitts propusieron el clásico modelo de neurona en el que se basan las redes neuronales actuales. Seis el que se basan las redes neuronales actuales. Seis años después, en 1949, en su libro años después, en 1949, en su libro The The Organization of BehaviorOrganization of Behavior, Donald Hebb presentaba , Donald Hebb presentaba su conocida regla de aprendizaje. su conocida regla de aprendizaje.

Page 20: Warren McCulloch

Historia Redes Historia Redes Neuronales (II)Neuronales (II)

En 1957, Frank Rosenblatt presentó el En 1957, Frank Rosenblatt presentó el PerceptronPerceptron, una red , una red neuronal con aprendizaje supervisado cuya regla de neuronal con aprendizaje supervisado cuya regla de aprendizaje era una modificación de la propuesta por Hebb. El aprendizaje era una modificación de la propuesta por Hebb. El Perceptron trabaja con patrones de entrada binarios, y su Perceptron trabaja con patrones de entrada binarios, y su funcionamiento, por tratarse de una red supervisada, se funcionamiento, por tratarse de una red supervisada, se realiza en dos fases: una primera en la que se presentan las realiza en dos fases: una primera en la que se presentan las entradas y la salidas deseadas; en esta fase la red aprende la entradas y la salidas deseadas; en esta fase la red aprende la salida que debe dar para cada entrada. salida que debe dar para cada entrada.

La principal aportación del Perceptron es que la adaptación La principal aportación del Perceptron es que la adaptación de los pesos se realiza teniendo en cuenta el error entre la de los pesos se realiza teniendo en cuenta el error entre la salida que da la red y la salida que se desea. salida que da la red y la salida que se desea.

En la fase siguiente, de operación, la red «es capaz» de En la fase siguiente, de operación, la red «es capaz» de responder adecuadamente cuando se le vuelven a presentar responder adecuadamente cuando se le vuelven a presentar los patrones de entrada. Se crearon grandes expectativas los patrones de entrada. Se crearon grandes expectativas sobre sus aplicaciones, que posteriormente se tornaron en sobre sus aplicaciones, que posteriormente se tornaron en gran decepción cuando en 1969 Minsky y Papert demostraron gran decepción cuando en 1969 Minsky y Papert demostraron las grandes limitaciones de esta red. las grandes limitaciones de esta red.

Page 21: Warren McCulloch

Historia Redes Historia Redes Neuronales (III)Neuronales (III)

En los años 60 se propusieron otros dos modelos, también En los años 60 se propusieron otros dos modelos, también supervisados, basados en el Perceptron de Rosenblatt supervisados, basados en el Perceptron de Rosenblatt denominados denominados AdalineAdaline y y MadalineMadaline. .

En estos, la adaptación de los pesos se realiza teniendo en En estos, la adaptación de los pesos se realiza teniendo en cuenta el error, calculado como la diferencia entre la salida cuenta el error, calculado como la diferencia entre la salida deseada y la dada por la red, al igual que en el Perceptron. deseada y la dada por la red, al igual que en el Perceptron.

Sin embargo, la regla de aprendizaje empleada es distinta. Se Sin embargo, la regla de aprendizaje empleada es distinta. Se define una función error para cada neurona que da cuenta del define una función error para cada neurona que da cuenta del error cometido para cada valor posible de los pesos cuando error cometido para cada valor posible de los pesos cuando se presenta una entrada a la neurona. Así, la regla de se presenta una entrada a la neurona. Así, la regla de aprendizaje hace que la variación de los pesos se produzca aprendizaje hace que la variación de los pesos se produzca en la dirección y sentido contrario del vector gradiente del en la dirección y sentido contrario del vector gradiente del error. A esta regla de aprendizaje se la denomina Delta. error. A esta regla de aprendizaje se la denomina Delta.

Page 22: Warren McCulloch

Historia Redes Historia Redes Neuronales (IV)Neuronales (IV)

La era moderna de las redes neuronales artificiales surge con la La era moderna de las redes neuronales artificiales surge con la técnica de aprendizaje de propagación hacia atrás o técnica de aprendizaje de propagación hacia atrás o Back Back PropagationPropagation. .

La contribución de Minsky y Papert fue la de demostrar que una red La contribución de Minsky y Papert fue la de demostrar que una red del tipo Perceptron no es capaz de aprender todas las posibles del tipo Perceptron no es capaz de aprender todas las posibles combinaciones entre entradas y salidas. combinaciones entre entradas y salidas.

La solución del problema consiste en añadir capas intermedias de La solución del problema consiste en añadir capas intermedias de neuronas, introduciendo de esta forma el problema de cómo enseñar neuronas, introduciendo de esta forma el problema de cómo enseñar a estas capas intermedias. Aquí es donde tiene importancia el a estas capas intermedias. Aquí es donde tiene importancia el algoritmo de propagación hacia atrás. algoritmo de propagación hacia atrás.

En éste se compara la salida real con la salida deseada. La diferencia En éste se compara la salida real con la salida deseada. La diferencia entre ambas constituye un error que se propaga hacia atrás desde la entre ambas constituye un error que se propaga hacia atrás desde la capa de salida hasta la de entrada permitiendo así la adaptación de capa de salida hasta la de entrada permitiendo así la adaptación de los pesos de las neuronas intermedias mediante una regla de los pesos de las neuronas intermedias mediante una regla de aprendizaje Delta. Sin embargo, también tiene sus limitaciones.aprendizaje Delta. Sin embargo, también tiene sus limitaciones.

Posteriormente se han desarrollado otros modelos que permiten un Posteriormente se han desarrollado otros modelos que permiten un aprendizaje no supervisado como el mapa auto-organizativo de aprendizaje no supervisado como el mapa auto-organizativo de Kohonen, los basados en la Teoría de Resonancia Adaptativa (ART) Kohonen, los basados en la Teoría de Resonancia Adaptativa (ART) de Grossberg y Carpenter, o los modelos de control motor de de Grossberg y Carpenter, o los modelos de control motor de Bullock, Gaudiano y Grossberg,Bullock, Gaudiano y Grossberg, entre otros. entre otros.

Page 23: Warren McCulloch

Referencias (I)Referencias (I) http://www.wikipedia.orghttp://www.wikipedia.org McCulloch, Warren S. (1965), McCulloch, Warren S. (1965), Embodiments of Embodiments of

MindMind, MIT Press, Cambridge, MA., MIT Press, Cambridge, MA. Talking Nets: An Oral History of Neural Networks, Talking Nets: An Oral History of Neural Networks,

Edited by James A. Anderson and Edward Edited by James A. Anderson and Edward Rosenfeld, 1998. Rosenfeld, 1998. The interview with Jerome Lettvin The interview with Jerome Lettvin discusses Walter Pitts.discusses Walter Pitts.

Pitts, Walter, MIT Encyclopedia of Cognitive Pitts, Walter, MIT Encyclopedia of Cognitive Science. Science. ((http://cognet.mit.edu/MITECS/Entry/lettvin1)http://cognet.mit.edu/MITECS/Entry/lettvin1)

Page 24: Warren McCulloch

Referencias (II)Referencias (II)

PERCEPTRÓN:PERCEPTRÓN:

Freund, Y. and Schapire, R. E. 1998. Large margin Freund, Y. and Schapire, R. E. 1998. Large margin classification using the perceptron algorithm. In Proceedings classification using the perceptron algorithm. In Proceedings of the 11th Annual Conference on Computational Learning of the 11th Annual Conference on Computational Learning Theory (COLT' 98). Theory (COLT' 98). ACM Press.ACM Press.

Gallant, S. I. (1990). Perceptron-based learning algorithms. Gallant, S. I. (1990). Perceptron-based learning algorithms. IEEE Transactions on Neural Networks, vol. 1, no. 2, pp. 179-IEEE Transactions on Neural Networks, vol. 1, no. 2, pp. 179-191.191.

Rosenblatt, Frank (1958), The Perceptron: A Probabilistic Rosenblatt, Frank (1958), The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain, Model for Information Storage and Organization in the Brain, Cornell Aeronautical Laboratory, Psychological Review, v65, Cornell Aeronautical Laboratory, Psychological Review, v65, No. 6, pp. 386-408.No. 6, pp. 386-408.

Minsky M L and Papert S A 1969 Minsky M L and Papert S A 1969 PerceptronsPerceptrons (Cambridge, MA: (Cambridge, MA: MIT Press)MIT Press)

Novikoff, A. B. (1962). On convergence proofs on perceptrons. Novikoff, A. B. (1962). On convergence proofs on perceptrons. Symposium on the Mathematical Theory of Automata, 12, Symposium on the Mathematical Theory of Automata, 12, 615-622. 615-622. Polytechnic Institute of Brooklyn.Polytechnic Institute of Brooklyn.

Widrow, B., Lehr, M.A., "30 years of Adaptive Neural Widrow, B., Lehr, M.A., "30 years of Adaptive Neural Networks: Peceptron, Madaline, and Backpropagation," Networks: Peceptron, Madaline, and Backpropagation," Proc. Proc. IEEEIEEE, vol 78, no 9, pp. 1415-1442, (1990)., vol 78, no 9, pp. 1415-1442, (1990).

Page 25: Warren McCulloch

Referencias (III)Referencias (III) Introducción a las redes neuronales artificialesIntroducción a las redes neuronales artificiales. Alfredo Catalina . Alfredo Catalina

Gallego. (www.gui.uva.es/login/login/13/redesn.html)Gallego. (www.gui.uva.es/login/login/13/redesn.html)

PUBLICACIONESPUBLICACIONES::

Warren McCulloch and Walter Pitts, Warren McCulloch and Walter Pitts, A Logical Calculus of Ideas A Logical Calculus of Ideas Immanent in Nervous ActivityImmanent in Nervous Activity, 1943, Bulletin of Mathematical , 1943, Bulletin of Mathematical Biophysics 5:115-133.Biophysics 5:115-133.

Warren McCulloch and Walter Pitts, Warren McCulloch and Walter Pitts, On how we know universals: The On how we know universals: The perception of auditory and visual formsperception of auditory and visual forms, 1947, Bulletin of , 1947, Bulletin of Mathematical Biophysics 9:127-147.Mathematical Biophysics 9:127-147.

Howland, R., Jerome Lettvin, Warren McCulloch, Walter Pitts, and P. Howland, R., Jerome Lettvin, Warren McCulloch, Walter Pitts, and P. D. Wall, D. Wall, Reflex inhibition by dorsal root interactionReflex inhibition by dorsal root interaction, 1955, Journal of , 1955, Journal of Neurophysiology 18:1-17.Neurophysiology 18:1-17.

Wall, P. D., Warren McCulloch, Jerome Lettvin and Walter Pitts, Wall, P. D., Warren McCulloch, Jerome Lettvin and Walter Pitts, Effects of strychnine with special reference to spinal afferent fibresEffects of strychnine with special reference to spinal afferent fibres, , 1955, Epilepsia Series 3, 4:29-40.1955, Epilepsia Series 3, 4:29-40.

Jerome Lettvin, Humberto Maturana, Warren McCulloch, and Walter Jerome Lettvin, Humberto Maturana, Warren McCulloch, and Walter Pitts, Pitts, What the Frog's Eye Tells the Frog's BrainWhat the Frog's Eye Tells the Frog's Brain, 1959, Proceedings , 1959, Proceedings of the Institute of Radic Engineers 47: 1940-1959of the Institute of Radic Engineers 47: 1940-1959

Humberto Maturana, Jerome Lettvin, Warren McCulloch, and Walter Humberto Maturana, Jerome Lettvin, Warren McCulloch, and Walter Pitts, Pitts, Anatomy and physiology of vision in the frogAnatomy and physiology of vision in the frog, 1960, Journal of , 1960, Journal of General Physiology, 43:129--175General Physiology, 43:129--175

Robert Gesteland, Jerome Lettvin and Walter Pitts, Robert Gesteland, Jerome Lettvin and Walter Pitts, Chemical Chemical Transmission in the Nose of the FrogTransmission in the Nose of the Frog, 1965, J.Physiol. 181, 525-529., 1965, J.Physiol. 181, 525-529.