archivo - Biología de Sistemas

Transcripción

archivo - Biología de Sistemas
Lección 6
Redes Neuronales Artificiales
Curso Básico
Curso
Aproximación al estudio de célula mínima
desde la Biología de Sistemas
Montevideo 6-10 diciembre 2010
Federico Morán
Departamento de Bioqímica y Biología Molecular
Universidad Complutense madrid, España
Algunos enlaces de interés
•  http://www.gc.ssr.upm.es/inves/neural/ann2/anntutor.htm
•  http://www.ee.umd.edu/medlab/neural/nn1.html
•  http://math.chtf.stuba.sk/Books_texts_ANN.htm
2
La
neurona
biológica
3
Las neuronas son células vivas
4
Diferentes morfologías de neuronas
5
De neuronas naturales a artificiales
6
Neurona formal (McCulloch-Pitts, 1943)
x1 w1j
w2j
x2
…
wnj
xn
!
yj
f
#0 si I j < !
Binaria: I j = " w ij x i ! y j = $
i
%1 si I j " !
Valores
reales: I j = ! w ij x i " # $
i
!función escalón
# sigmoide
#
y j = f (I j ) siendo f "
# gaussiana
#$
...
7
Autómatas celulares
Sistemas dinámicos discretos capaces de describir
sistemas dinámicos continuos
Stanislaw Ulam
DISCRETO: “Que las
propiedades, el espacio y el
tiempo del autómata tienen un
número de estados finitos”
Los autómatas celulares son una
alternativa a los sistemas de
ecuaciones diferenciales parciales
• Células
John von Neumann
• Rejilla
• Estados
John Horton Conway
• Reglas de transición
• Condiciones de
contorno
• Vecindad
Toffoli T. (1984) Cellular automata as an alternative (rather than an approximation of) differential
equations in modeling physics. Physica 10, 117- 127
Vichiniac G.Y. (1984) Simulating physics with cellular automata Physica 10D, 96-116
http//:www.wolfram.com/articles
8
Neurona formal vs. autómata celular
Θ
x1 w1j
w2j
x2
…
wnj
xn
f
yj
%0 si ! w ij x i " # < 0
'
i
yj = &
'1 si ! w ij x i " # $ 0
i
(
x1
x2
s
x
x4
!s(t + 1) = f ({x i (t)},s(t))
"
# x(t + 1) = g({x i (t)},s(t))
x3
9
Historia de las Redes Neuronales Artificiales
(Primera Epoca)
AÑO
AUTORES
CONTRIBUCIÓN
1943
W. McCulloch, W. Pitts
Neurona formal
1949
Donald Hebb
Aprendizaje hebbiano
1950
N. Wiener
Cybernetics
1951 y 56
J. von Neuman
Automata y computacion neuronal.
Redundancia
1951
M. Minsky
Neurocomputer
1957 y 62
F. Rosenblatt
Regla delta y Perceptron
1962
B. Widraw
ADALINE
1963
Winograd y Cowan
Proceso distribuido
1969
M. Minsky y S. Papert
Critica al perceptron
10
Perceptrón
11
Aprendizaje
• Supervisado: se conoce la respuesta esperada y
se puede evaluar el grado de acierto
– Refuerzo positivo/negativo
– Cálculo del error (regla delta)
• No supervisado: no se conoce si la respuesta es
acertada o no; no se conoce el tipo de respuesta
(clasificación)
– Autoorganizado
– Hebbiano
12
Primeras redes adaptativas:
El perceptrón original (Rosemblatt, 1959)
Θ
x1 w1j
w2j
x2
…
wnj
xn
f
yj
%!1 si
'
yj = &
'+1 si
(
"w
"w
ij
xi ! # < 0
ij
xi ! # $ 0
i
i
Primera regla de aprendizaje (Rosemblatt):
wij(nuevo) = wij(viejo) + β yj xi
+1 respuesta correcta
β es la constante de refuerzo (“critico”)
!1 respuesta incorrecta
{
Procedimiento:
- Se presenta la muestra en veces sucesivas
- Se van modificando los pesos en cada paso hasta llegar a una situación
estacionaria
- El estado final depende de los valores iniciales de los pesos (mínimos locales)
Otras reglas de aprendizaje:
• Tipo Hebb: β=0
• Convergente ! = 0 respuesta correcta
{
signo(y j x i ) respuesta incorrecta
13
Primeras redes adaptativas: regla delta
Θ
x1 w1j
w2j
x2
…
wnj
xn
yj
f
tj (respuesta deseada)
%0 si ! w ij x i " # < 0
'
i
yj = &
'1 si ! w ij x i " # $ 0
i
(
w ij (nuevo) = w ij (viejo) + ! (t j " y j )x i
! : constante aprendizaje (0 < ! " 1)
! j = (t j " y j )
Rosenblatt demostró en 1962 que con esta regla de
aprendizaje el error siempre disminuye
14
Demostración de la disminución del error en la regla delta
15
Límites del perceptrón monocapa
Θ
x1
x2
w11
w21
f
yj
16
Límites del
perceptrón: el
operador Xor
(Minsky y Papert,
1969)
17
Historia de las Redes Neuronales Artificiales
(Epoca Intermedia)
AÑO
AUTORES
CONTRIBUCIÓN
1971
T. Kohonen
Memoria asociativa
1973
Ch. von der Maslsburg
Columnas de Orientacion
1975
S.I. Amari
Aprendizaje competitivo
1976
Willsaw y von der Malsburg Retinotopia
1977
J. Anderson
Autoasociación
1977 y 79
K. Fukushima
Cognitron y neocognitron
1978
S. Grossberg
Autoorganizacion de redes
1982
T. Kohonen
Self Organizing Map (SOM)
1982 y 84
J. Hopfield
Redes resonantes o de Hopfield
1985
Ackley, Hinton, Sejnowski
Maquina de Boltzman
18
Redes de Hopfield
19
Redes Resonantes o Redes de Hopfield
•  Las redes de Hopfield están formadas por neuronas
binarias, es decir que sus estado sj pueden adoptar
valores (1, -1) ó (1, 0)
•  Las neuronas están conectadas todas con todas
mediante pesos sinápticos con las siguientes
restricciones:
- wij = wji (conexiones simétricas)
- wii = 0 (no se conectan a sí mismas)
•  Regla de actualización de la actividad:
•  La actividad se va actualizando de modo recursivo
hasta que no varíe en un turno completo
• En estas condiciones la energía E siempre disminuye:
20
Ejemplos de redes de Hopfield:
memoria asociativa
21
Ejemplos de redes
de Hopfield (2):
memoria asociativa
y reconstrucción de
imágenes.
22
Convergencia de una red
de Hopfield: minimización
de la “energía”
23
Aprendizaje no supervisado
•  El aprendizaje implica la modificación de los pesos “sinápticos”
•  La red presenta ENTRADA y SALIDA, pero no hay retorno desde fuera
•  La red debe descubrir por sí misma patrones, características, regularidades,
correlaciones, etc. en los datos de entrada y codificarlos en la salida
•  Tanto unidades como conexiones han de ser capaces de autoorganización
•  Sólo es posible si existe redundancia en los datos de entrada:
“La redundancia proporciona conocimiento” (Barlow, 1989)
•  Tipos de tareas que se pueden realizar:
- modelización de procesos biológicos
- agrupar por familias
- análisis de componentes principales
- “clustering” (agrupamiento o clasificación)
- localiación de prototipos
- codificación
- extracción de carácterísticas comunes
- organización topológica de datos
24
Aprendizaje
competitivo no
supervisado
25
SOM:
Mapas
topológicos o
autoorganizados
de Kohonen
26
SOM (2)
27
Clasificación de partículas virales mediante SOM
28
Cálculo de estructura secundaria de proteínas a partir de DC en UV lejano
SOMCD
Cálculo de
estructura
secundaria de
proteínas a
partir de DC en
UV lejano
http://somcd.geneura.org/
31
Historia de las Redes Neuronales Artificiales
(Segunda Epoca)
AÑO
AUTORES
CONTRIBUCIÓN
1986
Rumelhart, Hinton y
Williams
Regla delta generalizada,
backpropagation
1986
Rumelhart, McClelland y
PDP-group
Paralell distributed processing
1986
Sejnowski y Rosenberg
NETtalk
1989
T. Kohonen
LVQ
32
Perceptron
multicapa
33
Regla delta
generalizada:
propagación del
error hacia atrás
34
Dos pasos:
propagacion de
actividad hacia delante
y del error hacia atrás.
35
Demostración de la disminución del error en la regla delta generalizada
36
Solución al problema XOR
37
Ejemplo de
aplicación con
perceptrón
multicapa
38
NETtalk: Sejnowski, T. J. and Rosenberg, C. R. (1986) NETtalk: a parallel network that
learns to read aloud, Cognitive Science, 14, 179-211.
39
Redes Neuronales en Bioinformática
Algoritmos supervisados
•  Genetic Algorithm Neural Networks for Regulatory Region Identification
Robert G. Beiko and Robert L. Charleboi
http://bioinformatics.org.au/gann/
•  Análisis de microarrays de DNA: diagnóstico de
diferentes tipos de cáncer basándose en sus
expresiones génicas características.
Khan et al. Nature Med. 7: 673-679 (2001)
•  Predicción de la estructura secundaria a partir de la secuencia de
aminácidos de una proteína. B Rost: PHD: predicting one-dimensional
protein structure by profile based neural networks.
Meth. in Enzymolgy, 266, 525-539, (1996)
http://www.predictprotein.org/
http://www.cmpharm.ucsf.edu/~nomi/nnpredict.html
40
41
42