Redes Neuronales Artificiales: Su utilización en la resolución de problemas
Las RNA son modelos de procesamiento de información basados en el funcionamiento del cerebro humano.
Están formadas por una gran cantidad de unidades o elementos de procesamiento llamados neuronas, las cuales
podemos dividir en tres grupos diferentes:
1) aquellas que reciben la información del exterior, también denominadas
como neuronas de entradas;
2) aquellas que transmiten información al exterior, denominadas neuronas
de salida,
3) por último aquellas que no tienen ningún contacto con el exterior y solamente intercambian información con otras neuronas de la red, a estas se las llama neuronas ocultas. En cualquier tipo de RNA las neuronas
se encuentran fuertemente interconectadas entre sí.
La posibilidad de resolver problemas difíciles es gracias a los principios de las redes
neuronales, los cinco más importantes son citados por Hilera y Martínez . Estos son
enunciados a continuación:
Aprendizaje adaptativo: Está es quizás la característica más importante de las redes
neuronales, pueden comportarse en función de un entrenamiento con una serie de ejemplos
ilustrativos. De está forma, no es necesario elaborar un modelo a prioridad, ni establecer
funciones probabilísticas. Una red neuronal artificial es adaptativa porque puede modificarse
constantemente con el fin de adaptarse a nuevas condiciones de trabajo.
Autoorganización: Mientras que el aprendizaje es un proceso donde se modifica la
información interna de la red neuronal artificial, la autoorganización consiste en la
modificación de la red completa con el fin de llevar a cabo un objetivo específico. El caso de la bibliometría.
Ciencias de la Información; Autoorganización significa generalización, de está forma una red puede responder a datos o
situaciones que no ha experimentado antes, pero que puede inferir sobre la base de su
entrenamiento. Esta característica es muy útil sobre todo cuando la información de entrada
es poco clara o se encuentra incompleta.
Tolerancia a fallos: En la computación tradicional la pérdida de un fragmento pequeño de
información puede acarrear comúnmente la inutilización del sistema. Las redes neuronales
artificiales poseen una alta capacidad de tolerancia a fallos. Se entiende por ello que las
redes pueden reconocer patrones de información con ruido, distorsión o incompletos, pero
que, además, pueden seguir trabajando aunque se destruya parte de la red (con cierta
degradación). La explicación de este fenómeno se encuentra en que mientras la computación
tradicional almacena la información en espacios únicos, localizados y direccionables, las
redes neuronales lo hacen de forma distribuida y con un alto grado de redundancia.
Operación en tiempo real: Las redes neuronales artificiales, de todos los métodos existentes, son las más indicadas para el reconocimiento de patrones en tiempo real, debido a que trabajan en paralelo actualizando todas sus instancias simultáneamente. Es importante destacar que esta característica solo se aprecia cuando se implementan redes con hardware especialmente diseñados para el procesamiento paralelo. Fácil inserción en la tecnología existente: Es relativamente sencillo obtener chips especializados para redes neuronales que mejoran su capacidad en ciertas tareas. Ello facilita la integración modular en los sistemas existentes.
Operación en tiempo real: Las redes neuronales artificiales, de todos los métodos existentes, son las más indicadas para el reconocimiento de patrones en tiempo real, debido a que trabajan en paralelo actualizando todas sus instancias simultáneamente. Es importante destacar que esta característica solo se aprecia cuando se implementan redes con hardware especialmente diseñados para el procesamiento paralelo. Fácil inserción en la tecnología existente: Es relativamente sencillo obtener chips especializados para redes neuronales que mejoran su capacidad en ciertas tareas. Ello facilita la integración modular en los sistemas existentes.
Aprendizaje de una Red Neuronal
Es con toda seguridad la característica mas importante de una red neuronal, durante este aprendizaje o entrenamiento de la red y por aplicación de un conjunto de entradas, se van ajustando adecuada e internamente todos y cada uno de los pesos asociados a cada rama para obtener la salida deseada de forma que la red pueda responder después por si sola a situaciones diferentes a las aprendidas. Para cosas sencillas los pesos pueden asignarse de forma manual, pero lo usual es utilizar algún algoritmo para llevar a cabo este proceso de entrenamiento.
Este aprendizaje que tiene lugar en las redes neuronales es el factor que determina las ventajas (y también los inconvenientes) de estos sistemas. Si la red esta bien ajustada y gracias a la masiva operación en paralelo de cada nodo sera capaz de trabajar con la información incompleta o difícil de predecir teniendo un cierto grado de memoria asociativa que le permite generalizar su comportamiento ante una cierta entrada si esta entrada es razonablemente parecida a aquellas para las que ha sido entrenada.
Todos los métodos de aprendizaje pueden ser englobados en 2 categorías:
1) Aprendizaje Supervisado: Es un caso de entrenamiento con profesor y utiliza información global. Se presentan 2 vectores (entrada y salida deseada). La salida computada con la red se compara con la salida deseada y los pesos de la red se modifican en el sentido de reducir el error cometido. Se repite iterativamente hasta que la diferencia entre salida computada y deseada sea aceptablemente pequeña.
El aprendizaje supervisado se suele dividir a su vez en 2 subcategorías:
a- Aprendizaje Estructural: Se refiere a la búsqueda de la mejor conexión o afinidad posible entrada/salida para cada pareja de patrones individuales. La mayor parte de los algoritmos de aprendizaje que veremos a continuación tienen un enfoque estructural.
b- Aprendizaje Temporal: Hace referencia a la captura de una serie de patrones necesarios para conseguir algún resultado final. En el aprendizaje temporal la respuesta actual de la red depende de las entradas y respuestas previas en el aprendizaje estructural no existe tal dependencia.
2) Aprendizaje no Supervisado: Es un caso de entrenamiento sin profesor y solo usa información local durante todo el proceso de aprendizaje. Es un modelo más cercano al sistema biológico, no se utiliza el vector de salida esperada y solo hay vectores de entrada en conjunto de entrenamiento. El algoritmo modifica los pesos de forma que las salidas sean consistentes, es decir, que a entradas muy parecidas, la red compute la misma salida las cuales se asocian a las entradas de acuerdo con el proceso de entrenamiento. El proceso extrae características abstrayendo las propiedades colectivas del conjunto de entrenamiento y agrupa por clases de similitudes.
No hay comentarios:
Publicar un comentario