17
LOGICA FUZZY UNIVERSIDAD LAICA ELOY LFARO DE MANIABI Ronald Cevallos SISTEMAS EXPERTOS II

Ronald

  • Upload
    yover

  • View
    213

  • Download
    0

Embed Size (px)

DESCRIPTION

 

Citation preview

LOGICA FUZZY

U N I V E R S I D A D

L A I C A E L O Y L F A R O

D E M A N I A B I

Ronald Cevallos

SISTEMAS EXPERTOS II

¿QUÉ ES LA LÓGICA DIFUSA?

La lógica difusa es una metodología que proporciona una

manera simple y elegante de obtener una conclusión a

partir de información de entrada vaga, ambigua,

imprecisa, con ruido o incompleta. En general la lógica

difusa imita como una persona toma decisiones basada

en información con las características mencionadas. Una

de las ventajas de la lógica difusa es la posibilidad de

implementar sistemas basados en ella tanto en hardware

como en software o en combinación de ambos. La lógica

difusa es una técnica de la inteligencia computacional

que permite trabajar con información con alto grado de imprecisión, en esto se diferencia de

la lógica convencional que trabaja con información bien definida y precisa.

Es una lógica multivaluada que permite valores intermedios para poder definir evaluaciones

entre si/no, verdadero/falso, negro/blanco, caliente/frío, etc. El concepto de Lógica Difusa fue

concebido por Lofti A. Zaded, profesor de la Universidad de California en Berkeley, quién

inconforme con los conjuntos clásicos (crisp sets) que sólo permiten dos opciones, la

pertenencia o no de un elemento a dicho conjunto, la presentó como una forma de procesar

información permitiendo pertenencias parciales a unos conjuntos, que en contraposición a los

clásicos los denominó Conjuntos Difusos (fuzzy sets).

El concepto de conjunto difuso fue expuesto por Zadeh en un paper del año 1965, hoy

clásico en la literatura de la lógica difusa, titulado "Fuzzy Sets" y que fue publicado en la

revista Information and Control. El mismo Zadeh publica en 1971 el artículo, "Quantitative

Fuzzy Semantics", en donde introduce los elementos formales que acabarían componiendo el

cuerpo de la doctrina de la lógica difusa y sus aplicaciones tal como se conocen en la

actualidad.

Zadeh dice: "La lógica difusa trata de copiar la forma en que los humanos toman decisiones.

Lo curioso es que, aunque baraja información imprecisa, esta lógica es en cierto modo muy

precisa: se puede aparcar un coche en muy poco espacio sin darle al de atrás. Suena a

paradoja, pero es así." El profesor Zadeh menciona que la gente no requiere información

numérica precisa del medio que le rodea para desarrollar tareas de control altamente

adaptables, por ejemplo conducir un automóvil o caminar por una acera sin chocarse con los

postes y las otras personas. Si los controladores convencionales, en esencia realimentados, se

pudieran programar para aceptar entradas con ruido e imprecisas ellos podrían trabajar de una

manera más eficiente y quizás se podrían implementar más fácilmente.

¿QUE SON LOS CONJUNTOS DIFUSOS?

De manera intuitiva se tiene el concepto de conjunto como una colección bien definida de

elementos, en la que es posible determinar para un objeto cualquiera, en un universo dado, si

acaso éste pertenece o no al conjunto. La decisión, naturalmente, es ``sí pertenece'' o bien ``no

pertenece''. Por ejemplo, consideremos como universo a la población económicamente

activa1 en México, es decir, al conjunto formado por las personas residentes en ese país con

una edad entre 18 años (cumplidos) y 66 años (por cumplir). Consideremos un mes

cualquiera, digamos, diciembre de 2000 (y no porque entonces hubiera habido un cambio,

sino porque era ése el último mes del siglo XX). El conjunto de personas empleadas en

México en ese mes, podríamos pensar, está bien determinado: una persona en nuestro

universo que entonces hubiera vendido su fuerza de trabajo, bajo un contrato de empleo, a una

empresa legalmente constituída, sin duda alguna era una persona empleada, y alguien que no

tuvo salario alguno en ese mes y no estuvo vinculado a ningún patrón bajo una relación

contractual, pues no era empleado. El lector observará la sobresimplificación del criterio de

pertenencia enunciado. En efecto, ni falta el funcionario de la Secretaría del Trabajo que dirá:

``Todo ciudadano que haya trabajado al menos una hora en ese mes y por eso haya recibido

un pago, es un empleado'', y tampoco faltará quien diga: ``Qué empleo? No hallé trabajo en

todo el 2000 y sólo en su último mes, mi primo me empleó a destajo para envolver regalos en

su tienda: Yo no soy ningún empleado''. La noción intuitiva de conjunto puede, así, ser muy

estrecha. En un conjunto difuso a cada elemento del universo se le asocia un grado de

pertenencia, que es un número entre 0 y 1, a ese conjunto. Un conjunto difuso es pues una

correspondencia (o función) que a cada elemento del universo le asocia su grado de

pertenencia. Enunciada así esta definición parece ser cíclica, mas no lo es: un conjunto difuso

es una función cuyo dominio es el universo y cuyo contradominio es el intervalo [0,1].

Ejemplo:

“Jhon es alto” . . . verdadero o falso

Altura de Jhon:

h Jhon = 180.0 A(180.0) = 1(verdadero)

h Jhon = 179.5 A(179.5) = 1(falso)

“Jhon es alto” … grado de verdad

Altura de Jhon

hJhon = 180.0 A [180.0] = 0.55

hJhon = 179.5 A [179.5] = 0.5

hJhon = 201.0 A [201.0] = 1

QUE ES LA INFERIENCIA:

Una inferencia es una evaluación que realiza la mente entre proposiciones. En lógica formal,

son expresiones bien formadas (EBF) de un lenguaje formal que, al ser relacionadas, permiten

trazar una línea lógica de condición o implicación lógica entre las diferentes EBF. De esta

forma, parte de lo verdadero a lo falso: posible (como hipótesis)

o conocida (como argumento) de alguna o algunas de ellas, puede deducirse la verdad o

falsedad de alguna o algunas de las otras EBF.

Surge así lo que conocemos como postulado o transformada de una expresión original

conforme a reglas previamente establecidas, que puede enmarcarse en uno o varios contextos

referenciales diversos, obteniéndose en cada uno de ellos un significado como valor de

verdad de equivalente.

Es la operación lógica utilizada en los motores de inferencia de los sistemas expertos.

Inferencia por evidencias

Evidencia inductiva: Surge de la constatación de una misma ocurrencia en una serie de

casos. Observando que muchos lobos tienen la cola larga, infiero que “los lobos tienen la

cola larga”, como una generalización.

Evidencia enumerativa o inducción completa: Cuando se enumeran todos los casos la

inferencia se convierte en una verdad demostrada, como inducción completa. Tal es el

caso de que tras contar a todos y cada uno se pueda inferir: “los alumnos de esta clase son

22”.

Clases de inferencia

Inferir por lógica clásica: Inferencia que sólo admite dos valores: verdadero o falso.

Inferencia trivaluada: Una inferencia de este estilo da como posibles resultados tres

valores.

Inferencia multivaluada: Una inferencia de este estilo da como posibles resultados

múltiples valores.

Inferencia difusa: Una inferencia de este estilo describe todos los casos multivaluados con

exactitud y precisión.

Inferencia probabilística en el sentido de una inducción que permite establecer una verdad

con mayor índice de probabilidad que las demás.

Si bien, cuando el universo posible es de infinitas ocurrencias la probabilidad siempre

será 0. Por lo que algunos establecen para el estatuto de la ciencia el falsacionismo,

como método científico y contrastación de teorías y las lógicas humanas.

Inferencia estadística

Cuando la descripción se aplica a condiciones de certeza, como en las tablas del mercado de

valores en que se muestra un censo de los valores negociados, se convierte en una entidad

metodológica. Sin embargo, en la mayoría de los problemas estadísticos actuales se emplea

más una muestra que un censo, y la descripción se ha convertido simplemente en una

preparación de la siguiente rama de la estadística: inferencia.

Cuando hacemos uso de la inferencia, llegamos a una conclusión o formulamos una

afirmación bajo ciertas condiciones de incertidumbre. La incertidumbre puede ser el resultado

de las condiciones aleatorias, implícitas en el trabajo con muestras, o del desconocimiento de

las leyes aleatorias precisas que son aplicables a una situación específica. No obstante en la

teoría de la conclusión, la incertidumbre sobre la exactitud de la afirmación que se ha hecho o

de la conclusión que se ha sacado se expone simplemente en términos de probabilidad de que

ocurra.

La inferencia trata de dos tipos principales de problemas: la estimación y la contratación de

hipótesis

Inferencia aplicada al conocimiento del comportamiento humano

Se puede inferir todo lo que sea inteligible. Dentro del campo de la inteligencia humana,

encontramos campos muy interesantes, tal como la inteligencia emocional. Dado que el

cerebro humano está sujeto a leyes físicas, existe la posibilidad de que el comportamiento

humano sea potencialmente previsible, con un grado de incertidumbre, al mismo grado que el

resto de ciencias lo pudiera ser, pues todas se basan en la inteligencia del hombre. La

capacidad de inferir el sentimiento humano se llama empatía; cada sentimiento motiva a

actuar de cierta manera. La capacidad de predecir cómo va a actuar cierta persona roza lo

esotérico, pero nada más lejos de la realidad, se pueden generar modelos de comportamientos

humanos y el grado de exactitud de la predicción dependerá de lo empático que sea la persona

(dado que la única máquina capaz de reproducir una mente, hasta la fecha, es

un cerebro humano).

Para que sirven las inferencias

Las inferencias (adivinar, suponer el significa de una palabra) dentro de un texto nos sirven

para enfrentar las palabras desconocidas. Es muy probable que cuando leamos un texto nos

encontremos con palabras desconocidas para las cuales debemos de suponer un significado,

sin que esto haga que detengamos nuestra lectura. Debemos recordar que cuando leemos,

leemos de manera global y no palabra por palabra, por lo cual cuando nos encontrarnos con

una palabra desconocida no debe ser motivo de detener o dejar nuestra lectura. Si sentimos

que dicha palabra es vital para la comprensión del texto y no estamos seguros de que nuestra

suposición sea correcta, entonces debemos acudir a la ayuda de un diccionario.

Controladores difusos:

APLICACIÓN PRÁCTICA DE LA LÓGICA DIFUSA:

Aplicaciones generales

La lógica difusa se utiliza cuando la complejidad del proceso en cuestión es muy alta y no

existen modelos matemáticos precisos, para procesos altamente no lineales y cuando se

envuelven definiciones y conocimiento no estrictamente definido (impreciso o subjetivo).

En cambio, no es una buena idea usarla cuando algún modelo matemático ya soluciona

eficientemente el problema, cuando los problemas son lineales o cuando no tienen solución.

Esta técnica se ha empleado con bastante éxito en la industria, principalmente en Japón,

extendiéndose sus aplicaciones a multitud de campos. La primera vez que se usó de forma

importante fue en el metro japonés, con excelentes resultados. Posteriormente se generalizó

según la teoría de la incertidumbre desarrollada por el matemático y economista

español Jaume Gil Aluja.

A continuación se citan algunos ejemplos de su aplicación:

Sistemas de control de acondicionadores de aire

Sistemas de foco automático en cámaras fotográficas

Electrodomésticos familiares (frigoríficos, lavadoras...)

Optimización de sistemas de control industriales

Sistemas de escritura

Mejora en la eficiencia del uso de combustible en motores

Sistemas expertos del conocimiento (simular el comportamiento de un experto humano)

Tecnología informática

Bases de datos difusas: Almacenar y consultar información imprecisa. Para este punto,

por ejemplo, existe el lenguaje FSQL.

...y, en general, en la gran mayoría de los sistemas de control que no dependen de un

Sí/No.

Ejemplo:

REDES NEURALES ARTIFICIALES

Las redes de neuronas artificiales (denominadas habitualmente como RNA o en inglés como:

"ANN"1 ) son un paradigma de aprendizaje y procesamiento automático inspirado en la forma

en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión

de neuronas que colaboran entre sí para producir un estímulo de salida. En inteligencia

artificial es frecuente referirse a ellas como redes de neuronas o redes neuronales.

Propiedades

Una red neuronal se compone de unidades llamadas neuronas. Cada neurona recibe una serie

de entradas a través de interconexiones y emite una salida. Esta salida viene dada por tres

funciones:

1. Una función de propagación (también conocida como función de excitación), que por

lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su

interconexión (valor neto). Si el peso es positivo, la conexión se denomina excitatoria;

si es negativo, se denomina inhibitoria.

2. Una función de activación, que modifica a la anterior. Puede no existir, siendo en este

caso la salida la misma función de propagación.

3. Una función de transferencia, que se aplica al valor devuelto por la función de

activación. Se utiliza para acotar la salida de la neurona y generalmente viene dada

por la interpretación que queramos darle a dichas salidas. Algunas de las más

utilizadas son la función sigmoidea (para obtener valores en el intervalo (0,1)) y

la tangente hiperbólica (para obtener valores en el intervalo (-1,1)).

Aplicaciones prácticas de las redes neuronales artificiales

Redes Neuronales Artificiales (NN) Las NN aplicadas están, en general, inspiradas en las

redes neuronales biológicas, aunque poseen otras funcionalidades y estructuras de conexión

distintas a las vistas desde la perspectiva biológica. Las características principales de las NN

son las siguientes: 1. Auto-Organización y Adaptabilidad: utilizan algoritmos de aprendizaje

adaptativo y auto-organización, por lo que ofrecen mejores posibilidades de procesado

robusto y adaptativo. 2. Procesado no Lineal: aumenta la capacidad de la red para aproximar

funciones, clasificar patrones y aumenta su inmunidad frente al ruido. 3. Procesado Paralelo:

normalmente se usa un gran número de nodos de procesado, con alto nivel de

interconectividad. El elemento básico de computación (modelo de neurona) se le llama

habitualmente nodo o unidad. Recibe un input desde otras unidades o de una fuente externa de

datos. Cada input tiene un peso asociado w, que se va modificando en el llamado proceso de

aprendizaje. Cada unidad aplica una función dada f de la suma de los inputs ponderadas 4

mediante los pesos.

RED NEURONA ARTIFICIAL

Modelos matemáticos, computacionales, artificiales, ideales de una red neuronal empleados

en estadística, psicología cognitiva, e inteligencia artificial.

EJEMPLOS DE APLICACIONES

Análisis Financiero

Procesado de Imágenes

Diagnóstico

Control y Robótica

Procesado de Voz

Otras Aplicaciones

QUE ES MATLAB USOS Y AMBIENTES DE TRABAJO.

QUE ES MATLAB

MATLAB (abreviatura de MATrix LABoratory, "laboratorio de matrices") es una

herramienta de software matemático que ofrece un entorno de desarrollo integrado (IDE) con

un lenguaje de programación propio (lenguaje M). Está disponible para las

plataformas Unix, Windows, Mac OS X y GNU/Linux.

Entre sus prestaciones básicas se hallan: la manipulación de matrices, la representación de

datos y funciones, la implementación de algoritmos, la creación de interfaces de usuario

(GUI) y la comunicación con programas en otros lenguajes y con otros dispositivos hardware.

El paquete MATLAB dispone de dos herramientas adicionales que expanden sus

prestaciones, a saber, Simulink (plataforma de simulación multidominio) y GUIDE (editor de

interfaces de usuario - GUI). Además, se pueden ampliar las capacidades de MATLAB con

las cajas de herramientas (toolboxes); y las de Simulink con los paquetes de bloques

(blocksets).

Es un software muy usado en universidades y centros de investigación y desarrollo. En los

últimos años ha aumentado el número de prestaciones, como la de programar

directamente procesadores digitales de señal o crear código VHDL

AMBIENTE DE TRABAJO

El entorno operativo de Matlab se compone de una serie de ventanas las que presentamos a

continuación. Aunque el reparto de estas ventanas en la pantalla puede cambiarse,

generalmente aparecen en la misma posición.

LAS VENTANAS QUE FORMAN PARTE DEL ENTORNO DE TRABAJO DE

MATLAB SON:

Se utiliza para introducir órdenes directamente por el usuario (seguidas de enter). Los

resultados de las órdenes introducidas se muestran en esta misma pantalla. Cuando las

órdenes se envían desde un programa previamente escrito, que en Matlab recibe el nombre de

M-file, los resultados también aparecen en esta ventana.

CONCLUSIONES

Las Redes Neuronales son un campo muy importante dentro de la Inteligencia Artificial, una

red neuronal es un sistema compuesto de muchos elementos procesadores simples operando

en paralelo, cuya función es determinada por la estructura de la red, fuerza en las conexiones

y el procesamiento realizado por los elementos computacionales en los nodos. Las redes

neuronales artificiales (ANN) imitan su funcionamiento a aquellas que se encuentran en el

ámbito biológico, Son aptas para resolver problemas que no poseen un algoritmo claramente

definido para transformar una entrada en una salida; aprenden, reconocen y aplican relaciones

entre objetos.