Upload
jchconsultores
View
287
Download
0
Embed Size (px)
Citation preview
APRENDIZAJE AUTOMÁTICO
i. Definiciones
ii. ¿Qué es el Aprendizaje Automático?
iii. Reseña Histórica del Estudio de Sistemas Discentes
iv. ¿Qué es un algoritmo?
v. Tipos de Algoritmos
vi. La Minería de Datos
vii. Modelos
viii.El Problema de Aprendizaje
ix. Diseño de un Sistema de Aprendizaje
x. Herramientas Disponibles
xi. Aplicaciones
xii. Tendencias
xiii.Vídeo
xiv. Conclusión
xv. Preguntas
xvi. Bibliografía
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE
“Es el proceso a través del cual se adquieren o modifican habilidades,
destrezas, conductas o valores como resultado del estudio, la
experiencia, la instrucción, y el razonamiento " (Wikipedia)
“Es el proceso de asimilación de información mediante el cual se
adquieren nuevos conocimientos, técnicas o habilidades" (www.significados.com/aprendizaje/)
AUTOMÁTICO
“Maquinal, que se lleva a cabo involuntariamente y sin reflexión”
“Mecanismo que funciona en todo o en parte por sí mismo”
(www.wordreference.com/definición/automático)
Definiciones:
¿Qué es el Aprendizaje Automático?
“En Ciencias de la Computación el aprendizaje automático o aprendizaje de máquinas es una rama de la inteligencia artificial cuyo
objetivo es desarrollar técnicas que permitan a las computadoras aprender”
(www.wikipedia.com)
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE AUTOMÁTICO
• z
Taxonomía del aprendizaje automático
Obtiene conclusiones generales a partir de premisas particulares.
La conclusión se halla implícita dentro las premisas.
APRENDIZAJE AUTOMÁTICO
Métodos de Aprendizaje De caja negra: Ejemplo: Redes neuronales y los métodos bayesianos. Desarrollan su propia representación del conocimiento, que no es visible desde el exterior. Orientados al conocimiento: Ejemplo: Árboles de decisión, reglas de asociación, o reglas de decisión. Construyen una estructura simbólica del conocimiento que intenta ser útil desde el punto de vista de funcionalidad, y descripción desde la perspectiva de la inteligibilidad.
http://www.lsi.us.es/redmidas/ http://juanitajuanabernal.blogspot.com/p/ventajas-y-desventajas.html
1920 1949 1950 1959 1960 1970 1975 1977 1980
I. P. Pávlov
realiza sus
famosos
experimentos
sobre el reflejo
condicionado.
Arthur Samuel construyó un programa que mejoraba su
desempeño en el juego de
damas a partir de la experiencia
W. K. Estes propone una teoría estadística del aprendizaje.
D. O. Hebb publica su teoría
del aprendizaje
neuronal.
John R. Anderson desarrolla el sistema ACT que mejora sus habilidades para la
prueba de teoremas de geometría
Tom M. Mitchell, Ranan Banerji y otros
desarrollan el programa LEX que
adquiere heurísticas para la
solución de problemas de
integración simbólica.
L. D. Harmon estudia ciertos modelos de neuronas artificiales, trabajos sobre
el aprendizaje de redes por M. L. Minsky.
Patrik Henry Winston hizo un programa que adquiría conceptos en el dominio de las
construcciones con bloques, a partir de instrucción.
APRENDIZAJE AUTOMÁTICORESEÑA HISTORICA DEL ESTUDIO DE SISTEMAS DISCENTES
Douglas Lenat realiza el sistema AM que descubre conceptos matemáticos a
partir de unos principios básicos y unas heurísticas que lo guían.
APRENDIZAJE AUTOMÁTICO
¿Qué es un
algoritmo?
Conjunto ordenado y finito de operaciones que permite hallar la solución de un
problema.
(http://dle.rae.es/?id=1nmLTsh)
TIPOS DE ALGORITMOS
Aprendizaje supervisado (predictivo)
Es una técnica para deducir una función (hipótesis) a partir de datos de entrenamiento
El objetivo del aprendizaje supervisado es el de crear una función capaz de predecir el valor correspondiente a cualquier objeto de entrada válida después de haber visto
una serie de ejemplos, los datos de entrenamiento
APRENDIZAJE AUTOMÁTICO
Se toma un conjunto de datos con su clase
y sus atributos
Se crea un modelo llamado clasificador
El modelo constará de un algoritmo de
clasificación
El algoritmo clasificador se
encargará de clasificar los
datos en una determinada
clase objetivo
El modelo generado va a usar
toda su información de
aprendizaje ya almacenada para
clasificar o predecir la clase de
un conjunto de datos nuevo
TIPOS DE ALGORITMOS
Aprendizaje supervisado (predictivo)
.
q4e
APLICACIÓN:
Detección de correo basura, cuando llega un nuevo correo,
el modelo nos dice si el correo es basura o no.
APRENDIZAJE AUTOMÁTICO
Es una forma de aprendizaje artificial en
la que se construye una hipótesis
(función matemática (aprendida) a partir de
data de entrenamiento previamente etiquetada.
https://www.youtube.com/watch?v=FVMGHlDy-eo
Aprendizaje no supervisado (o del descubrimiento del
conocimiento)
Todo el proceso de modelado se lleva a cabo sobre un
conjunto de ejemplos formado tan sólo por entradas al
sistema. No se tiene información sobre las categorías de
esos ejemplos. Por lo tanto, en este caso, el sistema tiene
que ser capaz de reconocer patrones para poder etiquetar
las nuevas entradas.
NO HAY UN CONOCIMIENTO A PRIORI
APRENDIZAJE AUTOMÁTICO
TIPOS DE ALGORITMOS
http://sevensm.com/Pruebas-Wordpress/wp-content/uploads/2014/05/marketing.jpg http://image.slidesharecdn.com/segmentacindemercados-091213175425-phpapp01/95/segmentacin-de-mercados-1-728.jpg?cb=1260726942
https://www.youtube.com/watch?v=ossgrphXpnE
Organizar computing clusters
Segmentación de Mercado Análisis de Data Astronómica
Análisis de Redes Sociales
APRENDIZAJE AUTOMÁTICO Tipos de Algoritmos Aplicación del Aprendizaje no Supervisado
APRENDIZAJE AUTOMÁTICO LA MINERÍA DE DATOS
La minería de datos o exploración de datos es un campo
de las ciencias de la computación referido al proceso que
intenta descubrir patrones en grandes volúmenes de
conjuntos de datos.
Utiliza los métodos de la inteligencia artificial, aprendizaje
automático, estadística y sistemas de bases de datos.
El objetivo general del proceso de minería de datos consiste
en extraer información de un conjunto de datos y
transformarla en una estructura comprensible para su uso
posterior.
https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
http://www.uaeh.edu.mx/scige/boletin/huejutla/n1/multimedia/m2/m2_big.jpg
APRENDIZAJE AUTOMÁTICO
EL PROCESO DE LA MINERÍA DE DATOS
Técnicas de minería de datos
Las técnicas, no son más que algoritmos, que se aplican sobre un conjunto de datos para obtener unos resultados.
Ejemplos:
Redes neuronales.- Son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el
sistema nervioso de los animales.
Sistema de interconexión de neuronas en una red que colabora para producir una salida.
El Algoritmo de aprendizaje es del tipo supervisado.
APRENDIZAJE AUTOMÁTICO LA MINERÍA DE DATOS
https://es.wikipedia.org/wiki/Red_neuronal_artificial http://www.academia.edu/7568072/Ejemplo_perceptron_simple
Paradigma Convencional
de Programación
en Ingeniería del Software
1.- El objetivo del
programador es modelar
matemáticamente el
problema en cuestión.
2. Posteriormente formula
una solución (programa)
mediante un algoritmo
codificado que tenga una
serie de propiedades que
permitan resolver dicho
problema.
Paradigma RNA de
Aprendizaje Automático. La aproximación basada en
las RNA parte de un conjunto
de datos de entrada
suficientemente significativo
y el objetivo es conseguir
que la red aprenda
(programe) automáticamente
las propiedades deseadas.
APRENDIZAJE AUTOMÁTICO LA MINERÍA DE DATOS
https://es.wikipedia.org/wiki/Red_neuronal_artificial http://www.academia.edu/7568072/Ejemplo_perceptron_simple
El perceptrón simple: neurona artificial y unidad básica de inferencia en forma de discriminador lineal, es decir, un algoritmo capaz de generar un criterio para
seleccionar un sub-grupo, de un grupo de componentes más grande (capacidad para reconocer patrones)
APRENDIZAJE AUTOMÁTICO
LA MINERÍA DE DATOS TÉCNICAS
Solo puede establecer dos
regiones separadas por una
frontera lineal en el espacio de
patrones de entrada, donde se
tendría un hiperplano.
Ejemplos: RNA
Estructura general de una red neuronal
de una sola capa oculta
http://ceres.ugr.es/~alumnos/esclas/
APLICACIÓN : Obtener un modelo que sea capaz de
predecir si los datos corresponden a señales sonar
aplicadas sobre roca o sobre cilindro metálico
Desarrollado por Rosenblatt (1957)
El perceptrón multicapas: una red neuronal artificial (RNA) formada por múltiples capas, esto le permite resolver problemas que no son linealmente
separables.
http://www.sav.us.es/formaciononline/asignaturas/asigpid/apartados/textos/recursos/redesneuronales/Image12.gif https://www.google.co.ve/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=QUE+ES+LA+CAPA+OCULTA+EN+UN+PERCEPTRON
APRENDIZAJE AUTOMÁTICO
LA MINERÍA DE DATOS TÉCNICAS
Ejemplos RNA:
Aplicación: Reconocimiento de minucias, esto es, puntos de interés en las huellas dactilares tales como terminaciones y bifurcaciones
.
.
.
.
.
.
Input Layer Output Layer
Hidden Layer(s) Capas Ocultas
Capas de entrada Capas de Salida
APRENDIZAJE AUTOMÁTICO
LA MINERÍA DE DATOS
Ejemplos de uso de la minería de datos:
Negocios: Empleo de modelos predictivos para contactar a los clientes.
Análisis de la cesta de la compra: Hábitos de compra en supermercados.
Patrones de fuga: detectar a aquellos clientes
que puedan estar pensando en rescindir sus contratos para
pasarse a la competencia.
https://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
APRENDIZAJE AUTOMÁTICO
LA MINERÍA DE DATOS
dVelox d
APARA
KXEN
KNIME
Neural Designer
OpenNN
Orange
Powerhouse
Quiterian
RapidMiner
R
SPSS Clementine
SAS Enterprise
Miner
STATISTICA
Data Miner
Weka
KEEL
Herramientas de software
Para el desarrollo de modelos de minería de datos tanto libres como comerciales como por ejemplo:
Marvin Minsky, «padre» de la inteligencia artificial. (1927-2016) † Falleció este domingo 24/01/2016
El científico, que dedicó su vida a que las máquinas utilicen el sentido común, ha
fallecido a los 88 años de una hemorragia cerebral.
Junto con John McCarthy, fundó en 1959 el laboratorio de inteligencia artificial del MIT, donde era profesor. Estudió Matemáticas en Harvard, se doctoró en Princeton y
es el inventor del primer simulador de red neuronal capaz de aprender.
Minsky trabajó para transformar los primeros computadores, que básicamente eran máquinas de calcular, en máquinas inteligentes capaces de imitar la mente humana
http://www.abc.es/ciencia/abci-muere-marvin-minsky-padre-inteligencia-artificial-201601260919_noticia.html
«Alcanzaremos la inmortalidad con copias de nuestro cerebro» 09-06-2014
Modelos El aprendizaje automático tiene como resultado un modelo para resolver una tarea
dada.
Modelos geométricos, construidos en el espacio de instancias y que pueden
tener una, dos o múltiples dimensiones. Si hay un borde de decisión linear entre
las clases, se dice que los datos son linealmente separables.
APRENDIZAJE AUTOMÁTICO
Aplicación: Reconocimiento
de formas
Modelos
Modelos probabilísticos, que intentan determinar la
distribución de probabilidades descriptora de la función que enlaza
a los valores de las características con valores determinados.
La estadística bayesiana se usa para desarrollar modelos
probabilísticos (La evidencia sobre el verdadero estado del mundo se
expresa en términos o grados de creencia.)
APRENDIZAJE AUTOMÁTICO
A
B
A B
La probabilidad es un método por el cual se obtiene la
frecuencia de un acontecimiento determinado mediante la
realización de un experimento aleatorio, del que se conocen
todos los resultados posibles..
https://es.wikipedia.org/wiki/Probabilidad
Thomas Bayes
Modelos
Modelos lógicos, que expresan las probabilidades en reglas organizadas en forma de árboles
de decisión.
APRENDIZAJE AUTOMÁTICO
Nodo de decisión
Alternativas de decisión
Nodo de azar
Ramas de Estado
Resultados
APRENDIZAJE AUTOMÁTICO
EL PROBLEMA DE APRENDIZAJE
En un problema de aprendizaje
automático es necesario identificar los
tres atributos siguientes:
1.- El tipo de tareas T a ser aprendidas
2.- La medida de desempeño D a ser
mejorada
3.- La fuente de donde derivar las
experiencias E
APRENDIZAJE AUTOMÁTICO
EL PROBLEMA DE APRENDIZAJE
Un programa de computador se dice que
aprende de una experiencia E con respecto
a algún tipo de tareas T, con cierta medida
de desempeño D, sí su respuesta a las
tareas en T mejora dada la experiencia E, de
acuerdo con la medición establecida en D
APRENDIZAJE AUTOMÁTICO
EL PROBLEMA DE APRENDIZAJE
Ejemplo de un problema de aprendizaje
Enseñar a un robot a conducir un vehículo:
TAREA T: Conducir un vehículo en una vía pública de cuatro canales utilizando
visión robótica.
MEDIDA de desempeño D: Promedio de distancia recorrida
antes de que un supervisor humano detecte un error.
EXPERIENCIA de entrenamiento E: Secuencia de imágenes
y comandos de control grabados durante la conducción de un vehículo por un
humano.
Un programa computacional es capaz de aprender a partir de la experiencia.
https://yoshibauco.wordpress.com/2011/04/01/aprendizaje-automatico/ http://pdm.com.co/tag/auto/
APRENDIZAJE AUTOMÁTICO
DISEÑO DE UN SISTEMA DE APRENDIZAJE
1.- LA EXPERIENCIA DE ENTRENAMIENTO Seleccionar el tipo de experiencia de entrenamiento que va a hacer que el
sistema aprenda. Ejemplo: Jugar ajedrez.
2.- LA FUNCIÓN OBJETIVO Determinar exactamente qué tipo de conocimiento será aprendido y cómo este
será utilizado por el programa de desempeño. Ejemplo: para un programa que aprende a jugar al ajedrez, la función objetivo, dada una posición del tablero, es
que otorgue un puntaje a cada posible jugada válida.
3.- REPRESENTACIÓN DE LA FUNCIÓN OBJETIVO Se escoge una representación que el programa de aprendizaje usará para
describir la función que deberá aproximar durante el entrenamiento (polinomial, lineal, no lineal).
4.- ALGORITMO DE APROXIMACIÓN A LA FUNCIÓN OBJETIVO
Para configurar la función objetivo, se requiere un conjunto de ejemplos para el entrenamiento (argumentos de entrada), a partir de estos se van estimando
los valores con la ayuda de un algoritmo de aprendizaje. http://ml.readthedocs.org/es/latest/intro.html
APRENDIZAJE AUTOMÁTICO
DISEÑO DE UN SISTEMA DE APRENDIZAJE
5.- Diseño Final: Puede ser descrito mediante cuatro programas modulares, que representan los componentes de los sistemas de aprendizaje automático:
Módulos del Sistema de Aprendizaje
http://ml.readthedocs.org/es/latest/intro.html
APRENDIZAJE AUTOMÁTICO
DISEÑO DE UN SISTEMA DE APRENDIZAJE
MÓDULOS DE APRENDIZAJE 1.- El SISTEMA DE DESEMPEÑO
Debe resolver la tarea usando la función aprendida (hipótesis). Va mejorando su desempeño a medida que se aproxima a la función objetivo. Toma como
entrada un nuevo problema y genera un histórico de los pasos para su solución.
2.- EL CRíTICO Este módulo genera un ejemplo de entrenamiento por cada paso registrado
en el histórico generado por el módulo anterior.
3.- EL GENERADOR Este módulo toma los ejemplos de entrenamiento generados por el módulo
anterior y estima una nueva hipótesis (V^). Este módulo implementa el algoritmo de aprendizaje.
4.- EL GENERADOR EXPERIMENTAL Toma como entrada la hipótesis actual (función aprendida V^) y genera un
nuevo problema para que explore el Sistema de Desempeño. Su rol es buscar
nuevos problemas que maximicen el aprendizaje del sistema como un todo.
http://ml.readthedocs.org/es/latest/intro.html
APRENDIZAJE AUTOMÁTICO
HERRAMIENTAS
Algunas Herramientas Disponibles
• En los últimos años la comunidad de investigadores se ha beneficiado
con la disponibilidad de numerosas herramientas tipo Open Source.
• Ofrecen implementaciones eficientes
de algoritmos de amplia aplicación.
APRENDIZAJE AUTOMÁTICO
HERRAMIENTAS DARWIN
El marco de trabajo de Darwin
ha sido desarrollado para lograr
las siguientes metas:
1.- Proporcionar una biblioteca
estable, robusta y eficiente de
aprendizaje automático para
los profesionales.
2.- Proporcionar la
infraestructura para que
estudiantes e investigadores
puedan experimentar y
extender los métodos del
estado del arte.
Dlib-ml
Es una biblioteca de
código abierto, dirigida
tanto para ingenieros
como para
investigadores
científicos. Su objetivo
es proporcionar un
ambiente adecuado para
el desarrollo de software
de aprendizaje de
máquina en lenguaje
C++.
APRENDIZAJE AUTOMÁTICO
HERRAMIENTAS
GPML-Toolbox
La Caja de herramientas GPML ofrece una amplia gama de funcionalidades para procesos Gaussianos
(GP) de inferencia y predicción.
Un proceso de Gauss es un proceso estocástico
que genera muestras en el tiempo de manera tal
que no afecte la finitud de una combinación
lineal que se tenga (o más generalmente
cualquier funcionallineal de la función de muestra),
combinación lineal que se distribuirá normalmente.
https://es.wikipedia.org/wiki/Proceso_de_Gauss
APRENDIZAJE AUTOMÁTICO - APLICACIONES
El aprendizaje automático o de máquina tiene una
amplia gama de aplicaciones que incluyen:
Motores de búsqueda: es un sistema informático que
busca archivos almacenados en servidores web gracias
a su «spider» (también llamado araña web)
Diagnóstico médico: procedimiento por el cual se
identifica una enfermedad,
síndrome o cualquier estado de salud.
Detección de fraudes con el uso de tarjetas de
crédito: se efectúa extrayendo data de las
transacciones pasadas.
Vehículos Autónomos: Proyectos de las empresas
Google y Tesla.
Análisis del mercado de valores: mercado de capitales
de los que operan alrededor del mundo en el que se
negocia la renta variable y la renta fija de una forma
estructurada.
Robótica: rama de la ingeniería mecánica, ingeniería
eléctrica, ingeniería electrónica y ciencias de la
computación que se ocupa del diseño, construcción,
operación, disposición estructural, manufactura y
aplicación de los robots.
Big Data o Datos masivos: es un concepto que hace
referencia a la acumulación de grandes cantidades de
datos y a los procedimientos usados para encontrar
patrones repetitivos dentro de esos datos.
APRENDIZAJE AUTOMÁTICO
APLICACIONES
APRENDIZAJE AUTOMÁTICO
TENDENCIAS
PASADO:
El uso adecuado de mecanismos de aprendizaje automático
requería el empleo de algoritmos hechos a la medida, y
buenas dosis de presupuestos dedicados a I.+D.
PRESENTE:
Por ejemplo: y
Ofrecen soluciones SaaS (Software as a Service), basadas
en pre-configuraciones de aprendizaje automático o de
máquina.
APRENDIZAJE AUTOMÁTICO
TENDENCIAS
IBM Watson: Es un servicio basado en Inteligencia
Artificial que aprende sobre determinados temas para
interactuar con los usuarios de las compañías.
Aprende de su experiencia.
Lee y entiende el leguaje natural de las personas.
Es capaz de responder a preguntas complejas en
pocos segundos.
Ante una pregunta, formula hipótesis y escoge la
respuesta en la que tiene un mayor nivel de confianza.
Muestra los pasos que ha dado para llegar a la
respuesta de una forma clara y sencilla.
IBM Watson es pionero de la Computación Cognitiva,
la cual se refiere a sistemas que aprenden a escala,
razonan con propósito e interactúan con humanos de
forma natural.
Thomas Watson - Fundador de IBM
APRENDIZAJE AUTOMÁTICO
TENDENCIAS
Azure Machine Learning, es un conjunto de algoritmos y herramientas basadas en la nube,
que permite a los científicos de datos desarrollar de manera más rápida y eficiente,
modelos de aprendizaje automático o de máquina.
Tutorial de aprendizaje automático Ejemplo:
Crear un modelo de regresión lineal que predecirá el precio de un automóvil en función de diferentes
especificaciones, como la marca y las especificaciones técnicas.
APRENDIZAJE AUTOMÁTICO
WATSON EN JEOPARDY
(Aprendizaje Automático/
Procesamiento del
Lenguaje Natural)
APRENDIZAJE AUTOMÁTICO
CONCLUSIÓN
El Aprendizaje Automático o de Máquina es
una disciplina en plena evolución, que
libera al Ingeniero del Conocimiento de
parte de la tarea de Adquisición de
Conocimientos que es la etapa más
laboriosa; además de transformar la interfaz
hombre-máquina, llevándola desde la
ejecución de comandos hasta el uso del
lenguaje natural.
APRENDIZAJE AUTOMÁTICO
REFERENCIAS BIBLIOGRÁFICAS
www.uv.es/hmr/tesis/PDF/Cap1.pdf
www.research.ibm.com/softwareIBMRresearch/multimedia/Comnputing_Cog
nition_WhitePaper.pdf
www.azure.microsoft.com/es-es/documentation/articles/machine-learning-
create-experiment/
www.wikipedia.com/mineriadedatos
www.es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico
www.abc.es/tecnologia/informatica-software/20150801/como-aprenden-maquinas-
2015080
www.computerworld.es/tendencias/el-aprendizaje-automatico-en-los-negocios
www.es.wikipedia.org/wiki/Aprendizaje_no_supervisado
www.es.wikipedia.org/wiki/Aprendizaje_supervisado