View
34
Download
0
Category
Tags:
Preview:
DESCRIPTION
IFT 703 Informatique cognitive Introduction. André Mayers Automne 2010. Plan. Description du plan de cours Introduction à l’informatique cognitive Intelligence artificielle Psychologie cognitive Neuropsychologie - PowerPoint PPT Presentation
Citation preview
IFT 703Informatique cognitive
Introduction
André Mayers Automne 2010
Plan
Description du plan de cours Introduction à l’informatique cognitive
◦ Intelligence artificielle◦ Psychologie cognitive◦ Neuropsychologie
Introduction aux architectures cognitives◦ Historique
2
Sciences cognitives
Les sciences cognitives ont pour objet l’étude des systèmes intelligents dans leurs aspects représentationnels et computationnels.
Les systèmes intelligents sont des systèmes complexes de traitement de l'information capable d'acquérir, conserver, utiliser et transmettre des connaissances.
Les sciences cognitives s’intéressent◦ à la théorie abstraite des processus intelligents,◦ à l’intelligence des machines artificielles,◦ à l’étude de l’intelligence humaine et animale.
Les sciences cognitives étudient les phénomènes suivant◦ la perception, l’attention, le langage, les mécanismes de
résolution de problèmes (conception, planification…)
3
4
Les disciplines des sciences cognitives
Philosophie
Linguistique
Anthropologie
Neurosciences
Informatique
Psychologie
5
Informatique cognitive Discipline des sciences cognitives But de l’informatique cognitive :
◦ Concevoir des modèles computationnels des processus cognitifs Architecture cognitive
◦ Modèle complet de la cognition humaine Intégration de modèle computationnel de l’usager dans les
systèmes homme-machine◦ Systèmes tutoriels intelligents◦ Habitats intelligents◦ Contrôle de systèmes complexes
Centrales nucléaires ou électriques
6
Intelligence artificielle Résoudre des problèmes pour lequel il n’existe pas
d’algorithmes dédiés connus◦ Fouille dans un espace d’état
Symbolique Forage de donnée, réseau de neurones, algorithme génétique
Deux approches◦ Intelligence générale◦ Simulation de l’intelligence naturelle ou humaine
7
Psychologie Le behaviorisme considère les processus cognitifs comme
une boîte noire et essaie de prédire le comportement (sortie de la boîte noire) en fonction des stimuli (entrée de la boîte noire).
La psychologie cognitive essaie de prédire le comportement en fonction des stimuli et d’hypothèses sur la boîte noire et ses processus◦ L’individu a un état interne qui influence son comportement◦ La méthode scientifique aide à choisir l’hypothèse la plus
plausible Les liens entre un concept théorique et les expériences le mettant en
valeur peuvent être complexes (entre une particule atomique et sa trace sur une photographie).
◦ Les processus cognitifs doivent être plausibles compte tenu des connaissances que nous avons sur le cerveau
8
Psychologie cognitive Étude de la pensée et de ses mécanismes pris dans un sens
large. ◦ la perception◦ la résolution de problèmes ◦ la mémoire◦ les fonctions exécutives
attention planification prise de décision …
4 approches ◦ Traitement de l’information
utilisation de symboles et d’abstraction ◦ Basé sur la biologie
voir aussi neuropsychologie◦ Basé sur les processus de l’évolution◦ Une combinaison des trois précédentes
9
9Approche traitement de l’information
Modèle modale◦ Atkinson & Shiffrin (1968)
◦ Information encodée sous sa forme perceptuelle dans la mémoire sensorielle
◦Information est transmise dans la mémoire à court terme (MCT) Capacité limitée et dégradation rapide de l’information
◦ Information est ensuite transmise avec une certaine probalité dans la mémoire à long teme (MLT) Capacité infinie et dégradation lente
Approche traitement de l’information
Module exécutif central : sélectionne et manipule le contenu des modules esclaves
Boucle phonologique : ◦ tampon à court terme : encode l’information sous sa forme verbale ◦ boucle articulatoire : processus de rafraichissement de l’information
Tablette Visuo-spatiale Visuo-spatial sketchpad: encode sous l’information sous sa forme spatiale ou visuelle
10
Modèle de la mémoire de travail
Baddeley et Hitch’s (1974)
11
Neuropsychologie La neuropsychologie est une discipline scientifique et
clinique qui étudie les fonctions mentales supérieures dans leurs rapports avec les structures cérébrales au moyen d'observations menées auprès de patients présentant des lésions cérébrales accidentelles, congénitales ou chirurgicales.
Son objectif est la compréhension du système cognitif normal et anormal par le biais de l'étude de ses dysfonctionnements.
12
ARCHITECTURE COGNITIVE
13
Architecture cognitive Architecture informatique
◦ ensemble de structures fixes permettant à un système d’être programmé
Architecture cognitive◦ ensemble de structure fixe qui explique l’ensemble des
processus cognitifs indépendance de la tâche modéliser
◦ une théorie générale de la cognition, ◦ intègre plusieurs théories spécifiques
perception, attention, mémoire …◦ une explicitation de la boîte noire
14
Architecture cognitive computationnelle Une architecture cognitivive pouvant servir de devis pour
concevoir un programme Un modèle informatique d’une architecture cognitive
◦ de simuler avec un ordinateur des comportements complexes◦ de générer des hypothèses qui pourront être validés
expérimentalement
15
Caractéristiques des architectures cognitives Degré de dépendance par rapport à un domaine.
◦ généralisation possible Degré de spécification
◦ sa distance d’un modèle computationnel Étendue des fonctions cognitives modéliser explicitement
◦ attention, mémoire, processus subsymboliques Adéquation aux résultats expérimentaux
Architecture cognitive : définition “The fixed (or slowly varying) structure that forms the
framework for the immediate processes of cognitive performance and learning” ◦ Newell, 1990, p. 111
“The functional architecture includes the basic operations provided by the biological substrate, say, for storing and retrieving symbols, comparing them, treating them differently” ◦ Pylyshyn, 1984, p. 30
“ A specification of the structure of the brain at a level of abstraction that explains how it achieves the function of the mind” ◦ Anderson, 2007, p. 7
La notion d’architecture cognitive permet de ne pas s’enfarger ◦ dans la complexité du cerveau humain (1012 cellules) en faisant
abstraction du but des structures du cerveau◦ dans la multiplicité des explications du comportement humain en
faisant abstraction du cerveau qui doit les produire16
17
Les niveaux d’une architecture cognitive (Newell)
Tout dans la nature peut être décrit à différents niveaux◦La matière peut être décrit au niveau subatomique,
atomique, moléculaire, nano, …il en est de même pour les architectures cognitives
Un niveau dans une architecture consiste ◦en un medium qui est manipulé◦des composantes qui permet les opérations de base◦des lois de composition qui permet d’assembler les
composantes ◦du système formé à l’aide des lois de composition◦des lois comportementales qui décrit le comportement du
système les lois comportementales découlent du comportement de ses
composantes et de la façon dont elles sont assemblées.
18
Les niveaux de traitement
Le niveau du milieu est l’architecture qui manipule le contenu du niveau supérieur et est en même temps le contenu manipulé par le niveau du bas.
Une architecture offre des outils pour manipuler le contenu, p. ex. un traitement de texte offre des outils pour manipuler du texte.
19
Description d’un niveau
Un niveau peut être décrit de deux façons ◦ autonome
Un programmeur n’a pas besoin de connaître le niveau de la logique des circuits
Un concepteur de circuits logiques n’a pas besoin de connaître les lois régissant le magnétisme ou le courant électrique
◦ par réduction au niveau précédent On explique les circuits logiques en terme des circuits
électriques
20
Description autonome du niveau connaissance d’un agent
La principale caractéristique du niveau connaissance est que son comportement est uniquement déterminé par ses connaissances et non par sa structure ou ses composantes.
Un agent au sens de l’intelligence artificielle possède ◦ des connaissances et des buts◦ des composantes pour percevoir et agir dans son environnement
Le principe de rationalité ◦ Si un agent a la connaissance qu’une de ses actions lui
permettra d’atteindre un de ses buts alors il choisit cette action
Que pensez d’un thermostat ?
Médium connaissanceComposantes sans importance selon Newell Lois de composition sans importance selon NewellSystème agent au sens AILois comportementale le principe de rationalité
La description du niveau connaissance avec le niveau sous-jacent
21
Attribut \ Niveau Connaissance Symbolique
Médium Connaissance Structure symbolique, Attributs subsymboliques
Composantes N. A.Sous-systèmes symboliques, de perception et moteur
Lois de composition N. A.
Échange de structures symboliques entre les sous-systèmes
Système Agent intelligent
Système symbolique complet (architecture cognitive)
Lois comportementales
Principe de rationalité
Processus symbolique (Modèle mathématique des traitements de symboles)
22
Les niveaux d’architecture pour un agent intelligent informatisé
Connaissance◦le médium est constitué des
connaissancesProgramme
◦le médium sont les symboles Registre,
◦le médium est le vecteur de bits◦les actions sont les transferts entre
les registres ou la mémoireCircuit logique
◦le medium est le bitCircuit électrique
◦le médium est le courant électriqueMatériel
◦le médium est l’électron avec toutes ses propriétés
23
Le niveau intelligence d’une architecture cognitive
Comme au niveau intelligence, les composantes et la structure ne sont pas importantes alors une description autonome du niveau intelligence d’une architecture cognitive est la description de la « logique » de ses comportements en fonction de son environnement. ◦Pas très réjouissant comme constatation pour des informaticiens
La solution est de le décrire en le réduisant au niveau précédent, i.e. au niveau d’un système de symbole ou programme. ◦Tous les programmes ou systèmes de symboles ne sont pas des agents
intelligents, ils doivent respecter le principe de rationalité. Il ne faut pas non plus s’enfarger dans les détails du programme et
l’idéal est de créer une abstraction au niveau symbolique ainsi que le modèle mathématique décrivant les manipulations symboliques. ◦C’est à ce niveau d’abstraction que nous décrirons les architectures
cognitives comme ACT-R et SOAR Nous décrirons les modules de ACT-R et l’espace problème de SOAR
◦C’est aussi à ce niveau que vous devrez décrire les architectures dans vos travaux et présentations
La description du niveau connaissance avec le niveau sous-jacent (bis)
24
Attribut \ Niveau Connaissance Symbolique
Médium Connaissance Structure symbolique, Attributs subsymboliques
Composantes N. A.Sous-systèmes symboliques, de perception et moteur
Lois de composition N. A.
Échange de structures symboliques entre les sous-systèmes
Système Agent intelligent
Système symbolique complet (architecture cognitive)
Lois comportementales
Principe de rationalité
Processus symbolique (Modèle mathématique des traitements de symboles)
25
Comment la cognition est-elle possible dans l’univers physique ?
Comment expliquer les fonctions mentales à partir du cerveau ?◦ Comment expliquer une maison à un extraterrestre ?
C’est certain qu’il faut décrire l’architecture d’une maison, mais est-ce suffisant ?
Il faut aussi expliquer pourquoi l’architecture est ce qu’elle est pour répondre aux besoins humains
Ce sont les contraintes (humain, économique… ) du marché qui font que les maisons ont la forme qu’elles ont actuellement.
Ce sont les contraintes de l’évolution (survie, biologie) qui font que nous avons notre cerveau actuel et ses fonctions cognitions cognitives
◦ Une architecture cognitive permet d’expliquer la fonction cognitive à partir du cerveau. ce n’est pas toujours le cas
26
3 alternatives pour expliquer la cognition Une architecture qui ne tient pas compte du cerveau
◦ Le paradigme classique du traitement de l’information
Une architecture qui ne tient pas compte de la fonction cognitive ◦ Le paradigme du connexionnisme sans l’esprit
Un paradigme qui fait abstraction de l’architecture ◦ L’analyse rationnelle de la fonction cognitive i.e. la fonction
cognitive est le résultat d’une adaptation à l’environnement.
Alternative 1 pour expliquer la cognition Le traitement de l’information classique
◦ le paradigme “information processing” classique de la psychologie
◦ présente des théories validées par des expérimentations expliquant la fonction cognitive voir la théorie de Sternberg pour expliquer si un nombre fait partie
d’une liste dans la WM sa théorie ne tenait pas compte de la vitesse à laquelle un neurone
peut être excitée◦ ignorer le cerveau, c’est comme concevoir une maison sans tenir
compte des contraintes des matériaux pour la construire
27
Alternative I1 pour expliquer la cognition Le connexionnisme sans l’esprit
◦ Une description exacte et fonctionnelle du cerveau◦ C’est comme expliquer une maison à un extraterrestre sans tenir
compte des fonctions de ses parties pour un être humain. ◦ La cognition est un effet de bord du cerveau
Construire une maison avec des briques, du bois… sans contraintes et constater à la fin que l’être humain puisse y vivre
◦ C’est comme expliquer le fonctionnement d’un ordinateur sans expliquer l’intention en arrière de chaque structure
◦ C’est comme expliquer la physiologie en terme d’interactions entre les cellules du corps en faisant abstraction des fonctionnalités des organes.
◦ Rumelhart and McClelland (1986) ont conçu un réseau de neurones qui apprenait les participes passés comme un enfant en faisant par exemple les erreurs de surgénéralisation classique du début de l’apprentissage (runned au lieu de ran).
◦ Ignorer l’esprit, c’est considéré que ce réseau de neurones a été premièrement construit et constater ensuite qu’il fait les participes passés
28
29
Alternative III pour expliquer la cognition L’analyse rationnelle de la fonction cognitive en faisant
abstraction de l’architecture. ◦ Une des contraintes imposées à la façon dont le cerveau permet
la cognition est que les deux sont le résultat d’une évolution dans un environnement réel Le raccourci est de se concentrer sur l’adaptation de la cognition à
l’environnement en faisant abstraction de l’architecture qui doit supporter les fonctions cognitives
◦ C’est un courant très actif actuellement et toutes les variantes sont basées sur l’approche bayésienne Il ne s’agit pas d’expliquer comment les calculs bayésiens sont
exécutés mais tout simplement, sachant qu’il y a adaptation l’environnement, d’élaborer une théorie prédisant le comportement cognitif en conséquence.
L’approche bayésienne de la cognition
1. L’évolution fait en sorte que nos capacités sont fonction de la probabilité qu’un évènement survienne a priori
◦ Pr(pluie), Pr(cumulonimbus)…2. Nous sommes en mesure de connaître les situations dans
lesquelles certains événements se produisent ◦ Pr(cumulonimbus | pluie)
3. Connaissant les probabilités conditionnelles et les probabilité a priori, nous pouvons connaître la probabilité a posteriori que nous sommes dans tel situation étant donné qu’un tel événement est survenu ◦ Pr(pluie | cumulonimbus) = Pr(cumulonimbus| pluie) * Pr(pluie)
Pr(cumulonimbus).
4. Basé sur l’information précédente, i.e. les probabilités a posteriori des situations actuelles, il s’agit de choisir l’action qui maximise l’atteinte des besoins de l’individu◦ se mettre à l’abri si la situation la plus probable est qu’il pleuve
30
31
Architecture cognitive Architecture informatique
◦ ensemble de structures fixes permettant à un système d’être programmé
Architecture cognitive◦ ensemble de structure fixe qui explique l’ensemble des
processus cognitifs indépendance de la tâche modéliser
◦ une théorie générale de la cognition, ◦ intègre plusieurs théories spécifiques
perception, attention, mémoire …◦ une explicitation de la boîte noire
32
Architecture cognitive computationnelle Une architecture cognitivive pouvant servir de devis pour
concevoir un programme Un modèle informatique d’une architecture cognitive
◦ de simuler avec un ordinateur des comportements complexes◦ de générer des hypothèses qui pourront être validés
expérimentalement
33
Caractéristiques des architectures cognitives Degré de dépendance par rapport à un domaine.
◦ généralisation possible Degré de spécification
◦ sa distance d’un modèle computationnel Étendue des fonctions cognitives modéliser explicitement
◦ attention, mémoire, processus subsymboliques Adéquation aux résultats expérimentaux
34
Architecture cognitive : les débuts 1957
◦ General Problem Solver Herbert Simon et Allen Newell généralise Logic Theorist un résolveur de problème universel espace problème (problem space)
résoudre un problème consiste à explorer et construire un graphe à partir d’un état initial pour trouver un état final.
méthode faible (weak method) méthode de résolution pouvant être appliquée à plusieurs domaines comme
l’analyse moyens-fins (means-ends analysis, hill-climbing … manipule des structures symboliques
logique, géométrie, jeux d'échecs
35
1973 human associative memory
◦ John Robert Anderson
36
Représentation des propositions
37
1980 validation expérimentale (protocole verbal)
◦ K. Anders Ericsson et Herbert Simon◦ 2 systèmes sont faiblements équivalents s’ils représentents la
même fonction et fortement équivalents si c’est le même algorithme
38
Les architectures à base de systèmes de production
1943◦ Les systèmes de production sont apparus sous forme théorique
1972 ◦ implantation de systèmes de production◦ Human problem solving de Newell
39
Évolution des architectures basés sur les systèmes de production
40
1983 ACT*
◦ Connaissance sémantique (déclarative) Réseau sémantique
Activation de base + activation provenant du contexte Dispersion de l’activation
Pas de distinction entre MCT et MLT, les éléments de la MCT sont les éléments actifs (perception ou actifs) ??
◦ Connaissances procédurales Système de production
Force d’une production
41
ACT* 1983
ACT* : dispersion de l’activation
L’activation part des objets (unit) actuellement actifs et via ses attributs (element) se propage à d’autres objets dans la mémoire à long terme.
42
43
1983 SOAR 1 (State, Operator And Result)
◦ John Laird, Allen Newell, et Paul Rosenbloom◦ Expliquer le comportement intelligent en proposant l’architecture
de base de tout système intelligent◦ Mécanisme sophistiqué d’apprentissage de nouvelles
connaissances ◦ Initialement peu de fondement psychologique à l’architecture
Possible de produire des comportements plausibles et non plausibles Difficile de modéliser les connaissances sémantiques et épisodiques
avec l’architecture SOAR Attention les règles de production ne sont pas des connaissances
procédurales Il ajoutent des préférences dans la mémoire de travail et complète l’information
qui est déjà dans la mémoire de travail mais cette mémoire de travail n’a aucun rapport avec sa partie correspondante en psychologie
Soar : 1983
44
1983 : Model Human Processor (MHP)
45
1983 : CPM-GOMS
Cognitive, Perceptual, Motor GOMSGoals, Operators, Methods and Selection rules46
47
Calcul du temps nécessaire pour percevoir un objet avec GOM/CPM
1996 : EPIC
48
49
Description d’un ordinateur à deux niveaux
Aspects Register-Transfer Level
Symbol Level
Medium Bit Vectors Symbols, expressions
Components Registers Functional Units
Memories Operations
Composition Laws Transfer Path Designation, association
Systems Digital Systems Computers
Behavior Laws Logical Operations Sequential interpretation
Recommended