Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
/ 21
• Des données numériques partout en croissance prodigieuse
– Comment en extraire des connaissances
– Comment réaliser des systèmes pour aider à la décision
4IODAA – Informations générales
/ 21
Demain
• Nous vivrons dans un monde numérique entourés de systèmes qui traiteront l’information pour nous (et avec nous)
– Analysant cette information
– Extrayant des connaissances
– Échangeant des connaissances
– Inférant collectivement des connaissances
• Nous passerons d’un monde (numérique) fermé et précis … à un monde ouvert et imprécis et parfois incohérent
5IODAA – Informations générales
[ Conf. Invitée de Serge Abiteboul à CAP-2013 ]
/ 21
4 approches pour appréhender le monde
1. Empirique : description et classement
3. Simulation : systèmes complexes et/ou non reproductibles
ParisTech Review (19/12/2011) : « Prospects and Promise of Big Data »
4. Exploration de données• Énormes masses de données numérisées
• Largement disponibles
• Sources et formats très différents
2. Théorique : Modélisation, construction de théories
/ 21
Questions
• Comment extraire des connaissances de toutes les informations disponibles ?
• Comment décider ce qui est vrai / faux ?
• Comment décider ce qui est intéressant ?
• Comment gérer des flux massifs de données spatio-temporelles ?
• Comment garder le contrôle sur nos propres données et protéger notre vie
privée ?
• Comment faire collaborer des milliards de systèmes de connaissances ?
7IODAA – Informations générales
[ Conf. Invitée de Serge Abiteboul à CAP-2013 ]
/ 21
Vous …
• … avez été formés
– Acquisition de nombreuses connaissances (sciences du vivant et de l’environnement)
– Méthodes de modélisation (outils mathématiques)
• Connaissances de base en programmation et bases de données
– Limitées
– Mais nous ne cherchons pas à faire de vous des programmeurs ou informaticiens
• Vous rendre compétent
– dans les méthodes et techniques d’extraction d’information dans l’univers numérique
– capacité à dialoguer avec les informaticiens et à diriger un projet utilisant la fouille de données dans l’univers numérique
/ 21
Fouille de données et aide à la décision
Articles scientifiques
Documents (html, …)
Bases de Données
Données de capteurs(smartphones, senseurs, ..)
Mesures sur les réseaux
• Question en vue d’une décision
• Analyse exploratoire : quelles régularités ?
• Hypothèse : confirmation / infirmation
PrétraitementsFormatagesFusion
Fouille de donnéesApprentissage ArtificielAnalyses statistiques
AnalyseConstruction de modèles
ClassificationPrédictionDescriptionThéorie
Expert(s)
Données nettoyées et formatées
MotifsRégularités
/ 21
Organisation de la formation
• 4 blocs dont 3 projets « fil rouge » + 1 stage
Le travail collaboratif et interdisciplinaire
100 h
Modélisation pour l’aide à la décision
100 hFouille de données avancée
140 h
Socle en informatique 145 h
/ 21
Les grands blocs d’enseignement
1. Information et données
1.1 Données : introduction et formalisme XML
1.2 Bases de données et entrepôts de données
1.3 Web sémantique : introduction
1.4 Web sémantique : approfondissements
2. Algorithmique et programmation
2.1 Algorithmique
2.2 Programmation
3. Intelligence Artificielle : les bases
3.1 Logique et raisonnement
3.2 Résolution de problèmes et décisions
3.3 Apprentissage artificiel et fouille de données
3.4 Intelligence Artificielle Distribuée
4. Intelligence artificielle : approfondissements
4.1 Apprentissage artificiel et fouille de données : approfondissements
4.2 Intelligence Artificielle Distribuée : approfondissements
5. Formation humaine
5.1 Projet professionnel
5.2 Anglais
13IODAA – Informations générales
+ Des projets « fil rouge »
• Algorithmique et programmation
• Apprentissage artificiel et fouille de données
• Web sémantique
+ Des conférences
Acteurs du monde économique
+ Des exposés entre vous
Sur la décision, ses facteurs, les biais et les méthodes
/ 21
UE communes avec le Master ISI
• Volume : Environ 132h
• Lieu : Essentiellement à Dauphine
– Contact administratif : Valérie Lamauve ([email protected])
– Contact pédagogique : Antoine Cornuéjols (co-responsable du Master)
• Contrôle des connaissances et validation
– UE 3.3, 3.4, 4.1, 4.2 … : Dauphine
– Validation d’une UE et du stage : note ≥ 10
14IODAA – Informations générales
/ 21
Obtention du diplôme IODAA
• UEs organisées par AgroParisTech
– UEs : Compensation possible entre les UEs d’un même bloc (note ≥ 10)
– Stage : règlement de AgroParisTech(voir document)
• UEs organisées par Dauphine
– UEs 3.3, 3.4, 4.1, 4.2 …
– Validation d’une UE : note ≥ 10
15IODAA – Informations générales
/ 21
Obtention du double diplôme IODAA + M2 ISI
• UEs organisées par AgroParisTech
– Prise en compte des notes des UEs 1.1, 1.2, 3.1 et 3.2
• UEs organisées par Dauphine
– UE 3.3, 3.4, 4.1, 4.2 …
– Validation d’une UE : note ≥ 10
– Stage
• Sujet à valider par enseignants du M2 ISI
• Jury du M2 ISI
• Note ≥ 10
16IODAA – Informations générales
/ 21
Secteurs d’activités
• Les grands groupes (Danone, EDF, SAS, …)
• Les PME avec activité d’innovation
• Les grands laboratoires
– Publics (INRA, CNRS, INRIA, Universités, Grandes Écoles, …)
– Privés (EDF, Orange Labs, Xerox, …)
• Les développeurs de solutions informatiques
• …
18IODAA – Informations générales
/ 21
Métiers visés
– Grosses entreprises : marketing, prospective, gestion client (EDF, Peugeot, Air France, Danone, Nestlé, L'OREAL, Carrefour, Suez-Lyonnaise des Eaux, AGF, ...)
• Spécialistes de Customer Relationship Management(CRM), …
– Organismes internationaux d'étude d'évolution de l'environnement, ... (GIEC, ONU, ...) ; Directions Départementales (Equipement, Agriculture, ...)
• Gestion de données, aide à la décision, veille technologique
– Recherche et Enseignement (INRA, INRIA, CNRS, Laboratoires et universités)
– Entreprises d’édition spécialisées dans l’informatique décisionnelle (SAS, Oracle, A2IA, ...)
• Développeurs spécialisés, chefs de projet, managers
– SSII et cabinets d’audit spécialisés dans l’informatique décisionnelle• Chefs de projet, chargés d'études "data manager", consultants
http://www.decideo.fr/ (forum spécialisé)
/ 21
Le stage
• Période : 1er mars – 30 août
• Nature du sujet / travail
– IODAA : travail d’ingénieur• Prise en charge d’un projet conséquent (pas multitude de missions)• Une certaine autonomie de décision• Réalisation en partie informatique
– IODAA + M2 ISI• Travail de recherche et développement
– demander une solution innovante, c'est-à-dire qui ne soit pas la simple application de recettes connues.
– avoir une phase d'analyse du problème puisqu'il n'a pas de solution déjà bien connue
– prendre en compte de l'état de l'art sur le même type de problèmes pour comprendre les grands principes des solutions développées ailleurs dans des contextes différents mais similaires
– développer la méthode finalement retenue
– la tester de manière systématique
– chercher en conclusion à montrer en quoi la solution développée est généralisable, et sous quelles conditions, à d'autres problèmes similaires
20IODAA – Informations générales
/ 21
Conclusion
• Une formation transversale
– Utile dans tous les secteurs d’activité
– Complémentaire de votre parcours jusque là
• Extrêmement recherchée
– Énormément de projets passionnants
– Carrières diversifiées
21IODAA – Informations générales
/ 21
Sujets de stage
• EADS (Toulouse) recherche un(e) stagiaire pour une durée de 5 ou 6 mois
• .Vous serez au sein de l'équipe Intelligent and semantic systems du centre commun de recherche d'EADS (EADS Innovation works).Les compétences de cette équipe pluridisciplinaire et transnationale sont liées à l'intelligence artificielle, la fouille de données, la gestion des connaissances, les technologies issues du web sémantique, le traitement de l'information, du langage naturel, les méthodes d'innovation et enfin la modélisation des interactions homme-machines.
• Les finalités de l'équipe sont le développement :- d’applications intelligentes pour la maintenance utilisant destechniques d'apprentissage,- de méthodes avancées pour favoriser l'innovation, l'aide à la décision et l'optimisation pendant les phases de conception,- de méthodes et d'outils permettant la découverte, la capture, le partage et la recherche d'information et de connaissances,- de méthodes de modélisation et de simulation des systèmes complexes avec un axe particulier sur la modélisation et la simulation des interfaces hommes machines.
• Cette offre de stage est à pourvoir à compter du 3 janvier 2012 (sujette à une certaine flexibilité).
• Tâches & Activités Vous aurez, comme mission principale le développement de méthodes permettant la découverte, la capture, le partage et la recherche d'information et de connaissances.
• Vos compétences Vous êtes en dernière année d’école d’ingénieur, en master ou université (5ème année) et êtes spécialisé(e) en informatique.Vous avez des connaissances en :- système d’information,- traitement du langage naturel,- web sémantique,-ontologies.
• Vous savez travailler en équipe et avez d’excellentes qualités relationnelles.
• Anglais : niveau intermédiaire.
/ 21
Stages et embauches
• Stage ingénieur data mining, évolutif vers CDI (h/f)
• Ubiflow - apporteur d'audience - propose des solutions innovantes de diffusion d'annonces sur internet. Nous avons pour mission d’organiser la transparence d’univers professionnels en facilitant la transmission d’informations (annonces) des vendeurs aux consommateurs.Grâce à notre plate-forme, nous proposons une mise à jour automatique quotidienne des flux d’informations : petites annonces, catalogue produits, promotions… quels que soient le nombre et la complexité.
• Dans le cadre de notre développement, nous recherchons un ingénieur stagiaire pour choisir, configurer et intégrer un outil de data mining.
• Sujet de stage : data mining Ubiflow accumule depuis un dizaine d'année quantité d'informations sur les annonces, sur ses clients, sur son marché, sur la concurrence, mais également sur ses projets, son activité... De plus, nous souhaitons disposer d'indicateurs fiables de notre activité, en se basant sur nos données centralisées, afin de prendre les décisions avec un bon niveau de visibilité. Le stage consiste en l'élaboration d'un cahier des charges, la recherche de l'outil adapté, la rédaction de spécifications fonctionnelles et techniques, l'installation, l'intégration, la configuration, le développement d'adaptations, le test, la recette et la mise en production de la solution.