4
DATA SCIENTIST Certificat d’Études Spécialisées Maîtriser les techniques de gestion et d’analyse des grandes masses de données Acquérir les compétences permettant d’analyser des données complexes (texte, images, graphes) Comprendre les principes et algorithmes du machine-learning Appréhender les technologies de stockage et de calcul distribués

Data scientist (CES, Certificat d'Études Spécialisées)

Embed Size (px)

DESCRIPTION

Une formation qualifiante de haut niveau pour : - Maîtriser les techniques de gestion et d’analyse des grandes masses de données - Acquérir les compétences permettant d’analyser des données complexes (texte, images, graphes) - Comprendre les principes et algorithmes du machine-learning - Appréhender les technologies de stockage et de calcul distribués

Citation preview

Page 1: Data scientist (CES, Certificat d'Études Spécialisées)

DATA SCIENTISTCertificat d’Études Spécialisées

› Maîtriser les techniques de gestion et d’analyse des grandes masses de données

› Acquérir les compétences permettant d’analyser des données complexes (texte, images, graphes)

› Comprendre les principes et algorithmes du machine-learning

› Appréhender les technologies de stockage et de calcul distribués

Page 2: Data scientist (CES, Certificat d'Études Spécialisées)

Au-delà de l’effervescence médiatique suscitée par l’évocation du terme « Big Data », nous sommes indéniablement entrés dans une nouvelle ère, un âge où l’impact technologique, social et économique des « données » est sans précédent. L’ubi-quité des capteurs, les portails internet, les réseaux de téléphonie mobile, la vidéo surveillance ou le développement des techniques d’imagerie médicale ne sont que quelques unes des sources des données massives que l’on est amené à traiter aujourd’hui. Les outils technologiques modernes tels que les plateformes permettant l’analyse en temps réel de données peu structurées ou les services de stockage de type « cloud », l’engouement pour les réseaux sociaux ou encore l’essor de l’Open Data ont, entre autres, créé les conditions d’une véritable mutation, affectant presque tous les secteurs de l’activité humaine (sciences, médecine, défense, commerce, communication). La grande complexité des données disponibles aujourd’hui et la nécessité d’automatiser le traitement en vue de satisfaire aux contraintes du temps réel, ont conduit à l’essor du machine-learning, la discipline à l’interface des mathématiques appli-quées et de l’informatique. Elle vise à produire des algorithmes permettant d’apprendre automatiquement des données, les représentations ou les modèles les plus performants. Avec la mise au point d’algorithmes très efficaces dès le début des années 90, l’intégration des contraintes computationnelles et le succès de logiciels fondés sur ce type d’approche (pour la reconnaissance vocale par exemple), le machine-learning a progressivement remplacé la statistique traditionnelle dans de nombreux domaines. La formation "Data Scientist" proposée par Télécom ParisTech permet d’articuler des compétences en mathématiques et en informatique afin d’appréhender la chaîne de traitement des données dans sa globalité : de l’acquisition des données à la solution analytique, en passant par les étapes de stockage et de représentation.

Ingénieurs, chefs de projet avec de bonnes connaissances en mathématiques (optimisation, probabilités/statistique, algèbre linéaire) et une bonne expérience de la programmation (java) devant :› Développer leurs compétences dans le domaine de la gestion des données› Enrichir leurs compétences dans le domaine de l’analyse statistique des données massives› Acquérir la maîtrise des technologies et des algorithmes permettant d’exploiter les Big Data

Présentation générale de la formation

Participants concernés et objectifs visés

Responsables pédagogiquesStéphan Clémençon :

enseignant-chercheur au département « Traitement du Signal et des Images » de Télécom ParisTech

Pierre Senellart : enseignant-chercheur au département « Informatique et Réseaux » de Télécom ParisTech

Les atouts de notre formation › Une formation en forte adéquation avec les besoins des entreprises, validée par un comité de veille et assurée

par des experts reconnus du domaine

› Une synergie entre le monde académique, scientifique et le monde industriel

› Des projets sur des thématiques opérationnelles et des travaux de réflexion en groupe

› Des témoignages, retours d’expérience et cas d’usages délivrés par des professionnels

Page 3: Data scientist (CES, Certificat d'Études Spécialisées)

› Enseignements académiques› Acquisition de savoir-faire au travers de retours d’expérience, études de cas

et mises en situation professionnelle› Travail en groupe sur des cas opérationnels› Projet personnel d’application se concrétisant par la rédaction et la soute-

nance d’un mémoire professionnel La formation se déroule sur une période de 10 mois et est organisée pour per-mettre la poursuite de l’activité professionnelle

› Contrôle des acquis et des savoir-faire à travers des travaux individuels et en groupe

› Un projet de type « fil rouge » qui joue un rôle fédérateur tout en illustrant la théorie par des cas pratiques

Le Certificat d’Etudes Spécialisées « Data Scientist » de Télécom ParisTech est délivré après une évaluation d’un projet individuel et une soutenance devant jury.

Démarche pédagogique

Evaluation et Certification

Programme› Introduction à l’apprentissage statistique. Nomenclature des pro-

blèmes, exemples et applications, prise en main de Python, premiers algorithmes

› Données structurées et numériques

› Données textuelles/web

› Données multimédia

› Apprentissage supervisé (classification/régression), théorie (Vapnik) et algorithmes (arbres, SVM, boosting, forêts aléatoires, lasso)

› Techniques avancées pour l’apprentissage (ranking, on-line, renforce-ment, optimisation distribuée)

› Apprentissage non supervisé (clustering, modèles à variables latentes, détection de nouveautés/anomalies)

› HMM (Modèle de Markov Caché), modèles graphiques, réseaux baye-siens/markoviens

› Visualisation de données massives

› Stockage distribué

› Calcul distribué

› Machine-learning distribué, graph-mining (analyse des réseaux sociaux)

Page 4: Data scientist (CES, Certificat d'Études Spécialisées)

INfoS PRATIqueS

Modalités d’inscription- Dossier d’inscription à télécharger sur www.telecom-paristech.fr/ces-data-scientist- entretien individuel

Renseignements et inscriptionsCévanne Haicault : 01 45 81 81 66Mail : [email protected]

Durée et lieu- 24 jours- Début du cycle : Nous consulter- Locaux de Télécom ParisTech à Paris

Tarif10 600 E nets de taxes

Financementeligible au titre du DIf et de la période de professionnalisationDans le cadre du plan de formation de l’entrepriseDans le cadre du Congé Individuel de formation (CIf)

www.telecom-paristech.fr

37/39 rue Dareau, 75014 Paris Fax : 01 45 81 71 23