18
Data Science Usage & intérêt by GILLES Armand - Data Scientist @arm_gilles

DataScience_usage_interet_wagon_bordeaux

Embed Size (px)

Citation preview

Page 1: DataScience_usage_interet_wagon_bordeaux

Data ScienceUsage & intérêt

by

GILLES Armand - Data Scientist

@arm_gilles

Page 2: DataScience_usage_interet_wagon_bordeaux

@arm_gilles

Expériences :

• Consultant Business Intelligence

• Start-up

• Vin Data Driven / Consulting

Extra :

• Co-organisation Meetup Machine

Learning / Python sur Bordeaux

• Paris Summer Innovation Fellow 2016

• DataForGood x Bayes Impact 2016

Page 3: DataScience_usage_interet_wagon_bordeaux

Data Scientist ?

« Data Scientist: The Sexiest Job of

the 21st Century »10/2012

« ces rock-stars du numérique

que l'on s’arrache »06/2016

« Le Data Scientist, nouveau roi

du monde »01/2017

Page 4: DataScience_usage_interet_wagon_bordeaux

CompétencesMathématique

- Statistiques

- Machine Learning

- Tests et hypothèses

- Optimisations

Developpement

- Bases de données

- Scripts (Python / R)

- API, scrapping

- Mise en production

- Data Viz

- Story telling

Communication

- Decision making

- Conduire une réunion strat

Curiosité

- Business

- Sherlock de la Data

- Hacker spirits

- Résolution de problèmes

Page 5: DataScience_usage_interet_wagon_bordeaux

Big Data

Machine Learning

Deep Learning

Intelligence Artificielle

Termes et notions

@arm_gilles

Page 6: DataScience_usage_interet_wagon_bordeaux

Big Data :

Termes et notions

Terme marketing

Gestion des flux de données de sources et

structures diverses afin d’en tirer une valeur

ajoutée

Définition personnelle :

• Réduction du prix de stockage de la données

• Augmentation de la puissance de calcul

• Explosion de la données (téléphone / internet / IOT…)

Page 7: DataScience_usage_interet_wagon_bordeaux

Termes et notions

Intelligence

Artificielle

Machine

Learning

Deep

Learning

@arm_gilles

Page 8: DataScience_usage_interet_wagon_bordeaux

Exemples :

Célibataire un vendredi soir…

En couple un vendredi soir…

@arm_gilles

Page 9: DataScience_usage_interet_wagon_bordeaux

Cas concret

• Vous avez crée une boutique e-commerce

• Après plusieurs mois de développement, celle-ci

prend de l’ampleur

• De plus en plus de monde achète sur votre site

• Votre Directeur Marketing souhaite encore

augmenter la rétention des utilisateurs et

l’augmentation du CA

Page 10: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerceDir Market

Il faut apprendre à

connaitre nos users

pour adapter notre

stratégie

Team business / informatique

On a bien des

data, mais on y

arrive pas sur

Excel…

Ok on appel

un Data

Scientist

@arm_gilles

Page 11: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerce

Dir Market on voudrait

segmenter nos

utilisateurs selon

leurs habitudes et

achats Data Scientist

Ok dude

@arm_gilles

Page 12: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerce

@arm_gilles

Page 13: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerce

• Nettoyer la données (anomalie, outliers)

• Structuration de la données (merging)

• Création KPI (Nb visites par mois, panier moyens,

type achat…)

• Réunion préliminaire avec l’équipe métier

• Ajout de source de données (newsletters,

cookies…)@arm_gilles

Page 14: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerce

• Comment visualiser plusieurs milliers

de ligne en 2 ou 3 dimensions (x, y, z)

Problème :

• Comment segmenter (trouver des clusters)

avec ses 50 KPIs

Solution :

• Réduire le nombre de dimension tout en

conservant l’information afin de trouver des

clusters @arm_gilles

Page 15: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerce

• Cluster visiteurs : Pas d’achat, en recherche d’informations sur des produits

• Cluster one-shot : Un achat unique et peu de retour sur le site

• Cluster promo : Achats en réaction à des promos, type ameublement, mode

• Cluster VIP : Achats réguliers, panier important

Page 16: DataScience_usage_interet_wagon_bordeaux

Cas concret - e-commerce

Mise en place de la stratégie :

• Cluster visiteurs : • Manque d’informations sur les produits ?

• Trop cher par rapport à la concurrence ?

• Push newsletter d’informations sur produits visités

• Cluster one-shot :• Analyse des achats pour une meilleure

recommandation • Effet saisonnier sur certains types d’achats (été,

hiver)

• Cluster promo : • Amélioration des newsletters

• Création de nouveaux cluster par catégorie / profils

utilisateurs

• Cluster VIP : • Création d’un club (appartenance / ambassadeur)

• Promotions dédier à ces users (augmentation CA)

Page 17: DataScience_usage_interet_wagon_bordeaux

Autres cas

- Prêt bancaire (votre banque)

- Identifier le Churn (FAI)

- Estimer le prix d’une maison

- Spam or not (gmail)

-

- Jeux (GO, Starcraft)

Page 18: DataScience_usage_interet_wagon_bordeaux

Questions ?

@arm_gilles