10
k-means (Source: http://thardes.de/wp-content/uploads/2013/06/k-means-result.jpg )

Data analysis for User retention (DO seminar)

Embed Size (px)

DESCRIPTION

Slides from a seminar on User retention & How to use data analysis for it (Digital October, 2014/02/13).

Citation preview

Page 1: Data analysis for User retention (DO seminar)

k-means

(Source: http://thardes.de/wp-content/uploads/2013/06/k-means-result.jpg)

Page 2: Data analysis for User retention (DO seminar)

(Source: http://i.stack.imgur.com/Z6mSU.jpg)

Page 3: Data analysis for User retention (DO seminar)

сluster size checkins registered (days ago) feed size

last checkin

(days ago)public

checkins venues comments friends

5 594 104 31 96 0,6 238 0 1

4099 5,3 64 0,4 62 1,4 1,6 0,1 0

49 65 402 55 264 63 12 30 19

436 25 341 59 300 16 5,9 3 2,4

125 37 402 78 309 32 9 11 6,8

2602 11 270 24 257 4 2,3 0,1 1

Кластер-анализ: итерация 1

Page 4: Data analysis for User retention (DO seminar)

сluster size checkins registered (days ago) feed size

last checkin

(days ago)public

checkins venues comments friends

5 594 104 31 96 0,6 238 0 1

4099 5,3 64 0,4 62 1,4 1,6 0,1 0

49 65 402 55 264 63 12 30 19

436 25 341 59 300 16 5,9 3 2,4

125 37 402 78 309 32 9 11 6,8

2602 11 270 24 257 4 2,3 0,1 1

Кластер-анализ: итерация 1

???

Page 5: Data analysis for User retention (DO seminar)

cluster size

last checkin

(days ago) checkinspublic

checkinscheckins/

day friends comments activities venuesdays of activity

600 209,2 51,8 20,7 1,0 1,2 1,9 17,9 12,9 53,0

10 227,4 220,5 160,6 0,7 32,5 134,9 26,1 38,7 310,6

126 316,5 41,6 38,0 0,4 10,0 12,0 12,2 9,1 95,4

5258 69,5 4,5 1,7 1,7 0,0 0,1 2,8 1,2 2,7

2644 285,2 6,2 2,8 0,6 1,2 0,3 3,2 1,4 11,2

Кластер-анализ: итерация 2

Page 6: Data analysis for User retention (DO seminar)

cluster size

last checkin

(days ago) checkinspublic

checkinscheckins/

day friends comments activities venuesdays of activity

600 209,2 51,8 20,7 1,0 1,2 1,9 17,9 12,9 53,0

10 227,4 220,5 160,6 0,7 32,5 134,9 26,1 38,7 310,6

126 316,5 41,6 38,0 0,4 10,0 12,0 12,2 9,1 95,4

5258 69,5 4,5 1,7 1,7 0,0 0,1 2,8 1,2 2,7

2644 285,2 6,2 2,8 0,6 1,2 0,3 3,2 1,4 11,2

Кластер-анализ: итерация 2

Page 7: Data analysis for User retention (DO seminar)

Линейная регрессия

(Source: http://circ.ahajournals.org/content/122/7/698/F3.large.jpg)

Page 8: Data analysis for User retention (DO seminar)

Логистическая регрессия

1 – пользователь ушел из приложения0 – пользователь остался в приложении

(Source: http://www.dennissedov.com/wp-content/uploads/2014/01/standard-logistic-sigmoid-function1.png)

Page 9: Data analysis for User retention (DO seminar)

Признак Является значимым?

checkins

public checkins

venues

comments

feed size

registered (days ago)

gender

Page 10: Data analysis for User retention (DO seminar)

Признак Является значимым?

checkins

public checkins

venues

comments

feed size

registered (days ago)

gender

Статистическая значимость