R language presentation

Preview:

DESCRIPTION

 

Citation preview

#VilniusR

2

Dzidorius Martinaitis

dzidorius@gmail.com

www.investuotojas.eu

www.twitter.com/dzidorius

www.linkedin.com/in/dzidorius

3

Remėjai

4

Praeitis• idėja

• www.vilniusR.org

Dabartis• pirmas susitikimas

Ateitis• susitikimai

• komandinis darbas virtualioje erdvėje (kaggle.com)

• hackaton/datadive

• lobizmas (data.gov)

VilniusR

5

Duomenų badas I

Naudota vrk.lt pateikta

medžiaga

6

Duomenų badas II

Naudota viesai.lt

pateikta medžiaga

http://www.viesai.lt/savivaldybiu-efektyvumas/

7

Duomenų badas III

Naudota

vilniaus.policija.lt

pateikta medžiaga

http://www.vilnius.policija.lt/?lang=1&sid=75&tid=11036

8

Nekilnojamas turtas

Finansai

IT

Laisvalaikis

Politika

Asmeninė patirtis naudojant R

9

Performance tuning

10

Anomalijų paieška

Prisijungimų skaičius

Užklausų skaičius

11

Anomalijų paieška II

Oracle DB sesijų

skaičius

13

Butų kainos Vilniuje

Naudota aruodas.lt

medžiaga

http://www.vilnius.policija.lt/?lang=1&sid=75&tid=11036

14

High frequency data

30 akcijų+indeksas+etf

20 dienų

5000 minutinių duomenų

RCpp – pagreitinti

skaičiavimus

15

High frequency data

https://github.com/kafka399/Rproject/blob/master/HFD/showHFD.R

v1• Java JMS/klientas

• MySql

• RMySQL

V2• C++ klientas

• Mongodb

• rmongodb

16

Apyvartos prognozavimas

250 dienų

10 000 atsitiktine tvarka

sugeneruotų laiko eilučių

95 % konfidencialumo

intervalas

17

Dujų kainų sezoniškumas

Ateities sandoriai dujomis

18

R greitis

Sugeneruoti

duomenys

https://github.com/kafka399/Rproject/tree/master/performance

19

RCpp

library(inline)library(Rcpp)

Code='###########    pure C++  #################

NumericVector bid(bid_); NumericVector ask(ask_); NumericVector close(close_);

int bid_size = bid.size();

NumericVector ret(bid_size);

for(int i =0;i<bid_size;i++){  

if(close[i]>0)  {    

if(bid[i]>close[i])          

ret[i] = bid[i]; 

else if(ask[i]>0 && ask[i]<close[i])         

ret[i] = ask[i];

else          

ret[i] = close[i];//    

}  

else      

ret[i]=(bid[i]+ask[i])/2;    

}

return ret;'

getLastPrice <- cxxfunction(signature( bid_ = "numeric",ask_ = 

"numeric",close_="numeric"),body=code,plugin="Rcpp")

20

Maratonas, 10 km.

Naudota

http://luxembourg.mi

katiming.de/2011/

medžiaga