View
239
Download
8
Embed Size (px)
Citation preview
04/18/23 Dr Andy Brooks 1
TFV0103 Tölfræði og fræðileg
vinnubrögð Fyrirlestrar 13 og 14
Yfirlit og Spurningar (tölfræði)
04/18/23 Dr Andy Brooks 2
Leiðbeiningar í lokaprófinu TFV0103 Tölfræði
1. Svarið öllum spurningum. 2. Setjið hring við einn valmöguleika, a), b, c) eða d). 3. Leyfilegt er að nota reiknivél. 4. Það er ekki leyfilegt að nota kennslubókina eða glósur. 5. Prófið er bæði á ensku og á íslensku. Vinsamlegast svaraðu bara íslensk spurningar.
1. Answer all the questions. 2. Answer by circling one of a), b, c) or d). 3. You have permission to use a calculator. 4. You do not have permission to use textbooks or notes. 5. The exam is given in both english and icelandic. Please only answer the icelandic questions.
04/18/23 Dr Andy Brooks 3
Reiknivél• Ertu búin(n) að velja?
• Kannt þú vel að nota?
• Komdu með rafhlaða til viðbótar
04/18/23 Dr Andy Brooks 4
Lokapróf
• Krossaspurningar eins og heimapróf
• Ekki alveg eins – tölur breytast til dæmis.
• 30 spurningar
• Kafli 1,2,3 – 4 spurningar
• Kafli 4,5,6,7,8,9 – 3 spurningar
• BOOKTABLE 3 og 6 eru með prófblöðin
• Formúlublað er með prófblöðin
04/18/23 Dr Andy Brooks F2 5
Tvær tegundir af tölfræði
• Lýsandi tölfræði: safna, lýsa, og sýna úrtaksgögn.– t.d. safna aldra, svo koma tíðni, meðaltal, staðalfrávik, stöplarit,...
• Ályktunartölfræð: álykta um þýði á grunni úrtaks – tölfræðipróf
• Þýði er safn af einstaklingum eða af hlutum eða af atburðum. Oftast er ekki raunhæft að athuga allt þýðið.
• Úrtak er tiltölulega lítill hópur sem er valin úr þýði. – hlutmengi af þýðinu
300.000 eru til á Íslandi en hve margir tóku þátt í könnuninni um 5 kr. pening?
10 eða 100 eða 10.000 eða 100.000?
Alltaf, þu verður að vita af úrtaksstærð.
lýsandi tölfræði/descriptive statisticsályktunartölfræði/inferential statistics
þýði/populationúrtak/sample
04/18/23 Dr Andy Brooks F2 6
Tegundir breyta
VariableQuantitative
Qualitative
Discrete
Continuous
Nominal
Ordinal
red, blonde,brown,black
hot, warm, cold
weight, height
age, number of modules
hot>warm>coldekki hægt að reikna út meðaltal
megindleg
eigindleg
rofin
samfelld
nafnbreyta
raðbreyta
breytaþyngd, hæð
aldur, hve mörg námskeiðar
rautt, ljóshærð, brúnt, svart
heitur>hlýr>kaldurí röð
tegundir breyta/types of variables
þyngd
04/18/23 Dr Andy Brooks F3 7
Teikna myndrit af eigindlegum gögnum Tegundir af 498 aðgerðum
Graphing Qualitative Data
Ta02-01
Pie Chart/SkífuritBar Graph/SúluritHvaða graf er best?
rúm er til á milli dálka Neurosurgery/Taugaskurðlækningar
04/18/23 Dr Andy Brooks F3 8
2ss
Sample Variance (s2) & Standard Deviation (s)
sn
x x2 21
1
( ) n = úrtakstærð
1
22
2
n
n
xx
s
dreifni staðalfrávik
skilgreiningarformúla
reikniformúla
04/18/23 Dr Andy Brooks F4 9
Positive and negative correlationsr = +0,71positive correlation/
r = -0,74negative correlationneikvæð fylgnijákvæð fylgni
\misc\movies\JK_31Interactivity 3A
04/18/23 Dr Andy Brooks F4 10
Að reikna út Pearson´s rPearson fylgnistuðull
yxssn
yyxxr
1
))((
)()(
)(
ySSxSS
xySSr
n
xxxSS
2
2)(
n
yyySS
2
2)(
n
yxxyxySS )(
SSsum of squares/summa fervika
x
y
04/18/23 Dr Andy Brooks F5 11
Regression line/Jafna bestu línuy = 3,5714+0,6429x
0
5
10
15
0 5 10 15
x
yx y
3 5
4 8
5 6
6 7
7 9
8 6
9 10
10 11
n=8
xy 6429,05714,3
(x,y)
yy
3,5714
skekkja/leif
gögnin
skurðpunktur
04/18/23 12
Að reikna út b1 og b0
x y x2 xy
3 5 9 15
4 8 16 32
5 6 25 30
6 7 36 42
7 9 49 63
8 6 64 48
9 10 81 90
10 11 100 110
∑x ∑ y ∑x2 ∑ xy
52 62 380 430
n
xxxSS
2
2)(
428
52380)(
2
xSS
n
yxxyxySS )(
278
62*52430)( xySS
n=8
6429,042
27
)(
)(1
xSS
xySSb
)( 10 xbyb
2571,3)5,6*6429,0(75,70 b
ekki 100% rétt - ekki nógir aukastafir að reikna með F5
04/18/23 (c) Thomson Learning Inc. 13
Number of Relative CumulativeTrial Heads Observed Frequency Relative Frequency
1 5 5/10 5/10 = 0.50002 4 4/10 9/20 = 0.45003 4 4/10 13/30 = 0.43334 5 5/10 18/40 = 0.45005 6 6/10 24/50 = 0.48006 7 7/10 28/60 = 0.46677 6 6/10 34/70 = 0.48578 4 4/10 38/80 = 0.47509 7 7/10 45/90 = 0.5000
10 3 3/10 48/100 = 0.480011 4 4/10 52/110 = 0.472712 6 6/10 58/120 = 0.483813 7 7/10 65/130 = 0.500014 4 4/10 69/140 = 0.492915 3 3/10 72/150 = 0.480016 7 7/10 79/160 = 0.493817 6 6/10 85/170 = 0.500018 3 3/10 88/180 = 0.488919 6 6/10 94/190 = 0.494720 4 4/10 98/200 = 0.4900
• Árangur tilraunar, að kasta peningi tíu sinnum aftur of aftur…
relative frequency/hlutfallsleg tíðnicumulative relative frequency/safn hlutfallsleg tíðni
10x10x10x....
F6
04/18/23 Dr Andy Brooks F6 14
DæmiAð kasta peningi fimm sinnum
• Líkur á A = {exactly one head/nákvæmlega einn fiskur}?• Líkur á B = {exactly five heads/nákvæmlega fimm fiskar}?
• The sample space comprises of 32 outcomes.Úrtaksrúmið samanstendur af 32 útkomum.2 x 2 x 2 x 2 x 2 = 32 = n(S)
• A = {HTTTT,THTTT,TTHTT,TTTHT,TTTTH}• B = {HHHHH}
T THHH
32
5
)(
)()(
Sn
AnAP
32
1
)(
)()(
Sn
BnBP
5 úrtakspunktar
1 úrtakspunktur
04/18/23 Andy Brooks 15
P P P P( ) ( ) ( ) ( )A or B A B A and B
A B
If two events A and B are “mutually exclusive”: P(A and B) = 0.
Ef tveir atburðir A og B eru “ósamrýmanlegir atburðir”:
sniðmengi er ekki til
Intersection – we don´t intend to count twice.Sniðmengi - við ætlum ekki að telja tvisvar.
General Addition Rule for probabilityAlmenn samlagningarregla um líkindi
A and B are two events in a sample space S. A og B eru tveir atburður í úrtsaksrúmi S.
Venn-mynd
F7
04/18/23 Dr Andy Brooks F7 16
The space shuttle Challenger blew up in 1986.Geimskutlan Challenger sprakk í loft upp í 1986.
• Reliability of a joint was 0,9777.Áreiðanleiki samskeytis var 0,9777.
• So the reliability of six joints was:Svo áreiðlanleiki sex samskeyta var:0.9777 x 0.9777 x 0.9777 x 0.9777 x 0,9777 x 0.9777eða 0.869, u.þ.b. 87%
Video: Chapter 4 and 5 probability
Special Multiplication RuleSérstak margföldunarregla
independent events/óháðir atburðir
04/18/23 Dr Andy Brooks F8 17
Binomial Distribution/Tvíkostadreifing• p eru líkur á “jákvæðri” niðurstöðu í hverri tilraun
– t.d. “líkur á framhlið” P(H) = 0,5 svo p = 0,5
• q eru líkur á “neikvæðri” niðurstöðu í hverri tilraun– t.d. “líkur á bakhlið” P(T) = 0,5, svo q =0,5
• P(x), líkurnar á að fá nákvæmlega x “jákvæðar” niðurstöður í n tilraunum, er:
!( ) fyrir x=0,1,2,...,n
!( )!x n xn
P x p qx n x
binomial coefficient/tvíliðustuðull
n xC reiknivél?
04/18/23 Dr Andy Brooks F8 18
{HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}
• n = 3 (independent trials/ óháðar tilraunir)• “success” = H og “fail” = T• p = P(H) = 0,5 og q = P(T) = 0,5• p + q = 1• slembibreyta x = 0, 1, 2 eða 3
33!( ) 0,5 0,5 fyrir x=0,1,2, eða 3
!(3 )!x xP x
x x
random variable x/slembibreyta x
04/18/23 19
Interactivity 6A 1,0 0,5
≈ 0,95 (2σ) ≈ 0,68 (1σ)
Area under the normal curve.Flatarmál undir normalkúrfinni.
x-ás: hours of sleep/tímar af svefni F9
04/18/23 (c) Thomson Learning, Inc. 20
Dæmi
0 45,1 z
Hvert er flatarmálið milli z-gildanna 0 og 1,45?What is the area between the z-scores 0 and 1.45?
BOOKTABLE 3 Bókartafla 3
0,4265 1,45)zP(0
z-gildiHow many standard deviations from the mean.Hve mörg staðalfrávik frá meðaltalinu.The distribution of z is a standard normal distribution.Dreifing z er stöðluð normalderifing.
the area under the curve/flatarmálið undir kúrfinnihvert er flatarmálið milli z = ? og ?
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
F9
21
RVLS Sampling Distributions
525 125
5
σ=5,00þýðisstaðalfrávik
S=1,02staðalfravík úrtakadreifingar
F10
04/18/23 Dr Andy Brooks F10 22
Standard error of the meanStaðalvilla meðaltala
• The standard deviation of the sampling distribution of the sample mean is called the standard error of the mean.Staðalfrávik úrtakadreifingar úrtaksmeðaltals kallast staðalvilla meðaltal.
nx
The standard error of the mean gets less with a bigger sample.Staðalvilla meðaltala minnkar með stærra úrtaki.
04/18/23 Dr Andy Brooks F11 23
Confidence Interval (CI)/Öryggisbil• Oftast, við höfum bara eitt úrtak.
Often, we have just one sample.• The sample mean is a point estimate for the population mean
μ. Úrtaksmeðaltal er punktspá fyrir þýðismeðaltal μ.• 95% öryggisbil fyrir μ (alfastig=0,05) er:
• 99% öryggisbil fyrir μ (alfastig=0,01) er:
n1,96 x til
n1,96 - x
n2,575 x til
n2,575 - x
If σ is known.Ef σ sé þekkt.
04/18/23 Dr Andy Brooks F11 24
Dæmi• The consumer group take a random sample of 40 pills
(sample size n = 40) and find:Neytandahópurinn tekur slembiúrtak 40 pillna (úrtakstærð n=40) og finnur :
• The test statistic z* is:Prófmælitalan z* er:
• Líkur á að z<z*, P(z<-1,58), er 0,5 - 0,4429 = 0,0571
mg 95,23 x
1,5811-
400,2
24-23,95
x z*
n
aðeins minna en 24 mg
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
0 z*z
04/18/23 Dr Andy Brooks F12 25
“Student´s t”• Because s is an estimate, instead of the test statistic z* and
BOOKTABLE3, we use Student´s t:Af því að s sé spátala, í staðinn fyrir prófmælitöluna z* og bókartöflu 3, við notum “Student´s t”:
• The t-distribution is not normally distributed for small sample sizes n.t-dreifing er ekki normaldreift fyrir litlar úrtaksstærðir n.
• Students´s t-distributions are distinguished by how many degrees of freedom (df) they contain.Student's t dreifingarnar eru aðgreindar með því hversu margar frígráður (df) þær innihalda.
• df = n-1 (Kafli 9,1)
nsx
t
04/18/23 26
Dæmi: Heights of women/Hæðir kvenna
• s er punktspá fyrir σ • 95% öryggisbil fyrir þýðismeðaltal μ er:
1,707] til[1,653
0,06s 1,68x 22n
1,705] til[1,655
meðaltal 1,68miðtala 1,675kryppugilidi 1,64
22
06,02,08 x til
22
06,02,08 - x
var 1,96≈ +4mmaðeinsbreiðari
var
F12
04/18/23 Dr Andy Brooks 27
Dæmi 3Viltu hætta að reykja? (www.reyklaus.is)
Reiknaðu nákvæmt próf Fisher að nota reiknavél í GraphPad á netinu.http://www.graphpad.com/quickcalcs/contingency1.cfmHvað er p-gildi? __________
Er munir til á milli reykingamanna og manna sem reykja ekki? JÁ NEIVið vitum að maður er reykingamaður. Hverjar eru líkur á því að hann er með krabbamein?Svarið (p1) __________Við vitum að maður reykir ekki. Hverjar eru líkur á því að hann er með krabbamein?Svarið (p2) __________Reiknaðu “relative risk” (afstæð áhætta) sem er p1 deilt með p2.Svarið __________
Smokers Non-smokers Cancer 230 78 No cancer 465 652 695 730
Tölvutími 5