17
NOTES !"# $ % & ( & % ) &%* + & % ) , &%& -. /0 & )1 % &( , & % 2)) 1 1 X n x = Population 1 Population 1 Population 2 2 2 X n x = 1 2 X X - 1 2 X X - 1 X 2 X 1 2 X X -

Stat 101 Module 4 a Slides

Embed Size (px)

DESCRIPTION

Stat 101

Citation preview

Page 1: Stat 101 Module 4 a Slides

������������������� �����

������������ ��������������������������������������������

NOTES �

��

��

��

����������������������

���������� ����������������������

����������������������������

�����!�"�#��

$����

������������ �����%������� ����������&�������������������'

(���������������&��������������������������%� ������������������)����� ����������� ���&�%������*��������������

+���������������&��������������������������%� ������������������)����� �����������������

,���������������&��%� �����������������&������� ���������������-.���/�� ���0��������������&��� ��)��1����%������������&�(���,

������&� ����% ���������� ����������2�)�����)�������������

11

X nx

= �

Population 1Population 1

Population 2

22

X nx

= �

1 2X X−1 2X X−

1X

2X

1 2X X−

Page 2: Stat 101 Module 4 a Slides

������&� ����% ���������� ����������2�)�����)�������������

1 2X X−1 2X X−µ

1 2

12

1

22

2X X n n− = +σ σ σ

1 21 2X X−

= −µ µ µ

1 2X X−1 2X X−µ

1 2

12

1

22

2X X n n− = +σ σ σ

1 21 2X X−

= −µ µ µ

�)�3����������4������������� ������

�)��4������������� ������!�#������&������

��)��3������'

�5'��( 6 7+ ≥≥≥≥ 5��'�7( 6 7+ 8�5

�����3������'

�5'�7( 6 7+ � 5��'�7( 6 7+ 9 5

�)�3������'

�5'�7( 6 7+ :�5��'�7( 6 7+ � 5

αααα αααα/2 αααα/2αααα

-zα -zα/2zα zα/2

��;����5 ���*�8�3*� ��;����5 ���*�9�*� ��;����5 ���*�8�3*�<+���*�9�*�<+

*�=�� ���������� ��������������)�������������

σ���σ�1��)�!�����4�����������������

( ) ( )1 2 1 2

2 21 2

1 2

X Xz

n n

µ µ

σ σ

− − −=

+

�����

Page 3: Stat 101 Module 4 a Slides

#����������4���������-�����µ( 3 µ+���������σ(!�σ+ ����1��)�

( ) ( )2 2 2 2

1 2 1 21 2 1 21 22 2

1 2 1 2

Z ZX X X Xn n n nα ασ σ σ σµ µ− − + ≤ − ≤ − − +

-.����'�����!�4���

� �����������������µ( 3 µ+'�#����(����!�4����������� ��� �������&����

�> ���������������������������)�&����%�����������%��������&��������������?�.�����������@��4����������������&��������� ���&�������������������&�������!����������������&����%�����)�����������)��������������&����%���������%�����!����!�����������

� �����������������µ( 3 µ+'����&�3������#����� �������������

������A(��� ������A+

���!�4���� ���!����

��������B� �( :�(+5�%���� �+ :�C5�%����

���� :�+,D���������������:�+(C������

-.����'�����!�4���

x1x1 ����

2���������������������� ��������&������������!����)����� ����������������������������1��)��σ(:�(D�����������σ+ :�+5��������#������ �����������5�5D������������&����������

Page 4: Stat 101 Module 4 a Slides

*�=�� ���������� ��������������)�������������

�� ≥ ������ ≥ �������������� ���������������

( ) ( )1 2 1 2

2 21 2

1 2

X Xz

s sn n

µ µ− − −=

+

���������������&����� �����������2�)���������'��������&��-.����

������������������������ ������)��)��������� ���������������������������)��������������&����� ���)�&������������������&����&���������������������������&����� ���)�&��������� ����&����&����2��� ���)����������&�����������)������������������������������&��������&������������ ���������������������������)� ���%�'

0:

0:

21

210

≠−=−

µµµµ

AH

H

���������������&����� �����������2�)���������'��������&��-.����

0����������������,+����������&����&����������������������0������1����0������������������������1������,��� ����&����&������������ ���&���������������������������������)��&������'

Page 5: Stat 101 Module 4 a Slides

���������������&����� �����������2�)���������'��������&��-.����

164.264

253.16

700.70

32

2

1

1

1

1

=

=

=

=

SSXn

411.166

900.12

187.62

34

2

2

2

2

2

=

=

=

=

SSXn

Advertising Managers

68.50863.384

59.04593.083

54.27045.652

73.90439.672

57.35165.36080.742

86.74174.19475.932

35.39464.27674.195

69.31967.056103.030

62.48377.24293.261

59.62196.76789.807

67.57465.14596.234

71.11557.79174.256

Advertising Managers

68.50863.384

59.04593.083

54.27045.652

73.90439.672

57.35165.36080.742

86.74174.19475.932

35.39464.27674.195

69.31967.056103.030

62.48377.24293.261

59.62196.76789.807

67.57465.14596.234

71.11557.79174.256

Auditing Managers

63.50861.261

58.65366.359

71.49271.35160.053

67.81472.79048.036

56.47059.50573.065

72.40137.38661.254

71.80467.16099.198

46.39483.84937.194

54.44942.49463.362

59.67654.33557.828

63.36966.03555.052

43.64977.13669.962

Auditing Managers

63.50861.261

58.65366.359

71.49271.35160.053

67.81472.79048.036

56.47059.50573.065

72.40137.38661.254

71.80467.16099.198

46.39483.84937.194

54.44942.49463.362

59.67654.33557.828

63.36966.03555.052

43.64977.13669.962

���������������&����� �����������2�)���������'��������&��-.����

4���������%��!�)����������&�)��������������������������������������&��)�&�����������������&����&����������� ����&����&��E�������������������)�3�������� ������α :�5�5D��2��� ���������������)�3��������!������������)����;��������&��������������������5�5+D�������)�������������)��&���& ��'

���������������&����� �����������2�)���������'��������&��-.����

RejectionRegion

Non Rejection Region

Critical Values

RejectionRegion

96.1−=Zc 0 96.1=Zc

025.2

=α025.2

RejectionRegion

Non Rejection Region

Critical Values

RejectionRegion

96.1−=Zc 0 96.1=Zc

025.2

=α025.2

.Hreject not do 1.96, Z 1.96- If.Hreject 1.96, > or Z 1.96- < ZIf

o

o

≤≤

Page 6: Stat 101 Module 4 a Slides

����������2�)���������'�����&�-.���

1.960z Critical two-tail

0.0189P(Z<=z) two-tail

1.64z Critical one-tail

0.0094P(Z<=z) one-tail

2.35z

0Hypothesized Mean Difference

3432Observations

166.411264.164Known Variance

62.18770.7001Mean

Auditing MgrAdv Mgr

z-Test: Two Sample for Means

1.960z Critical two-tail

0.0189P(Z<=z) two-tail

1.64z Critical one-tail

0.0094P(Z<=z) one-tail

2.35z

0Hypothesized Mean Difference

3432Observations

166.411264.164Known Variance

62.18770.7001Mean

Auditing MgrAdv Mgr

z-Test: Two Sample for Means

#����������4���������-�����µ( 3 µ+)�����( �����+ �������&������σ(!�σ+ ���� �1��)�

( ) ( )1 21

2

1

2

2

21 2 1 2

1

2

1

2

2

2X X S

nSn X X S

nSn

Z Z− − + ≤ − ≤ − − +µ µ

�������������%���

( ) ( )

( ) ( )

1 21

2

1

2

2

21 2 1 2

1

2

1

2

2

2

2 2

1 2

2 2

1 2

2145 246 19650 50

2145 246 19650 50

442 188

346 299 346 299

X X Sn

Sn X X S

nSn

Z Z− − + ≤ − ≤ − − +

− − + ≤ − ≤ − − +

− ≤ − ≤ −

µ µ

µ µµ µ

. . . . . .

. .

. . . .

1

1

1

Regular Gas

50

21.45

3.46

nXS

=

=

=

2

2

2

Premium Gas

50

24.6

2.99

nXS

=

=

=95% Confidence Z = 1.96�

Page 7: Stat 101 Module 4 a Slides

���� �������� ���������������� �����������

� -����������)����� �����������������������% ���

� ����)������������������������

� 0������������������������������!�� 8�,5�

� ������� ������������ �������������������� �1��)��

� ��������������������)����� ������������> ����� σσ 2

2

2

1=

�����

=�� ������������ �������������������0�� ��&� σσ 2

2

2

1=

( ) ( )2 21 1 2 22

1 2

1 1

2p

s n s ns

n n

− + −=

+ −

����������������������������������������������������������������������

( ) ( )1 2 1 2

2

1 2

1 1p

X Xt

sn n

µ µ− − −=

� �+� �

� �

Page 8: Stat 101 Module 4 a Slides

0��4�� �����������#����+�'���������B���� ��� ���&�#�����

Training Method A

56 51 45

47 52 43

42 53 52

50 42 48

47 44 44

Training Method B

59

52

53

54

57

56

55

64

53

65

53

57

1

1

1

2

15

47 73

19 495

nXS

=

=

=

.

.

2

2

2

2

12

56 5

18 273

nXS

=

=

=

.

.

F�������� ��������#����+�!����������������������5�5D������������&����������

-G#-��F � �������������BH�)3-��������������&����%��

t-Test: Two-Sample Assuming Equal Variances

Variable 1 Variable 2Mean 4 7.73 56.5Variance 19.495 18.27Observations 15 12Pooled Variance 18.957Hypothesized Mean Difference 0df 25t Stat - 5.20P(T<=t) one-tail 1.12E-05t Critical one-tail 1.71P(T<=t) two-tail 2.23E-05t Critical two-tail 2.06

t-Test: Two-Sample Assuming Equal Variances

Variable 1 Variable 2Mean 4 7.73 56.5Variance 19.495 18.27Observations 15 12Pooled Variance 18.957Hypothesized Mean Difference 0df 25t Stat - 5.20P(T<=t) one-tail 1.12E-05t Critical one-tail 1.71P(T<=t) two-tail 2.23E-05t Critical two-tail 2.06

Page 9: Stat 101 Module 4 a Slides

#����������4���������-�����µ( 3µ+ )�������������������σ(+ :�σ++

( ) ( ) ( )2 21 1 2 2

1 21 2 1 22

1 2

1 1 1 12

2

s n s nx x t

n n n n

where df n n

α− + −

− ± ++ −

= + −

����3����������������)���������������

)������� %��������&��������������������.�����%��I�� ��������������������&��J

1 2 1 2

2 21 2

1 2

( ) ( )X Xt

s sn n

µ µ− − −=+

22 21 2

1 22 22 2

1 2

1 1 2 2

1 11 1

s sn n

s sn n n n

ν

� �+� �

� �=� � � �

+� � � �− −� � � �

���� �������� ���������������� �����������

������

�����������������µ( 3 µ+'�#����+%

��� �� � �������������� �� � ����������������������� ���������������������� ����� ����� ��������

Page 10: Stat 101 Module 4 a Slides

4�������-��������µ( 3 µ+'�#����+%

�)������������ ������'�������������

� �����������3����������&� ����������������������������������������� ���

� ���������?%�����3���3����@���� ����������������������� ��!�� ��������)���������&�� ���� ������)���!���� ���!�� �����)�������4"������!���

� ���������&������������������������������&������������������������3����������&��%��� ������������%�)���������������������������������� �������������&�������

�)�3�������������������� ������

��)��3������'

�5'�� ≥≥≥≥ 5��'�7 8�5

�����3������'

�5'�7 � 5��'�7 9 5

�)�3������'

�5'�7 :�5��'�7 K 5

αααα αααα/2 αααα/2αααα

-tα -tα/2tα tα/2

��;����5 ����8�3� ��;����5 ����9�� ��;����5 ����8�3�<+����9��<+

Page 11: Stat 101 Module 4 a Slides

�)������������ ������'�������������

difference samplemean = d

difference sample ofdeviation standard =

difference populationmean = D

pairsin difference sample = dpairs ofnumber

1

Sd

=−=

−=

n

ndfn

Ddt

S d

#����������4����������������� ���������������������������

2 2

1

d dD

s sd t d t

n ndf n

α αµ− ≤ ≤ +

= −

0��4�� ������'�������������

� #����������������)��&�� ������)�����������&������ �������������%���������� ����)������������������� ���)���������������)������ %;�����������%���������� ����)������� �������%�������������4������������!���������������������&���

Page 12: Stat 101 Module 4 a Slides

0��4�� ������'�������������

L(D5(�,(+

3(((+5(,(((

L(DC(D((5

�(�M(�DM

3((,N(,LC

M(,L(+CL

3+(N5(N+N

,(�+(,MD

N(�L(�(�

D(�5(,D,

3((�D(�N+

�(,N(,+(

���������� ����������&� %;��

2���������� ���I��&J

0��4�� ������'�������������

�)����� ����������������

�������� �%�&���%����� ��&����� ���

�������������� �!��� ���� ���( :��+ ���������

���)��������I�J��������

1 2

1 2

*Y Y

pn n

+=+

The pooled estimate for the overall proportion is:

where Y1 and Y2 are the number of successes in samples 1 and 2

Page 13: Stat 101 Module 4 a Slides

�)����� ����������������

Hypothesis for Population Proportions

Lower-tail test:

H0: p1 – p2 ≥≥≥≥ 0Ha: p1 – p2 < 0

Upper-tail test:

H0: p1 – p2 � 0Ha: p1 – p2 > 0

Two-tail test:

H0: p1 – p2 = 0Ha: p1 – p2 � 0

αααα αααα/2 αααα/2αααα

-zα -zα/2zα zα/2

Reject H0 if Z < -Zα Reject H0 if Z > Zα Reject H0 if Z < -Zα/2or Z > Zα/2

*�=�� ������������ ���������������� ����������������

( ) ( )1 2 1 2

1 2

1 2

1 2

1 1* (1 *)

*

Z

p pn n

Y Yp

n n

p p p p− − −=

� �− +� �

� �

+=+

�����&���� ���������������� ����������������

�������������4�����������&��������������������������������������)�����������)���%����������)��&����������������������������� �������&������������ ��O�� ��������� ������������ �������&�(55��������MD�)�����0��&������!�+����������)��&���������.����������������������� �������&������������ ����=������)���!������& ���)���,M�� ��������������)���� &������������������������������������&�������������������%�)��������������������)�����������)���%����������)��&����������������������������� �������&������������ ��O�������5�5(������������&����������

Page 14: Stat 101 Module 4 a Slides

#����������4���������-������( 3 �+

( ) ( )1 1 2 2 1 1 2 2

1 2 1 2 1 22 21 2 1 2

(1 ) (1 ) (1 ) (1 )Z Z

p p p p p p p pp p p p p p

n n n nα α

− − − −− − + ≤ − ≤ − + +

�������������%��

1

1

1

1 1

400

48

48.12

4001 .88

nYp

q p

=

=

= =

= − =

2

2

2

2 2

480

187

187.39

480

1 .61

nYp

q p

=

=

= =

= − =

( ) ( )

( ) ( )( ) ( )( ) ( ) ( )( ) ( )( )

1 2 1 21 2 1 2

1 2 1 2 1 22 21 2 1 2

1 2

1 2

1 2

(1 ) (1 ) (1 ) (1 )

.12 .88 .39 .61 .12 .88 .39 .61.12 .39 2.33 .12 .39 2.33

400 480 400 480

.27 .064 .27 .064

.334 .206

p p p pZ Z

p p p pp p p p p p

n n n n

p p

p pp p

α α

− − − −− − + ≤ − ≤ − + +

− − + ≤ − ≤ − + +

− − ≤ − ≤ − +

− ≤ − ≤ −

For a 98% level of confidence, Z = 2.33.

��� �����

MISCELLANEOUS PROBLEMS 1. A record company executive is interested in estimating the difference in the average play

length of rock-and-roll singles and country-and-western singles. To do so she randomly selects 10 country-and-western singles and nine rock-and-roll singles. The play lengths in minutes of the selected singles are as follows:

Country and Western Rock and Roll 3.80 3.88 3.30 4.13 3.43 4.11 3.30 3.98 3.03 3.98 2.18 3.93 3.18 3.92 3.83 3.98 3.22 4.67

3.38

Page 15: Stat 101 Module 4 a Slides

(a) Calculate a 99% confidence interval to estimate the difference in population means for these two types of recordings.

(b) At a 0.01 level of significance, is there evidence to say that there is a significant difference in the average playing length of time of the two populations assuming equal population variances? Use the 8-step procedure.

2. The following data represent the running times of films produced by two motion-picture

companies: Time, in minutes Company I 103 94 110 87 98 Company II 97 82 123 92 175 88 118 Test the hypothesis at the 0.10 level of significance that there is a significant difference

between the average running times of films produced by the two companies, assuming unequal variances for the populations.

3. A consumer test group wants to determine the difference in gasoline mileage of cars

using regular unleaded gas and cars using premium-unleaded gas. Researchers for the group divided a fleet of 100 cars of the same make in half and tested each car on one tank of gas. Fifty of the cars were filled with regular unleaded gas and 50 were filled with premium-unleaded gas. The sample average for the regular gasoline group was 21.45 miles per gallon with a standard deviation of 3.46 miles per gallon. The sample average for the premium gasoline group was 24.6 miles per gallon with the standard deviation of 2.99 miles per gallon. Is there evidence to believe at the 0.05 level of significance that there is a significant difference in the mean gas mileage between the cars using regular gasoline and the cars using premium gasoline?

4. Suppose you own a plumbing repair business and employ 15 plumbers. You are

interested in estimating the difference in the average number of calls completed per day between two of the plumbers. A random sample of 40 days of plumber A’s work results in a sample mean of 5.3 calls, with a variance of 1.99. A random sample of 37 days of plumber B’s work results in a sample mean of 6.5 calls with a variance of 2.36. Use a standard 8-step hypothesis testing procedure to answer this question at the 0.05 level of significance: is there a possibility that, for this population of days, there is no difference in the average number of calls completed between plumber A and plumber B?

5. Suppose that the National Association of Truck Drivers is interested in improving the

public image of truck drivers. They decide to test whether the average speed of trucks traveling on an interstate highway is significantly greater than the average speed of cars. In random samples of 100 cars and 200 trucks checked at one point on the highway, the average speed of the cars is 52 miles per hour and the average speed of the trucks is 54 miles per hour. Assume that the population variance of the cars is 25 and that of the trucks is 16. Test the appropriate hypothesis at a 0.05 level of significance. Follow the standard 8-step procedure used in the lectures.

6. The following represents the Excel printout of a t-test involving the numbers of

newspapers sold by eight randomly selected newsvendors on the east side of the city and by eight randomly selected news vendors on the west side of the city. Carry out a test of the hypothesis at the 0.05 level of significance that the news vendors on the east side of the city sell more newspapers than news vendors on the west side. Follow the standard 8-step procedure used in the lectures.

Page 16: Stat 101 Module 4 a Slides

t-Test: Two-Sample Assuming Equal Variances

East Side West Side

Mean 47.25 38.75

Variance 108.5 141.9286

Observations 8 8

Pooled Variance ?

Hypothesized Mean Difference 0

df ?

t Stat ?

P(T<=t) one-tail 0.075482

t Critical one-tail ?

P(T<=t) two-tail 0.150963

t Critical two-tail ? 7. Ten pregnant women were given an injection of pitocin to induce labor. Their systolic

blood pressures immediately before and after the injection are given in the following Excel spreadsheet.

Patient Before After d t-Test: Paired Two Sample for Means

1 134 140 ? 2 122 130 ? Before After 3 132 135 ? Mean ? ? 4 130 126 ? Variance ? ? 5 128 134 ? Observations ? ? 6 140 138 ? Pearson Correlation 0.830679 7 118 124 ? Hypothesized Mean Difference ? 8 127 126 ? df ? 9 125 132 ? t Stat ?

10 142 144 ? P(T<=t) one-tail 0.022263 SUMMARY STATISTICS t Critical one-tail ? n ? P(T<=t) two-tail 0.044525 d average ? t Critical two-tail ? d stand. Dev. ? Do the data indicate that injection of this drug changes blood pressure? Use a 0.05 level of significance. Follow the standard 8-step procedure used in the lectures. Copy the Excel spreadsheet in your paper and fill in the cells marked “?” with their correct figures. 8. Computer response time is defined as the length of time a user has to wait for the

computer to access information on the disk. Suppose a data center wants to compare the average response times of its two computer disk drives. If µ1 is the mean response time of disk 1 and µ2 is the mean response time of disk 2, we want to detect a difference between these two means, if such a difference exits. Independent random samples of 50 response times for disk 1 and 40 response times for disk 2 were selected. The data (recorded in milliseconds) are as follows:

Page 17: Stat 101 Module 4 a Slides

Disk 1 Disk 2 x1 = 68.2 x2 = 53.8

s1 = 18.6 s2 = 15.8 Is there sufficient evidence to indicate a difference between the mean response times of the two disk drives? Use a level of significance of 0.05 and assume a normal distribution for each with equal variances. Use the 8-step procedure in the lectures. 9. Suppose you want to conduct a study to conduct a study to compare the speed of typing

on a word processor with that on an electric typewriter. You believe word processing is faster than electric typewriting. To test this belief you randomly select 12 secretaries who are familiar with an electric typewriter and who know a particular word processing system. Each secretary is given the same passage to type, types the passage on an electric typewriter, and then types an equivalent passage on a word processor. The typing speeds computed in words per minute are shown in the following table.

Secretary Word Processor

Electric Typewriter

1 62 51 2 49 43 3 70 55 4 65 62 5 49 51 6 96 78 7 66 62 8 63 49 9 69 65

10 88 78 11 59 54 12 41 38

(a) Explain why the concept of matched pairs would apply to this problem. (b) Use a 1% level of significance to test whether word processing is faster than electric typewriting. Follow the 8-step procedure. 10. The Sales Department at Manelli Perfume Comp. is interested in whether there is a

difference in the proportions of younger and older women who would purchase the new Heavenly fragrance if it were marketed. There are two independent populations, a population consisting of the younger women and a population consisting of the older women. Each sampled woman will be asked to smell Heavenly and indicate whether she likes the fragrance well enough to purchase a bottle. A random sample of 100 young women revealed 20 liked the Heavenly fragrance well enough to purchase it. Similarly, a sample of 200 older women revealed 100 liked the fragrance well enough to make a purchase. At a 5% level of significance, test the hypothesis that the proportion of younger women and older women who liked the Heavenly fragrance are the same. Use the 8-step procedure. State the p-value.