Upload
cong-nghiep-thuc-pham
View
3.053
Download
5
Embed Size (px)
DESCRIPTION
Xác suất thông Kê
Citation preview
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
1
XÁC SUẤT CỦA BIẾN CỐ
CHƯƠNG 1
LÊ HỮU KỲ SƠN 1
Nội dung
Không gian mẫu và biến cố
Định nghĩa xác suất
Xác suất có điều kiện
Công thức nhân xác suất
Các biến cố độc lập
Công thức xác suất đầy đủ và Bayes
LÊ HỮU KỲ SƠN 2
• Phép thử là một khái niệm cơ bản không định
nghĩa. Ta hiểu phép thử là một thí nghiệm hay
quan sát nào đó.
• Phép thử được gọi là ngẫu nhiên nếu ta không dự
báo trước kết quả nào sẽ xảy ra.
Trong thực tế, các hiện tượng được chia thành 2
loại: hiện tượng tất nhiên và hiện tương ngẫu nhiên.
Không gian mẫu và biến cố
LÊ HỮU KỲ SƠN 3
• Mỗi tập con của không gian mẫu được gọi là
một biến cố. Ký hiệu: A, B, C,…
• Tập hợp gồm tất cả các kết quả của phép thử
được gọi là không gian mẫu của phép thử. Ký
hiệu: S.
Không gian mẫu và biến cố
• Biến cố chỉ gồm một kết quả được gọi là biến cố
sơ cấp. Ký hiệu: .
LÊ HỮU KỲ SƠN 4
Không gian mẫu và biến cố
Ví dụ 1: Gieo một đồng tiền xu gồm hai mặt số và
hình 1 lần. Xác định không gian mẫu.
Ví dụ 2: Gieo một đồng tiền xu hai lần. Xác định
không gian mẫu.
Ví dụ 3: Gieo một con xúc xắc một lần. Xác định
không gian mẫu.
Ví dụ 4: Gieo một con xúc xắc liên tiếp hai lần.
Xác định không gian mẫu. LÊ HỮU KỲ SƠN 5
Không gian mẫu và biến cố
Ví dụ 5: Xét điểm số của một sinh viên khi thi kết
thúc môn Xác suất thống kê ở trường Đại học
Công nghiệp Thực phẩm TPHCM.
• Hãy xác định không gian mẫu.
• Gọi biến cố A: “sinh viên này thi đậu”. Hãy xác
định các kết quả của A.
LÊ HỮU KỲ SƠN 6
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
2
Không gian mẫu và biến cố
• Khi sự xảy ra của một biến cố không thể được dự
đoán chính xác thì ta gọi biến cố tương ứng là biến
cố ngẫu nhiên.
• Cho phép thử có không gian mẫu S và biến cố A.
Biến cố A được gọi là xảy ra nếu có một kết quả
nào đó của A xảy ra.
• Biến cố chắc chắn là biến cố bao giờ cũng xảy ra
khi thực hiện phép thử. Ký hiệu: S.
LÊ HỮU KỲ SƠN 7
Không gian mẫu và biến cố
• Biến cố rỗng là biến cố không bao giờ xảy ra khi
thực hiện phép thử. Ký hiệu:
Ví dụ 6: Một nhóm có 6 nam, 4 nữ. Chọn ngẫu
nhiên 5 người.
Gọi A: “Chọn được ít nhất 1 nam”,
B: “Chọn được 5 nữ”,
C: “Chọn được 3 nam”.
Khi đó, A là biến cố chắc chắn, B là biến cố rỗng
và C là biến cố ngẫu nhiên.
LÊ HỮU KỲ SƠN 8
Không gian mẫu và biến cố
• Quan hệ kéo theo: A B
• Quan hệ tương đương:
A BA B
B A
A B, A B• Tổng:
A B • Xung khắc:
A S \ A,• Đối lập: A B A B, A B A B
A B, AB• Tích:
LÊ HỮU KỲ SƠN 9
Không gian mẫu và biến cố
Ví dụ 7: Một hộp có 10 bi gồm: 6 bi đỏ, 4 bi xanh.
Lấy ngẫu nhiên 3 bi từ hộp. Gọi các biến cố
A: “Lấy được ít nhất 1 bi đỏ”,
B: “Lấy được 3 bi đỏ”,
C: “Lấy được cùng lắm 2 bi đỏ”.
Xác định quan hệ của A và B; của A và C.
LÊ HỮU KỲ SƠN 10
Không gian mẫu và biến cố
Ví dụ 8: Chọn ngẫu nhiên 1 sinh viên trong lớp học.
Gọi A: “Sinh viên được chọn giỏi Tiếng Anh”,
B: “Sinh viên được chọn giỏi Toán”.
Hãy xác định biến cố: A+B; AB.
LÊ HỮU KỲ SƠN 11
Không gian mẫu và biến cố
Ví dụ 9: Hai sinh viên thi hết môn xác suất thống kê.
Gọi A: “Sinh viên thứ nhất thi đậu”,
B: “Sinh viên thứ hai thi đậu”.
C: “Có ít nhất một sinh viên thi đậu”.
Hãy biểu diễn C qua A, B.
LÊ HỮU KỲ SƠN 12
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
3
Không gian mẫu và biến cố
Ví dụ 10: Kiểm tra 5 bóng đèn trong một lô bóng
đèn. Gọi Ai: “Bóng đèn thứ i tốt” (i=1,2,3,4,5). Gọi B:
“Cả 5 bóng đèn đều tốt”. Hãy biểu diễn B qua các
biến cố Ai.
LÊ HỮU KỲ SƠN 13
Định nghĩa cổ điển của xác suất
trong đó các biến cố sơ cấp đồng khả năng.
1 2 nS , , , Phép thử có không gian mẫu
Cho biến cố A có kA biến cố sơ cấp. Khi đó, xác
suất của A được ký hiệu và cho bởi công thức
AkP(A) .
n
LÊ HỮU KỲ SƠN 14
Định nghĩa cổ điển của xác suất
Ví dụ 11: Gieo con xúc xắc cân đối và đồng chất 1
lần. Tính xác suất để:
1. Mặt trên con xúc xắc có một chấm;
2. Mặt trên con xúc xắc có số chấm là số chẵn.
LÊ HỮU KỲ SƠN 15
Định nghĩa cổ điển của xác suất
Ví dụ 12: Một lớp học có 30 học sinh, trong đó có
10 nữ. Chọn ngẫu nhiên 3 người trực lớp. Tính xác
suất của biến cố trong 3 người được chọn có đúng
1 người nữ.
LÊ HỮU KỲ SƠN 16
Định nghĩa cổ điển của xác suất
Ví dụ 13: Một hộp có 7 chính phẩm và 3 phế phẩm.
1. Lấy ngẫu nhiên 1 sản phẩm từ hộp. Tính xác
suất lấy được phế phẩm.
2. Lấy ngẫu nhiên 2 sản phẩm từ hộp. Tính xác
suất lấy được 2 phế phẩm.
3. Lấy ngẫu nhiên có hoàn lại lần lượt từng sản
phẩm ra 2 sản phẩm. Tính xác suất lấy được 2
phế phẩm.
LÊ HỮU KỲ SƠN 17
Định nghĩa thống kê của xác suất
Giả sử ta thực hiện n lần một phép thử, biến cố A
xuất hiện k lần. Ta gọi
là tần suất xuất hiện của biến cố A.
• Với n đủ lớn, ta định nghĩa:
n
kf (A)
n
nP(A) f (A)
Ví dụ 14: Quan sát 10.000 em bé mới sinh, thấy có
5097 bé trai. Gọi A là biến cố em bé mới sinh là
con trai. Tính P(A). LÊ HỮU KỲ SƠN 18
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
4
Định nghĩa hình học của xác suất
Cho miền . Gọi độ đo của
là độ dài, diện tích, thể tích
(ứng với là đường cong,
miền phẳng, khối). Xét điểm
M rơi ngẫu nhiên vào miền .
Gọi A: “điểm M rơi vào miền ”, ta có S
độ đo của ( )P A độ đo của S
LÊ HỮU KỲ SƠN 19
Định nghĩa hình học của xác suất
Ví dụ 15: Tìm xác suất của điểm M rơi vào hình tròn
nội tiếp tam giác đều có cạnh 2 cm.
Giải. Gọi A: “điểm M rơi vào hình tròn nội tiếp”.
Diện tích của tam giác là:
2
22 . 3( ) 3
4dt cm .
Bán kính của hình tròn là:
1 2 3 3.3 2 3
r cm
23
( ) ( ) 0,60463 3 3 3
dt S P A . LÊ HỮU KỲ SƠN 20
Các tính chất của xác suất
P( ) 0 1.
2.
3.
P(S) 1
0 P(A) 1, A S.
4. A B P A P B .
LÊ HỮU KỲ SƠN 21
Công thức cộng xác suất
Giả sử A và B là hai biến cố bất kỳ trong một phép
thử. Khi đó, ta có
P(A B) P(A) P(B) P(A B) (1)
Hệ quả 1: Nếu A và B xung khắc thì
xungkhac
P(A B) P(A) P(B).(2)
P(A) 1 P(A)
Hệ quả 2: Cho A là biến cố bất kỳ. Khi đó
(3) LÊ HỮU KỲ SƠN 22
Công thức cộng xác suất
Ví dụ 16: Một lớp có 100 sinh viên (SV) trong đó có
50 SV thích xem bóng đá, 20 SV thích nghe nhạc, 10
SV thích xem bóng đá và nghe nhạc. Chọn ngẫu
nhiên 1 SV của lớp. Tính xác suất SV này thích xem
bóng đá hay thích nghe nhạc.
LÊ HỮU KỲ SƠN 23
Công thức cộng xác suất
Ví dụ 17: Một hộp đựng 20 bi, trong đó có 10 bi đỏ.
Chọn ngẫu nhiên 8 bi từ hộp. Tính xác suất có ít nhất
1 bi đỏ trong 8 bi được chọn.
LÊ HỮU KỲ SƠN 24
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
5
Xác suất có điều kiện
Giả sử A và B là hai biến cố và Xác suất
của biến cố A với điều kiện biến cố B đã xảy ra
được ký hiệu và cho bởi công thức:
P(B) 0.
P(AB)
P A | B .P(B)
Ví dụ 18: Một nhóm 10 sinh viên gồm 3 nam và 7
nữ, trong đó có 2 nam 18 tuổi và 3 nữ 18 tuổi.
Chọn ngẫu nhiên một sinh viên từ nhóm đó. Gọi
biến cố A: “Sinh viên được chọn là nữ”, B: “Sinh
viên được chọn là 18 tuổi”. Tính P(A|B), P(B|A). LÊ HỮU KỲ SƠN 25
Xác suất có điều kiện
Ví dụ 19: Một lớp có 50 sinh viên trong đó có 20 nữ
và 30 nam. Trong kỳ thi môn Toán có 10 sinh viên
đạt điểm giỏi, gồm 6 nam và 4 nữ. Gọi tên ngẫu
nhiên 1 sinh viên trong danh sách lớp. Tìm xác suất
gọi được sinh viên giỏi môn Toán biết rằng sinh
viên đó là nữ.
LÊ HỮU KỲ SƠN 26
Xác suất có điều kiện
Ví dụ 20: Một hộp có 5 bi đỏ và 3 bi xanh. Từ hộp
này, lấy ngẫu nhiên lần lượt ra 2 bi, mỗi lần lấy 1 bi,
lấy không hoàn lại. Tính xác suất lần thứ hai lấy
được bi xanh biết rằng lần thứ nhất đã lấy được bi
đỏ.
LÊ HỮU KỲ SƠN 27
Công thức nhân xác suất
• Với A, B là hai biến cố bất kỳ, ta có
P(AB) P(A) P(B | A) P B P A |B
1 2 n 1 2 1 n 1 n 1P(A A ...A ) P(A )P A | A ...P A | A ...A
• Cho dãy biến cố . Khi đó, ta có 1 2 nA ,A ,...,A
LÊ HỮU KỲ SƠN 28
Công thức nhân xác suất
Ví dụ 21: Một hộp có 10 sản phẩm, gồm 8 sản
phẩm tốt và 2 phế phẩm. Một người lấy ngẫu nhiên
từng sản phẩm cho tới khi gặp phế phẩm thì dừng.
Tính xác suất để người này dừng lại ở lần thứ ba.
LÊ HỮU KỲ SƠN 29
Công thức nhân xác suất
Ví dụ 22: Một sinh viên học hệ niên chế được học
lại một lần nếu lần thứ nhất bị rớt. Biết rằng xác suất
sinh viên này thi đỗ lần 1 và lần 2 tương ứng là 0,6
và 0,8. Tính xác suất sinh viên này hoàn thành môn
học.
LÊ HỮU KỲ SƠN 30
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
6
Công thức nhân xác suất
Ví dụ 23: Một sản phẩm xuất xưởng phải qua 3 lần
kiểm tra. Xác suất để một phế phẩm bị loại ở lần
kiểm tra đầu là 0,8; nếu lần kiểm tra đầu không bi
loại thì xác suất nó bị loại ở lần kiểm tra thứ hai là
0,9; tương tự nếu lần thứ hai cũng không bi loại thì
xác suất nó bị loại ở lần kiểm tra thứ ba là 0,95.
Tính xác suất để một phế phẩm bi loại khi kiểm tra.
Đáp số: 0,999.
LÊ HỮU KỲ SƠN 31
Hai biến cố độc lập
Nói cách khác, A, B là độc lập nếu A có xảy ra hay
không thì cũng không ảnh hưởng đến khả năng xảy
ra của B và ngược lại.
• Hai biến cố A và B được gọi là độc lập nếu
P(A |B) P(A) hoặc P(B | A) P(B).
Định lý: Hai biến cố A, B độc lập nếu và chỉ nếu
P(AB) P(A).P(B)
LÊ HỮU KỲ SƠN 32
Hai biến cố độc lập
Việc kiểm tra tính độc lập bằng định nghĩa trong
nhiều bài toán là khó. Do đó, người ta thường dựa
vào thực tế để thừa nhận nó.
Ví dụ 24: Tung 2 đồng xu. Gọi
A : “đồng xu thứ nhất xuất hiện mặt số”,
B : “đồng xu thứ hai xuất hiện mặt hình”,
C : “có ít nhất một mặt số xuất hiện”.
Hỏi A và B có độc lập? A và C có độc lập?
LÊ HỮU KỲ SƠN 33
Hai biến cố độc lập
A, B độc lập A,B độc lập
A,B độc lập
A,B độc lập.
Định lý:
Ví dụ 25: Một phân xưởng có 3 máy hoạt động độc
lập nhau. Xác suất các máy trong ngày bị hỏng lần
lượt là: 0,1; 0,2; 0,15. Tính xác suất:
1. Có một đúng một máy hỏng trong ngày.
2. Có ít nhất hai máy hỏng trong ngày.
LÊ HỮU KỲ SƠN 34
Công thức xác suất đầy đủ và Bayes
• Hệ các biến cố được gọi là đầy đủ
nếu có duy nhất một biến cố trong hệ xảy ra khi
thực hiện phép thử.
i i 1,...,nA
Nói cách khác, hệ đầy đủ nếu i i 1,...,nA
i j
1 2 n
A A , i j,
A A ... A S.
LÊ HỮU KỲ SƠN 35
Ví dụ 26: Trộn lẫn hai bao lúa vào nhau rồi từ đó
bốc ra 1 hạt lúa. Gọi
A1: “Hạt lúa được chọn là của bao thứ nhất”,
A2: “Hạt lúa được chọn là của bao thứ hai”.
Khi đó, hệ {A1, A2} đầy đủ.
Công thức xác suất đầy đủ và Bayes
LÊ HỮU KỲ SƠN 36
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
7
Công thức xác suất đầy đủ và Bayes
1A2A n 1A
nA
1A B 2A B n 1A B nA B
B
LÊ HỮU KỲ SƠN 37
n
i i
i 1
P(B) P(A )P(B | A )
(1)
Trong phép thử, cho hệ đầy đủ các biến cố
và B là một biến cố bất kỳ trong phép thử. Khi đó
i i 1,...,nA
i i
i
P A .P B | AP(A | B)
P B (2)
(1): công thức XS đầy đủ; (2): công thức Bayes.
Công thức xác suất đầy đủ và Bayes
LÊ HỮU KỲ SƠN 38
Ví dụ 27: Có 3 lô sản phẩm, tỷ lệ phế phẩm của
từng lô tương ứng là 6%, 2%, 1%. Chọn ngẫu
nhiên một lô, rồi từ lô này chọn ngẫu nhiên một
sản phẩm.
1. Tìm xác suất để lấy được phế phẩm.
2. Biết lấy được phế phẩm. Tìm xác suất được
chọn của từng lô hàng.
Công thức xác suất đầy đủ và Bayes
LÊ HỮU KỲ SƠN 39
Ví dụ 28: Một nhà máy sản xuất bóng đèn có hai
phân xưởng I và II. Phân xưởng II sản xuất gấp 4
lần phân xưởng I. Tỷ lệ bóng hư của phân xưởng I
là 10%, của phân xưởng II là 20%. Mua một bóng
đèn do nhà máy này sản xuất.
1. Tính xác suất để mua được bóng tốt.
2. Biết rằng đã mua được bóng tốt, tính xác suất
để bóng đèn này do phân xưởng I sản xuất.
Công thức xác suất đầy đủ và Bayes
LÊ HỮU KỲ SƠN 40
Ví dụ 29: Một thùng phiếu gồm 10 phiếu, trong đó
chỉ có 2 phiếu trúng thưởng. Có 2 người lần lượt
rút thăm, mỗi người chỉ rút 1 phiếu. Tìm xác suất
trúng thưởng của người rút lần thứ hai.
Công thức xác suất đầy đủ và Bayes
LÊ HỮU KỲ SƠN 41
BIẾN SỐ NGẪU NHIÊN
CHƯƠNG 2
LÊ HỮU KỲ SƠN 42
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
8
Nội dung chính
Biến số ngẫu nhiên
Biến ngẫu nhiên rời rạc
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 43
• Một đại lượng mà giá trị của nó là ngẫu nhiên,
không dự đoán trước được, được gọi là một biến
số ngẫu nhiên (hay biến ngẫu nhiên, đại lượng
ngẫu nhiên).
• Chúng ta thường ký hiệu biến số ngẫu nhiên
bằng các chữ cái in hoa X, Y, Z, …
Biến số ngẫu nhiên
LÊ HỮU KỲ SƠN 44
Ví dụ 2: Tung một đồng xu cho đến khi được mặt
ngữa thì dừng. Gọi X là số lần tung. Khi đó, X cũng
là biến số ngẫu nhiên.
Ví dụ 1: Một hộp có 7 bi trắng và 3 bi đen. Lấy
ngẫu nhiên cùng lúc 4 bi từ hộp. Gọi X là số bi
trắng có trong 4 bi lấy ra. Khi đó, X là một biến số
ngẫu nhiên.
Biến số ngẫu nhiên
LÊ HỮU KỲ SƠN 45
Ví dụ 3: Gọi X là chiều cao của con người. Khi đó,
X cũng là biến số ngẫu nhiên.
Biến số ngẫu nhiên
LÊ HỮU KỲ SƠN 46
Ta chia các biến ngẫu nhiên thành 2 loại:
Biến ngẫu nhiên X được gọi là rời rạc nếu nó chỉ
nhận hữu hạn các giá trị hoặc một số vô hạn đếm
được các giá trị.
Biến ngẫu nhiên X được gọi là liên tục nếu tập giá
trị của nó là một hay một số khoảng của trục số,
thậm chí là cả trục số thực.
Biến số ngẫu nhiên
LÊ HỮU KỲ SƠN 47
X
P
k kp P(X x ), k 1, 2,..., n.
Bảng sau đây được gọi là bảng phân phối (phân
bố) xác suất của X:
1x 2x 3xnx
1p2p
3p np
Ta đặt:
Biến ngẫu nhiên rời rạc
1 2 nX {x ,x , ,x },Xét với 1 2 nx x ... x .
LÊ HỮU KỲ SƠN 48
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
9
Ví dụ 4: Một hộp đựng 4 quả cầu giống nhau đánh
số 1, 2, 3, 4. Chọn ngẫu nhiên 2 quả. Gọi X là tổng
hai số ghi trên hai quả đó. Lập bảng PPXS của X.
Ví dụ 5: Một hộp kín có chứa 10 bi, gồm: 7 bi đỏ, 3
bi đen. Chọn ngẫu nhiên 4 bi từ hộp. Gọi X là số bi
đen có trong 4 bi. Lập bảng PPXS cho X.
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 49
1 2 n1. p p ... p 1.
1 2 n2. x x ,x ,....,x ,... P X x 0.
k
k
k: a x b
3. P a X b p .
Cho BNN rời rạc X có bảng phân phối xác suất
X
P
1x 2x 3xnx
1p2p
3p np
Ta có một số tính chất sau:
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 50
Biến ngẫu nhiên rời rạc
Ví dụ 6: Một xạ thủ có 4 viên đạn, bắn lần lượt từng
viên vào một mục tiêu một cách độc lập. Xác suất
trúng mục tiêu ở mỗi lần bắn là 0,8. Biết rằng nếu
có một viên trúng mục tiêu hay hết đạn thì dừng.
Gọi X là số viên đạn xạ thủ đã bắn.
1. Lập bảng PPXS cho X.
2. Tính P 1 X 3 , P X 2 , P X 3 .
LÊ HỮU KỲ SƠN 51
Biến ngẫu nhiên rời rạc
• Cho X là một biến ngẫu nhiên rời rạc. Hàm phân
phối xác suất của X là hàm số được ký hiệu và định
nghĩa như sau:
F(x) P(X x), x R.
• Hàm phân phối có các tính chất:
x x2. lim F(x) 0, lim F(x) 1.
3. P(a X b) F(b) F(a).
1. F(x) là hàm tăng.
LÊ HỮU KỲ SƠN 52
Biến ngẫu nhiên rời rạc
Ví dụ 7: Tung hai đồng xu cân đối, đồng chất. Gọi X
là số mặt ngửa xuất hiện. Tìm hàm phân phối xác
suất của X.
• Cho X là một biến ngẫu nhiên rời rạc. Hàm mật độ
xác suất của X là hàm số được ký hiệu và định nghĩa
như sau:
k k
k
p , x x ,f x
0, x x .
LÊ HỮU KỲ SƠN 53
Biến ngẫu nhiên rời rạc
• Giả sử BNN rời rạc X có bảng phân phối xác suất
X 1x 2x nx
1p 2pnpP
Kỳ vọng của X được định nghĩa bởi:
n
1 1 n n k k
k 1
E X x p ... x p x p .
LÊ HỮU KỲ SƠN 54
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
10
Ví dụ 8: Giả sử BNN X có bảng phân phối xác suất
1 1 1 1 1 1
E X 1. 2. 3. 4. 5. 6. 3,5.6 6 6 6 6 6
Kỳ vọng của X là
p
X 1 2 3 4 5 61
6
1
6
1
6
1
6
1
6
1
6
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 55
Kỳ vọng là giá trị trung bình (theo xác suất) của
biến ngẫu nhiên X, nó phản ánh giá trị trung tâm
phân phối xác suất của X.
Trong thực tế sản xuất hay kinh doanh nếu cần
chọn phương án cho năng suất (hay lợi nhuận) cao,
người ta chọn phương án sao cho năng suất kỳ vọng
(hay lợi nhuận kỳ vọng) cao.
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 56
Ví dụ 9: Một thống kê cho biết tỷ lệ tai nạn xe máy ở
thành phố H là 0,001. Công ty bảo hiểm A đề nghị
bán loại bảo hiểm tai nạn xe máy cho ông B ở thành
phố H trong một năm với số tiền chi trả là 10 triệu
đồng, phí bảo hiểm là 0,1 triệu đồng. Hỏi trung bình
công ty A lãi bao nhiêu khi bán bảo hiểm cho ông B?
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 57
Ví dụ 10: Ông A tham gia chơi một trò đỏ, đen như
sau: Trong một hộp có 4 bi đỏ và 6 bi đen. Mỗi lần
ông A lấy ra 1 bi: nếu là đỏ thì được thưởng 100
ngàn đồng, nếu là đen thì bị mất 70 ngàn đồng. Hỏi
trung bình mỗi lần lấy bi, ông A nhận được bao nhiêu
tiền ?
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 58
1. E(C) C, E(aX) aE(X)
2. Cộng tính: E(X Y) E(X) E(Y)
3. Đơn điệu: X Y E(X) E(Y)
Tính chất:
Biến ngẫu nhiên rời rạc
4. Nếu X, Y là hai biến ngẫu nhiên độc lập thì
E(XY) E(X)E(Y)
LÊ HỮU KỲ SƠN 59
Phương sai của X là đại lượng được xác định bởi
n
2
k k
k 1
Var X p x EX .
Biến ngẫu nhiên rời rạc
• Giả sử BNN rời rạc X có bảng phân phối xác suất
X 1x 2x nx
1p 2pnpP
Độ lệch chuẩn của X là: X Var X .
LÊ HỮU KỲ SƠN 60
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
11
• Mốt của X, ký hiệu bởi Mod(X), là giá trị của X mà
tại đó xác suất cao nhất.
Biến ngẫu nhiên rời rạc
1 2 nMod X a P X a max p ,p ,...,p .
LÊ HỮU KỲ SƠN 61
n
22
k k
k 1
Var X x p EX .
Mệnh đề: Ta có
Ví dụ 11: Cho X có bảng phân phối xác suất
P
X 31 0
0,50,2 0,3
Tìm kỳ vọng, phương sai và độ lệch chuẩn của X.
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 62
Do X – E(X) là độ lệch giữa giá trị của X so với
trung bình của nó nên phương sai là trung bình
của bình phương độ lệch đó. Phương sai dùng
để đo mức độ phân tán của X quanh kỳ vọng.
Nghĩa là: phương sai nhỏ thì độ phân tán nhỏ
nên độ tập trung lớn, và ngược lại.
Trong kỹ thuật, phương sai đặc trưng cho độ
sai số của thiết bị sản xuất. Trong kinh doanh,
phương sai đặc trưng cho độ rủi ro đầu tư.
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 63
1. 2Var C 0, Var(aX) a Var X
3. Nếu X, Y là hai biến ngẫu nhiên độc lập thì
Var(X Y) Var(X) Var(Y)
Tính chất:
2. Var a X Var X
Biến ngẫu nhiên rời rạc
LÊ HỮU KỲ SƠN 64
• Cho X là một biến ngẫu nhiên liên tục. Hàm số
được gọi là hàm mật độ xác suất của X
nếu nó thỏa hai điều kiện sau:
f :R R
a) f x 0, x R;
b) f x dx 1.
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 65
Ví dụ 12: Cho hàm số
2x, x [0;1]f(x)
0, x [0;1]
Chứng tỏ f(x) là hàm mật độ của một BNN liên
tục X.
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 66
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
12
Mệnh đề: Cho X là một biến ngẫu nhiên liên tục
có hàm mật độ . Khi đó f x
b
a
P a X b f x dx, a,b R .
Hệ quả: Nếu X là một biến ngẫu nhiên liên tục có
hàm mật độ thì f x 0 0P X x 0, x R.
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 67
Hệ quả: Cho X là một biến ngẫu nhiên liên tục có
hàm mật độ . Khi đó f x
P(a X b)
P(a X b).
P(a X b)
P(a X b)
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 68
Ví dụ 13: Cho X là một biến ngẫu nhiên liên tục
có hàm mật độ
3ax , x 0;2 ,f x
0, x 0;2 .
a) Hãy xác định giá trị của tham số a.
b) Tính:
1 1P 0 X , P 1 X 1 , P X .
2 3
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 69
Mệnh đề: Nếu X là BNN liên tục có hàm mật độ
f(x) thì x
F x : P X x f t dt, x .
Ví dụ 14: Cho BNN liên tục X có hàm mật độ
23x , x 0;1 ,f x
0, x 0;1 .
Tìm hàm phân phối xác suất của X.
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 70
• Cho BNN liên tục X có hàm mật độ f(x). Kỳ vọng
của X được định nghĩa là
E X xf x dx.
Biến ngẫu nhiên liên tục
• Phương sai của biến ngẫu nhiên liên tục X là đại
lượng
2 2Var X E X EX x EX f x dx.
LÊ HỮU KỲ SƠN 71
• Độ lệch tiêu chuẩn: X Var X
Biến ngẫu nhiên liên tục
• Mốt của biến ngẫu nhiên liên tục X, ký hiệu bởi
Mod(X), là giá trị của X mà tại đó hàm mật độ xác
suất đạt giá trị lớn nhất.
LÊ HỮU KỲ SƠN 72
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
13
Biến ngẫu nhiên liên tục
Mệnh đề: Nếu X là biến ngẫu nhiên liên tục có hàm
mật độ f(x) thì
2
2Var X x f x dx xf x dx .
LÊ HỮU KỲ SƠN 73
Ví dụ 15: Cho BNN liên tục X có hàm mật độ
2x, x [0;1]f(x)
0, x [0;1]
Tính kỳ vọng, phương sai, độ lệch chuẩn của X.
Biến ngẫu nhiên liên tục
LÊ HỮU KỲ SƠN 74
Biến ngẫu nhiên liên tục
Ví dụ 16: Cho BNN liên tục X có hàm mật độ
axae , x 0,f(x)
0, x 0.
Tính kỳ vọng, phương sai, độ lệch chuẩn của X.
LÊ HỮU KỲ SƠN 75
CÁC PHÂN PHỐI
XÁC SUẤT THÔNG DỤNG
CHƯƠNG 3
LÊ HỮU KỲ SƠN 76
Nội dung chính
Phân phối siêu bội
Phân phối nhị thức
Phân phối Poisson
Phân phối Gauss
Phân phối chuẩn
Xấp xỉ các loại phân phối
Phân phối Chi-bình phương
Phân phối Student
LÊ HỮU KỲ SƠN 77
Bài toán: Cho một tập hợp có N phần tử, trong đó
có NA phần tử có tính chất A. Từ tập hợp, lấy ngẫu
nhiên n phần tử.
Gọi X là số phần tử có tính chất A lẫn trong n phần
tử lấy ra. Hãy lập bảng phân phối xác suất của X.
Phân phối siêu bội Phân phối siêu bội Phân phối siêu bội
LÊ HỮU KỲ SƠN 78
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
14
Phân phối siêu bội
N
n
AN AN N
LÊ HỮU KỲ SƠN 79
A A
k n k
N N N
n
N
C CP X k , k 0,1...,n.
C
AX ~ H N; N ; n .
Định nghĩa: Biến ngẫu nhiên X được gọi là có phân
phối siêu bội (hypergeometric distribution) với ba
tham số N, NA , n nếu
Ký hiệu:
Phân phối siêu bội
LÊ HỮU KỲ SƠN 80
Ví dụ 1: Một hộp có 15 quả cam trong đó có 5 quả
hư. Từ hộp ta lấy ngẫu nhiên ra 3 quả. Gọi X là số
quả hư có trong 3 quả lấy ra.
1. Lập bảng phân phối xác suất của X.
2. Tính kỳ vọng và phương sai của X.
3. Tính xác suất để có ít nhất 1 quả hư trong 3 quả
lấy ra.
Phân phối siêu bội
LÊ HỮU KỲ SƠN 81
AX ~ H N; N ; n .Cho Đặt Khi đó
N nE X np, Var X npq .
N 1
ANp , q 1 p.
N
Phân phối siêu bội
LÊ HỮU KỲ SƠN 82
Ví dụ 2: Từ một công trình xây dựng có 100 người
đang làm việc trong đó có 85 công nhân, chọn ra
một nhóm gồm 30 người. Gọi X là số công nhân
chọn được.
1. Tính xác suất chọn được từ 20 đến 22 công
nhân.
2. Tính trung bình số công nhân chọn được và
phương sai của X.
Phân phối siêu bội
LÊ HỮU KỲ SƠN 83
Một dãy gồm n phép thử ngẫu nhiên được gọi là
dãy phép thử Bernoulli nếu nó thỏa 3 điều kiện:
Các phép thử phải độc lập với nhau.
Ở mỗi phép thử, ta chỉ quan tâm đến một biến
cố A nào đó. Nếu A xảy ra, ta nói phép thử là
“thành công”. Nếu A không xảy ra, ta nói phép
thử “thất bại”.
Xác suất “thành công”, p = P(A), là không đổi
qua n phép thử.
Phân phối nhị thức
LÊ HỮU KỲ SƠN 84
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
15
Ví dụ 3: Tung một đồng xu (gồm hai mặt là số và
hình) cân đối, đồng chất 10 lần.
Ở mỗi lần tung, ta xem biến cố A: “mặt số xuất
hiện” có xảy ra hay không.
Xác suất xuất hiện mặt số ở mỗi lần tung là 0,5.
Do đó, đây là dãy gồm 10 phép thử Bernoulli.
Phân phối nhị thức
LÊ HỮU KỲ SƠN 85
Ví dụ 4: Một sinh viên trả lời 20 câu hỏi trắc nghiệm
một cách ngẫu nhiên. Mỗi câu hỏi có 4 phương án
trả lời, trong đó chỉ có 1 phương án đúng. Ở mỗi câu
trả lời, ta chỉ quan tâm sinh viên này trả lời đúng hay
không. Đây là dãy phép thử Bernoulli.
Phân phối nhị thức
LÊ HỮU KỲ SƠN 86
Bài toán: Thực hiện dãy gồm n phép thử
Bernoulli với xác suất “thành công” là p.
Gọi X là biến số ngẫu nhiên chỉ số lần “thành
công” trong n lần thử.
Lập bảng phân phối xác suất cho X.
Phân phối nhị thức
LÊ HỮU KỲ SƠN 87
• Cho X ~ B(n,p). Khi đó kỳ vọng, phương sai và mốt
của X được cho bởi:
E X np, Var X npq, Mod X np q; np q 1 .
Phân phối nhị thức
Định nghĩa: Biến ngẫu nhiên rời rạc X được gọi là
có phân phối nhị thức (binomial distribution) với hai
tham số n và p nếu:
k k n k
nP X k C p q , q 1 p .
Ký hiệu: X ~ B(n; p).
LÊ HỮU KỲ SƠN 88
Ví dụ 5: Ông A trồng 100 cây Bạch Đàn với xác
suất cây chết là 2%. Gọi X là số cây Bạch Đàn
chết.
1) Tính xác suất có từ 3 đến 5 cây Bạch Đàn chết.
2) Tính trung bình số cây Bạch Đàn chết.
3) Hỏi ông A cần phải trồng tối thiểu bao nhiêu cây
Bạch Đàn để xác suất có ít nhất một cây chết
lớn hơn 10% ?
ĐS: 1) 0,3078; 2) 2 cây; 3) 6 cây.
Phân phối nhị thức
LÊ HỮU KỲ SƠN 89
Ví dụ 6: Trong một vùng dân cư có 65% gia đình có
máy giặt, chọn ngẫu nhiên 12 gia đình. Tính xác
suất:
1) Chọn được 5 gia đình có máy giặt;
2) Chọn được ít nhất 2 gia đình có máy giặt.
ĐS: 1) 0,0591; 2) 0,999.
Phân phối nhị thức
LÊ HỮU KỲ SƠN 90
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
16
Phân phối Poisson
Bài toán: Ta quan tâm đến sự xuất hiện của biến
cố A trong khoảng thời gian (t1; t2). Giả thiết rằng:
Sự xuất hiện A trong khoảng thời gian (t1; t2)
không ảnh hưởng đến cơ may xuất hiện A trong
các khoảng thời gian kế tiếp;
Cơ may xuất hiện A trong khoảng thời gian (t1; t2)
tỷ lệ thuận với độ dài khoảng (t1; t2).
Gọi X là số lần xuất hiện biến cố A trong khoảng thời
gian (t1; t2). Lập bảng phân phối cho X. LÊ HỮU KỲ SƠN 91
Phân phối Poisson
Định nghĩa: Biến số ngẫu nhiên X được gọi là có
phân phối Possion với tham số nếu X =
{0,1,2,…,n,…} và
0
ke
P X k , k 0,1,2,...k!
trong đó là trung bình số lần xuất hiện biến
cố mà ta quan tâm trong khoảng thời gian (t1; t2).
Ký hiệu: X ~ P .
LÊ HỮU KỲ SƠN 92
Phân phối Poisson
Ví dụ 7: Quan sát tại siêu thị A thì thấy trung bình 5
phút có 18 khách đến mua hàng.
1) Tính xác suất có 25 khách hàng đến siêu thị A
trong 7 phút.
2) Tính xác suất có từ 3 đến 5 khách hàng đến siêu
thị A trong 2 phút.
Đáp số: 1) 0,0795; 2) 0,2504.
• Nếu thì X ~ P EX Var X ; modX 1;
LÊ HỮU KỲ SƠN 93
Phân phối Poisson
Ví dụ 8: Một trung tâm bưu điện nhận được trung
bình 3 cuộc điện thoại trong mỗi phút. Tính xác suất
để trung tâm này:
1) Nhận được 7 cuộc điện thoại trong 2 phút.
2) Tính số cuộc điện thoại chắc chắn nhất mà trung
tâm nhận được trong khoảng thời gian 4 phút.
LÊ HỮU KỲ SƠN 94
Phân phối Poisson
Ví dụ 9: Số khách đến mua hàng tại một quầy hàng
là biến ngẫu nhiên, trung bình cứ 3 phút có 1 người.
Năng lực phục vụ khách của quầy hàng thường
xuyên là: 2 người được phục vụ trong 5 phút (khách
không phải chờ một cách đáng kể, nghĩa là không
phải chờ quá 2 phút). Tính xác suất:
1) Có 2 khách hàng trong 30 giây.
2) Có khách bị chờ một cách đáng kể.
LÊ HỮU KỲ SƠN 95
Định nghĩa: Biến ngẫu nhiên liên tục Z được gọi là
có phân phối Gauss (hay phân phối chuẩn tắc) nếu
hàm mật độ xác suất của nó có dạng
2x
21
f x e , x R.2
Ký hiệu: Z ~ N(0; 1).
• Các số đặc trưng: Mod Z E Z 0; Var Z 1.
Phân phối chuẩn tắc Phân phối Gauss
LÊ HỮU KỲ SƠN 96
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
17
Phân phối chuẩn tắc Phân phối Gauss
O
2x
21
y e2
x
1
2
LÊ HỮU KỲ SƠN 97
• Hàm Laplace: là hàm số có dạng
2x x t
2
0 0
1x f t dt e dt, x R.
2
• Các tính chất của hàm Laplace:
a) Hàm số tăng và là hàm lẻ trên R.
Các giá trị của hàm Laplace được cho ở bảng B.
b) 0,5; 0,5.
c) Xác suất P a Z b b a .
Phân phối Gauss
LÊ HỮU KỲ SƠN 98
Phân phối Gauss
Ví dụ 10: Cho Z ~ N(0;1). Tính các xác suất sau:
a) P 1,24 Z 3,21
b) P 2,17 Z 2,48
c) P Z 1,34
d) P Z 1,27
LÊ HỮU KỲ SƠN 99
Phân phối Gauss
• Cho Giá trị được gọi là phân vị mức
của biến ngẫu nhiên Z ~ N(0;1) nếu:
0 1. t
P t Z t 1 .
• Công thức xác định của là: t
1t .
2
Ví dụ 11: Cho Z ~ N(0;1). Tìm phân vị mức
ĐS: 1,96.
0,05.
LÊ HỮU KỲ SƠN 100
Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là
có phân phối chuẩn nếu hàm mật độ xác suất của
nó có dạng
2
2
x
21
f x e , x R.2
• Các số đặc trưng: 2E X Mod X ; Var X .
Ký hiệu: 2X ~ N ; .
Phân phối chuẩn Phân phối chuẩn
LÊ HỮU KỲ SƠN 101
Phân phối chuẩn Phân phối chuẩn
LÊ HỮU KỲ SƠN 102
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
18
• Xác suất: Cho Khi đó
b aP a X b .
2X ~ N ; .
Phân phối chuẩn
• Nếu thì
XZ ~ N 0,1 . 2X ~ N ;
LÊ HỮU KỲ SƠN 103
Ví dụ 12: Đường kính của một loại chi tiết do một
máy sản xuất có phân phối chuẩn, kỳ vọng 20mm, độ
lệch chuẩn 0,2mm. Tính xác suất lấy ngẫu nhiên một
chi tiết:
1) Có đường kính trong khoảng 19,9mm đến
20,3mm.
2) Có đường kính sai khác với kỳ vọng không quá
0,3mm.
ĐS:
Phân phối chuẩn
LÊ HỮU KỲ SƠN 104
Ví dụ 13: Cho biến ngẫu nhiên X có phân phối
chuẩn với E(X) = 10 và P(10<X<20) = 0,3. Tính
P(5<X<15).
Đáp số:
Phân phối chuẩn
LÊ HỮU KỲ SƠN 105
Xấp xỉ các loại phân phối
Xấp xỉ phân phối siêu bội bởi phân phối nhị
thức
Cho . Nếu thì với X B n; pn N AX ~ H N; N ; n
Xấp xỉ phân phối nhị thức bởi phân phối
Poisson
Cho . Nếu n lớn, thì
X P , np.
np 5 X ~ B n;p
ANp .
N
LÊ HỮU KỲ SƠN 106
Xấp xỉ các loại phân phối
Xấp xỉ phân phối nhị thức bởi phân phối chuẩn
Cho . Nếu n lớn, thì
2 2X N ; , np, npq.
np 5, nq 5 X ~ B n;p
Cho . Nếu n lớn, thì
2k np1
P X k exp .2npq2 npq
np 5, nq 5 X ~ B n;p
LÊ HỮU KỲ SƠN 107
Xấp xỉ các loại phân phối
Ví dụ 14: Khi tiêm truyền một loại huyết thanh, trung
bình có 1 trường hợp phản ứng trên 1000 trường
hợp. Dùng loại huyết thanh này tiêm cho 2000
người. Tính xác suất:
1) Có 3 trường hợp phản ứng.
2) Có nhiều nhất 3 trường hợp phản ứng.
3) Có nhiều hơn 3 trường hợp phản ứng.
Đáp số: 1) 0,1805; 2) 0,86; c) 0,14.
LÊ HỮU KỲ SƠN 108
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
19
Xấp xỉ các loại phân phối
Ví dụ 15: Trong 10000 sản phẩm trên một dây
chuyền sản xuất, có 2000 sản phẩm không được
kiểm tra chất lượng. Tìm xác suất để trong 400 sản
phẩm sản xuất ra:
1) Có từ 70 đến 100 sản phẩm không được kiểm tra
chất lượng.
2) Có 80 sản phẩm không được kiểm tra chất lượng.
Đáp số: a) 0,8882 b) 0,0478.
LÊ HỮU KỲ SƠN 109
Xấp xỉ các loại phân phối
Ví dụ 16: Một khách sạn nhận đặt chỗ của 325
khách hàng cho 300 phòng vào ngày 1/9 vì theo kinh
nghiệm của những năm trước cho thấy tỷ lệ khách
đặt chỗ nhưng không đến là 10%. Tính xác suất:
1) Có 300 khách đến vào ngày 1/9 để nhận phòng.
2) Tất cả các khách đến vào ngày 1/9 đều nhận
được phòng.
Đáp số: 1) 0,0293; 2) 0,9177.
LÊ HỮU KỲ SƠN 110
Phân phối Chi–bình phương
• Biến ngẫu nhiên X được gọi là có phân phối Chi–
bình phương với n bậc tự do nếu
2 2 2
1 2 n kX Z Z ... Z ; Z ~ N 0,1 , k 1,2,...,n.
Ký hiệu: 2X ~ n .
• Nếu và X, Y độc lập nhau thì 2 2X ~ n , Y ~ m
2X Y ~ n m .
LÊ HỮU KỲ SƠN 111
Phân phối Chi–bình phương
• Nếu thì 2X ~ n E X n, Var X 2n.
• Nếu thì 2X ~ n
FX nN 0,1 .
2n
LÊ HỮU KỲ SƠN 112
Phân phối Student
• Biến ngẫu nhiên T được gọi là có phân phối
Student với n bậc tự do nếu
2UT , U ~ N 0,1 , V ~ n .
Vn
Ký hiệu: T ~ St n
LÊ HỮU KỲ SƠN 113
Phân phối Student
• Hàm mật độ của biến ngẫu nhiên T có phân phối
Student với n bậc tự do có dạng:
n 12 2
T
n 1
1 x2f x 1 , x .
n nn
2
LÊ HỮU KỲ SƠN 114
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
20
Phân phối Student
LÊ HỮU KỲ SƠN 115
Phân phối Student
• Nếu thì T ~ St n
nE T 0, Var T
n 2
Tính chất:
• Nếu thì T ~ St n FT N 0,1 .
Trong thực hành, khi với thì ta xem T ~ St n n 30
T N 0,1 .
LÊ HỮU KỲ SƠN 116
Phân phối Student
• Nếu thì T ~ St n FT N 0,1 .
• Trong thực hành, khi với thì ta
xem
T ~ St n n 30
T N 0,1 .
LÊ HỮU KỲ SƠN 117
MẪU THỐNG KÊ & ƯỚC
LƯỢNG THAM SỐ
CHƯƠNG 4
LÊ HỮU KỲ SƠN 118
Tổng thể và mẫu ngẫu nhiên
Các đặc trưng trên tổng thể
Các đặc trưng của mẫu
Ước lượng tham số trung bình trên tổng thể
Ước lượng tham số tỷ lệ trên tổng thể
Nội dung chính
LÊ HỮU KỲ SƠN 119
• Tập tất cả các đối tượng mà ta quan tâm nghiên cứu,
khảo sát được gọi là tổng thể. Số phần tử của tổng thể
được gọi là kích thước của tổng thể. Kích thước của
tổng thể thường rất lớn.
• Từ tổng thể, nếu ta chọn ra n phần tử để quan sát
một dấu hiệu nào đó thì n phần tử đó được gọi là một
mẫu có kích thước n.
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 120
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
21
• Mẫu được chọn ngẫu nhiên một cách khách quan
được gọi là mẫu ngẫu nhiên.
• Cơ bản, ta có 2 cách chọn mẫu: chọn mẫu không
hoàn lại và chọn mẫu có hoàn lại.
Khi mẫu có kích thước lớn, ta không phân biệt chọn
mẫu có hoàn lại hay không hoàn lại.
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 121
• Ta thường quan tâm đến 2 loại mẫu: mẫu định tính
và mẫu định lượng.
• Từ tổng thể, ta chọn một mẫu ngẫu nhiên có kích
thước n. Gọi X1, X2,…, Xn là các giá trị quan sát được.
Khi đó, ta xem X1, X2,…, Xn như là các biến ngẫu
nhiên độc lập và có cùng luật phân phối xác suất.
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 122
• Cho một ngẫu nhiên (X1, X2,…, Xn). Ta có 2 cách
sắp xếp các giá trị quan sát của mẫu:
+ Sắp theo bảng số liệu không tần số.
+ Sắp theo bảng số liệu có tần số.
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 123
VD 1. Theo dõi mức nguyên liệu hao phí để sản
xuất ra một đơn vị sản phẩm ở một nhà máy, ta
thu được các số liệu sau (đơn vị: gam)
20; 22; 21; 20; 22; 22; 20; 19; 20; 22; 21; 19; 19;
20; 18; 19; 20; 20; 18; 19; 20; 20; 21; 20; 18; 19;
19; 21; 22; 21; 21; 20; 19; 20; 22; 21; 21; 22; 20;
20; 20; 19; 20; 21; 19; 19; 20; 21; 21.
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 124
VD 2. Kiểm tra ngẫu nhiên điểm thi của 50
sinh viên, kết quả:
Điểm 2 4 5 6 7 8 9 10
Số SV) 4 6 20 10 5 2 2 1
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 125
VD 3. Đo chiều cao của n = 100 thanh niên, ta
có bảng số liệu ở dạng khoảng:
Chiều cao (cm) Số thanh niên
148 – 152
152 – 156
156 – 160
160 – 164
164 – 168
5
20
35
25
15
Tổng thể và mẫu ngẫu nhiên
LÊ HỮU KỲ SƠN 126
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
22
Tuy nhiên, do tổng thể thường có kích thước lớn
nên ta không xác định được các đặc trưng trên tổng
thể.
Một dấu hiệu trên tổng thể có 3 đặc trưng quan
trọng sau:
Trung bình của dấu hiệu trên tổng thể:
Phương sai của dấu hiệu trên tổng thể:
Tỷ lệ các phần tử có tính chất A của tổng thể: p
2
Các đặc trưng trên tổng thể
LÊ HỮU KỲ SƠN 127
• Trung bình mẫu:
n1 2 n
i
i 1
X X ... X 1X X .
n n
• Phương sai mẫu chưa hiệu chỉnh:
2 2
n 21 n2
i
i 1
X X ... X X 1S X X .
n n
• Độ lệch chuẩn mẫu chưa hiệu chỉnh: 2ˆ ˆS S .
Các đặc trưng của mẫu
LÊ HỮU KỲ SƠN 128
• Phương sai mẫu hiệu chỉnh:
2 2
n 21 n2
i
i 1
X X ... X X 1S X X .
n 1 n 1
• Độ lệch chuẩn mẫu hiệu chỉnh: 2S S .
Nhận xét:
2 2n ˆS S .n 1
Các đặc trưng của mẫu
LÊ HỮU KỲ SƠN 129
Các đặc trưng của mẫu
• Tỷ lệ phần tử có tính chất A trên mẫu:
n
n i
i 1
1F Y
n
trong đó
,
,
1
0
iYnếu quan sát thấy có tính chất A,
nếu quan sát thấy không có tính chất A.
LÊ HỮU KỲ SƠN 130
VD 4. Đo lượng huyết tương của 8 người mạnh
khoẻ, ta có
2,86 3,37 2,75 2,62 3,50 3,25 3,12 3,15
Hãy xác định các đặc trưng mẫu.
Các đặc trưng của mẫu
LÊ HỮU KỲ SƠN 131
VD 5. Quan sát thời gian cần thiết để sản xuất một
chi tiết máy, ta thu được bảng số liệu:
Khoảng thời gian (phút) Số lần quan sát
20-25
25-30
30-35
35-40
40-45
2
14
26
32
14
Tính trung bình mẫu, phương sai mẫu hiệu chỉnh.
Các đặc trưng của mẫu
LÊ HỮU KỲ SƠN 132
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
23
Định lý 1: Cho mẫu ngẫu nhiên độc lập, cùng phân
phối (X1, X2,…, Xn) với
Khi đó,
2
k kE X , Var X , k.
2
2 2
2 2
n n
E X , Var X ,n
n 1ˆE S ,n
E S ,
p 1 pE F p, Var F .
n
Các đặc trưng của mẫu
LÊ HỮU KỲ SƠN 133
Định lý 2 (Định lý Lindeberg - Lévy): Cho mẫu
ngẫu nhiên độc lập, cùng phân phối (X1, X2,…, Xn)
với Khi đó: 2
kX N ; , k 1,2,...,n.
2
2
2
2
X N ; ;n
n 1 S
a
b .) n 1
)
Các đặc trưng của mẫu
LÊ HỮU KỲ SƠN 134
Các đặc trưng của mẫu
Định lý 3: Cho mẫu ngẫu nhiên độc lập, cùng phân
phối (X1, X2,…, Xn) với
Khi đó, với n đủ lớn, ta có
2
X N ; .n
2
k kE X , Var X , k.
LÊ HỮU KỲ SƠN 135
Ước lượng trung bình trên tổng thể
Bài toán: Trên tổng thể, ta xét một dấu hiệu có phân
phối chuẩn với tham số chưa biết.
• Từ tổng thể, ta chọn mẫu ngẫu nhiên (X1, X2,…,Xn).
Khi đó,
• Dựa vào mẫu trên, hãy tìm sao cho
với cho trước.
2N ;
2
kX N ; , k 1,2,...,n.
1 2,
1 2P 1 ,
0,1
LÊ HỮU KỲ SƠN 136
Ước lượng trung bình trên tổng thể
Giải quyết
TH1: đã biết 2
22
kX N ; , k X N ;n
XZ n N 0;1
Với cho trước, ta tìm được (Tra bảng
B- bảng phân phối Gauss) sao cho
0,1
t
P t Z t 1
LÊ HỮU KỲ SƠN 137
Ước lượng trung bình trên tổng thể
XP t n t 1
P X t X t 1
n n
Vậy ta chọn
1 2X t , X t .
n n
LÊ HỮU KỲ SƠN 138
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
24
Ước lượng trung bình trên tổng thể
TH2: chưa biết 2
22
kX N ; , k X N ;n
XZ n N 0;1
2
2
2
n 1 SY n 1
Z XT n St n 1
SY
n 1LÊ HỮU KỲ SƠN 139
Ước lượng trung bình trên tổng thể
Với cho trước, ta tìm được (Tra bảng C
– Bảng phân phối Student) sao cho
0,1
n 1t
n 1 n 1P t T t 1
n 1 n 1XP t n t 1
S
n 1 n 1S SP X t X t 1 .
n n
Vậy ta chọn:
n 1 n 1
1 2
S SX t , X t .
n nLÊ HỮU KỲ SƠN 140
Ước lượng trung bình trên tổng thể
Lưu ý: Khi cỡ mẫu thì giá trị trong bảng C
trùng với giá trị trong bảng B.
n 1tn 30
t
• Khi ta có thì đại lượng: 1 2P 1
: độ tin cậy của ước lượng. 1
: khoảng ước lượng. 1 2,
: độ chính xác (sai số) của ước lượng.
2 1
2LÊ HỮU KỲ SƠN 141
Trong ứng dụng, ta có 4 trường hợp sau:
Trường hợp 1: và đã biết. n 30 2
- Xác định: X
- Xác định từ đẳng thức (Tra bảng B).
1
t2
t
- Xác định sai số:
t
n
- Khoảng ước lượng: X ; X
Ước lượng trung bình trên tổng thể
LÊ HỮU KỲ SƠN 142
Trường hợp 2: và chưa biết. n 30 2
- Xác định: X, S
- Xác định từ đẳng thức (Tra bảng B).
1
t2
t
- Xác định sai số:
St
n
- Khoảng ước lượng: X ; X
Ước lượng trung bình trên tổng thể
LÊ HỮU KỲ SƠN 143
Trường hợp 3: , đã biết và dấu hiệu
trên tổng thể có phân phối chuẩn.
n 30 2
Thực hiện tương tự như ở trường hợp 1.
Ước lượng trung bình trên tổng thể
LÊ HỮU KỲ SƠN 144
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
25
- Xác định: X, S
- Xác định phân vị (Tra bảng C).
n 1t
- Xác định sai số:
n 1 S
tn
- Khoảng ước lượng: X ; X
Trường hợp 4: , chưa biết và dấu hiệu
trên tổng thể có phân phối chuẩn.
n 30 2
Ước lượng trung bình trên tổng thể
LÊ HỮU KỲ SƠN 145
VD 6. Một chủ kho cung cấp muốn ước lượng lượng
sơn chứa trong một thùng được sản suất từ một dây
chuyền công nghệ quốc gia. Biết rằng, theo tiêu
chuẩn của dây chuyền công nghệ đó, độ lệch tiêu
chuẩn của lượng sơn là 0,08 thùng. Điều tra một
mẫu gồm 50 thùng sơn thì được lượng sơn trung
bình là 0,97 thùng. Với độ tin cậy 99%, hãy ước
lượng lượng sơn trung bình chứa trong một thùng.
Đáp số: [0,9408 thùng; 0,9992 thùng]
Ước lượng trung bình trên tổng thể
LÊ HỮU KỲ SƠN 146
Ước lượng trung bình trên tổng thể
VD 7. Đem cân một số trái cây vừa thu hoạch, ta
được kết quả sau:
X gam) 200-
210
210-
220
220-
230
230-
240
240-
250
Số trái 12 7 20 18 15
a) Tìm khoảng ước lượng cho trọng lượng trung
bình của một trái cây với độ tin cậy 95%.
b) Muốn sai số ước lượng không quá 2 gam ở độ
tin cậy 99% thì phải quan sát ít nhất bao nhiêu trái ?
Đáp số: a) [222,98g; 228,72g]; b) 293 trái. LÊ HỮU KỲ SƠN 147
Ước lượng trung bình trên tổng thể
VD 8. Đo đường kính của 100 trục máy do một nhà
máy sản xuất thì được bảng số liệu:
Đường kính (cm) 9,75 9,80 9,85 9,90
Số trục máy 5 37 42 16
a) Hãy ước lượng đường kính trung bình của một
trục máy ở độ tin cậy 97%.
b) Với độ chính xác 0,006 cm, hãy xác định độ tin
cậy.
LÊ HỮU KỲ SƠN 148
VD 9. Khảo sát trọng lượng (kg) của gà khi xuất
chuồng, người ta cân thử một số con và thu được
kết quả: 2,1; 1,8; 2,0; 2,3; 1,7; 1,5; 2,0; 2,2; 1,8.
Giả sử trọng lượng của gà là biến ngẫu nhiên có
phân phối chuẩn. Ở độ tin cậy 95%, hãy ước lượng
trọng lượng trung bình của gà khi xuất chuồng trong
hai trường hợp sau:
a) Biết độ lệch chuẩn là 0,3 kg.
b) Chưa biết độ lệch chuẩn.
Ước lượng trung bình trên tổng thể
LÊ HỮU KỲ SƠN 149
• Trên tổng thể, ta xét một dấu hiệu có tỷ lệ
chưa biết. Dựa trên mẫu ngẫu nhiên quan sát
được, ta tìm hai đại lượng sao cho 1 2p , p
1 2P p p p 1 .
: độ tin cậy của ước lượng. 1
: khoảng ước lượng. 1 2p ,p
: độ chính xác (sai số) của ước lượng.
2 1p p
2
Ước lượng tỷ lệ trên tổng thể
LÊ HỮU KỲ SƠN 150
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
26
- Xác định tỷ lệ trên mẫu: n
mf F
n
- Xác định từ đẳng thức (Tra bảng B).
1
t2
t
- Xác định sai số:
f 1 ft
n
- Khoảng ước lượng: f ; f
Các bước thực hiện việc ước lượng:
Ước lượng tỷ lệ trên tổng thể
LÊ HỮU KỲ SƠN 151
VD 10. Lô trái cây của một cửa hàng được đóng thành
sọt, mỗi sọt 100 trái. Kiểm tra ngẫu nhiên 50 sọt thì thấy
có 450 trái không đạt tiêu chuẩn.
a) Hãy ước lượng tỷ lệ trái cây không đạt tiêu chuẩn
của lô hàng ở độ tin cậy 95%.
b) Muốn ước lượng tỷ lệ trái cây không đạt tiêu chuẩn
với độ chính xác 0,005, độ tin cậy đạt được là bao
nhiêu ?
c) Muốn ước lượng tỷ lệ trái cây không đạt tiêu chuẩn
ở độ tin cậy 99,7% thì độ chính xác đạt được là bao
nhiêu ?
Ước lượng tỷ lệ trên tổng thể
LÊ HỮU KỲ SƠN 152
VD 11. Để ước lượng số cá có trong một cái hồ, người
ta bắt lên 10.000 con, đánh dấu rồi thả lại xuống hồ.
Sau một thời gian, lại bắt lên 8.000 con cá thì thấy có
564 con cá có đánh dấu. Ở độ tin cậy 97%, hãy ước
lượng tỷ lệ cá có đánh dấu trong hồ và cho biết số cá
có trong hồ ?
Ước lượng tỷ lệ trên tổng thể
LÊ HỮU KỲ SƠN 153
VD 12. Cân thử 100 quả cam, ta có bộ số liệu sau:
Khối lượng
(g)
32 33 34 35 36 37 38 39 40
Số quả 2 3 15 26 28 6 8 8 4
a) Hãy ước lượng khối lượng trung bình một quả
cam ở độ tin cậy 95%.
b) Cam có khối lượng dưới 35g được coi là cam
loại 2. Ước lượng tỷ lệ cam loại 2 ở độ tin cậy
90%.
Ước lượng tỷ lệ trên tổng thể
LÊ HỮU KỲ SƠN 154
Sử dụng máy tính bỏ túi tính đặc trưng mẫu
1. Số liệu đơn (không có tần số)
VD 1. Cho mẫu có cỡ mẫu là 5n :
12; 13; 11; 14; 11.
a) Máy fx 500 – 570 MS
• Xóa bộ nhớ: SHIFT MODE 3 = =
• Vào chế độ thống kê nhập dữ liệu:
– MODE 2 (chọn SD đối với fx500MS);
MODE MODE 1 (chọn SD đối với fx570MS).
– Nhập các số:
12 M+ 13 M+ 11 M+ 14 M+ 11 M+
LÊ HỮU KỲ SƠN 155
• Xuất kết quả:
– SHIFT 2 1 =
(kết quả x là trung bình mẫu).
– SHIFT 2 2 =
(kết quả x n là độ lệch chuẩn của mẫu s ). – SHIFT 2 3 =
( 1x n là độ lệch chuẩn của mẫu có hiệu chỉnh s ).
Sử dụng máy tính bỏ túi tính đặc trưng mẫu
LÊ HỮU KỲ SƠN 156
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
27
b) Máy fx 500 – 570 ES
• Xóa bộ nhớ: SHIFT 9 3 = =
• Vào chế độ thống kê nhập dữ liệu:
– SHIFT MODE dịch chuyển mũi tên tìm chọn
mục Stat 2 (chế độ không tần số).
– MODE 3 (stat) 1 (1-var) (nhập các số):
12= 13= 11= 14= 11= AC
• Xuất kết quả:
– SHIFT 1 5 (var) 1 = (n : cỡ mẫu)
– SHIFT 1 5 (var) 2 = (x )
– SHIFT 1 5 (var) 3 = ( ˆx n s ). – SHIFT 1 5 (var) 4 = ( 1x n s ).
Sử dụng máy tính bỏ túi tính đặc trưng mẫu
LÊ HỮU KỲ SƠN 157
2. Số liệu có tần số
VD 2. Cho mẫu có cỡ mẫu là 9n như sau:
X 12 11 15
n 3 2 4
Sử dụng máy tính bỏ túi tính đặc trưng mẫu
LÊ HỮU KỲ SƠN 158
a) Máy fx 500 – 570 MS
• Xóa bộ nhớ: SHIFT MODE 3 = =
• Vào chế độ thống kê nhập dữ liệu:
– MODE 2 (chọn SD đối với fx500MS);
MODE MODE 1 (chọn SD đối với fx570MS).
– Nhập các số:
12 SHIFT , 3 M+
11 SHIFT , 2 M+
15 SHIFT , 4 M+
• Xuất kết quả, ta làm như 1a).
Sử dụng máy tính bỏ túi tính đặc trưng mẫu
LÊ HỮU KỲ SƠN 159
b) Máy fx 500 – 570 ES
• Xóa bộ nhớ: SHIFT 9 3 = =
• Vào chế độ thống kê nhập dữ liệu:
– SHIFT MODE (SETUP) dịch chuyển mũi tên
4 1
– MODE 3 (stat) 1 (1-var)
– Nhập các giá trị và tần số vào 2 cột trên màn hình:
X FREQ
12 3
11 2
15 4 AC
• Xuất kết quả, làm như 1b).
Sử dụng máy tính bỏ túi tính đặc trưng mẫu
LÊ HỮU KỲ SƠN 160
KIỂM ĐỊNH GIẢ THUYẾT
THỐNG KÊ
CHƯƠNG 5
LÊ HỮU KỲ SƠN 161
Khái niệm chung
Các loại sai lầm khi kiểm định
Cơ sở lý thuyết của kiểm định
Kiểm định giả thuyết về trung bình
Kiểm định giả thuyết về tỷ lệ
Nội dung chính
LÊ HỮU KỲ SƠN 162
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
28
Khái niệm chung
• Mô hình tổng quát của bài toán kiểm định là: ta
nêu lên hai mệnh đề trái ngược nhau, một mệnh
đề được gọi là giả thuyết H và mệnh đề ngược lại
được gọi là đối thuyết
• Giải quyết một bài toán kiểm định là đưa ra một
quy tắc hành động (chấp nhận H hoặc bác bỏ H)
bằng cách dựa vào mẫu quan sát.
H.
LÊ HỮU KỲ SƠN 163
Khái niệm chung
• Ta nói rằng: chấp nhận giả thuyết H, có nghĩa là ta
tin rằng H đúng; bác bỏ H, có nghĩa là ta tin rằng
H sai.
• Ở đây, ta không thể khẳng định H đúng hay sai, ta
chỉ quan sát ngẫu nhiên một số trường hợp nên
không thể khẳng định chắc chắn điều gì cho cả
tổng thể.
LÊ HỮU KỲ SƠN 164
Các loại sai lầm khi kiểm định
Quan sát ngẫu nhiên một số trường hợp rồi suy rộng
cho cả tổng thể, sự suy rộng này có khi đúng, có khi
sai. Thống kê học phân biệt hai loại sai lầm:
• Sai lầm loại 1: Bác bỏ H trong khi H xảy ra,
• Sai lầm loại 2: Chấp nhận H trong khi H không xảy
ra.
LÊ HỮU KỲ SƠN 165
Các loại sai lầm khi kiểm định
Quyết định
Thực tế
Chấp nhận H Bác bỏ H
H xảy ra Đúng Sai lầm loại 1
H không xảy ra Sai lầm loại 2 Đúng
LÊ HỮU KỲ SƠN 166
Các loại sai lầm khi kiểm định
• Nếu ta hạ thấp nguy cơ sai lầm loại 1 thì nguy cơ sai
lầm loại 2 sẽ tăng lên và ngược lại. Do đó, thực tế thì
ta xem giữa hai sai lầm này, sai lầm nào tác hại nhiều
hơn thì cần tránh.
P Sai laàm loaïi
P Chaápnhaän H Hkhoâng xaûy ra
2
1 P Sai laàm loaïi P Baùc boû H Hxaûy ra ,
LÊ HỮU KỲ SƠN 167
• Thống kê học quy ước sai lầm loại 1 là tác hại hơn
và cần tránh hơn. Do đó, ta chỉ xét các phép kiểm
định có nguy cơ sai lầm loại 1 không vượt quá một
giá trị ấn định trước, thông thường là 1%, 2%, 5% ...
Giá trị này còn được gọi là mức ý nghĩa của phép
kiểm định.
Các loại sai lầm khi kiểm định
LÊ HỮU KỲ SƠN 168
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
29
Cơ sở lý thuyết của kiểm định
• Dựa vào mẫu quan sát X1, X2, …, Xn, ta chọn một
thống kê Q = f(X1, X2, …, Xn) sao cho khi H đúng
thì phân phối của Q hoàn toàn được xác định.
Thống kê Q được gọi là tiêu chuẩn kiểm định giả
thuyết H.
• Từ nguy cơ sai lầm , ta đi tìm khoảng ước lượng
[a, b] của Q ở độ tin cậy
1 .
LÊ HỮU KỲ SƠN 169
Cơ sở lý thuyết của kiểm định
• Nếu thì ta chấp nhận H.
• Nếu thì ta bác bỏ H.
Lưu ý:
Trong ứng dụng, nếu hàm mật độ của Q có dạng
đối xứng qua trục Oy, chẳng hạn như trong phân
phối Gauss N(0;1) và phân phối Student St(n), thì
ta chọn khoảng tin cậy đối xứng [-C; C] với
Q a,b
Q a,b
P Q C P Q C .2
LÊ HỮU KỲ SƠN 170
Cơ sở lý thuyết của kiểm định
• Nếu thì ta chấp nhận H.
• Nếu thì ta bác bỏ H.
Q C
Q C
LÊ HỮU KỲ SƠN 171
Cơ sở lý thuyết của kiểm định
Nếu hàm mật độ của Q không đối xứng thì ta quy
ước khoảng tin cậy trong phép kiểm định là [0; C]
với
• Nếu thì ta chấp nhận giả thuyết H.
• Nếu thì ta bác bỏ H.
P Q C .
Q C
Q C
LÊ HỮU KỲ SƠN 172
Kiểm định so sánh trung bình với một số
Xét bài toán kiểm định: so sánh một tham số
trung bình,
Dựa vào mẫu quan sát (X1, X2, …, Xn), ta đưa ra
quyết định: chấp nhận H hoặc bác bỏ H.
Ta có 4 trường hợp sau:
0
0
H: ,
H : .
LÊ HỮU KỲ SƠN 173
Trường hợp 1: và đã biết. n 30 2
- Xác định: X
- Xác định từ đẳng thức (Tra bảng B).
1
t2
t
- Xác định giá trị thống kê:
0Xt n.
- Kết luận: Nếu thì ta chấp nhận H.
Nếu thì ta bác bỏ H.
t t
t t
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 174
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
30
Lưu ý. Trong trường hợp bác bỏ H, nghĩa là ,
thì:
• Nếu thì ta kết luận
• Nếu thì ta kết luận
0
0X 0.
0X 0.
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 175
Trường hợp 2: và chưa biết. n 30 2
- Xác định: X,S
- Xác định từ đẳng thức (Tra bảng B).
1
t2
t
- Xác định giá trị thống kê:
0X
t n.S
- Kết luận: Nếu thì ta chấp nhận H.
Nếu thì ta bác bỏ H.
t t
t t
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 176
Trường hợp 3: , đã biết và dấu hiệu X
có phân phối chuẩn.
n 30 2
Thực hiện tương tự như ở trường hợp 1.
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 177
- Xác định: X, S
- Xác định phân vị (Tra bảng C).
n 1t
- Xác định giá trị thống kê:
Trường hợp 4: , chưa biết và dấu hiệu
X có phân phối chuẩn.
n 30 2
- Kết luận: Nếu thì ta chấp nhận H.
Nếu thì ta bác bỏ H.
n 1t t
n 1t t
Kiểm định so sánh trung bình với một số
0Xt n
S
LÊ HỮU KỲ SƠN 178
VD 1. Đo lượng cholesterol ( đơn vị: mg%) cho
một nhóm người, ta ghi nhận lại được
Chol. 150 –
160
160 -
170
170 -
180
180 -
190
190 -
200
200 -
210
Số
người
3 9 11 3 2 1
a) Tính trung bình mẫu X và độ lệch chuẩn S.
b) Có tài liệu cho biết lượng cholesterol trung bình
là 175 mg%. Giá trị này có phù hợp với mẫu quan
sát không ? Kết luận với mức ý nghĩa 0,05 .
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 179
VD 2. Một nhà giáo dục học A muốn nghiên cứu
xem số giờ tự học trung bình hàng ngày của sinh
viên hiện nay có thay đổi không so với mức 1
giờ/ngày cách đây 10 năm.
Ông A khảo sát ngẫu nhiên 120 sinh viên và
tính được số giờ tự học trung bình là 0,82
giờ/ngày với S 0,82 giờ/ngày. Với mức ý nghĩa
3%, hãy cho biết kết luận của ông A ?
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 180
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
31
VD 3. Một công ty xây dựng cho biết mức lương
bình quân của một kỹ sư ở công ty là 8,7 triệu
đồng/tháng với độ lệch chuẩn 0,5 triệu đồng/tháng.
Kỹ sư A dự định xin vào làm ở công ty này và đã
thăm dò 18 kỹ sư thì thấy mức lượng trung bình là
8,45 triệu đồng/tháng.
Kỹ sư A quyết định rằng: nếu mức lương trung
bình bằng với mức công ty đưa ra thì nộp đơn xin
làm. Với mức ý nghĩa 2%, hãy cho biết kết luận
của kỹ sư A ?
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 181
VD 4. Một máy đóng gói các sản phẩm có khối
lượng 1kg. Nghi ngờ máy hoạt động không bình
thường, người ta chọn ra một mẫu ngẫu nhiên
gồm 100 sản phẩm thì thấy như sau :
Khối
lượng (kg)
0,95 0,97 0,99 1,01 1,03 1,05
Số gói 9 31 40 15 3 2
Với mức ý nghĩa 5%, hãy kết luận về nghi ngờ
trên ?
Kiểm định so sánh trung bình với một số
LÊ HỮU KỲ SƠN 182
Xét bài toán kiểm định: so sánh một tham số tỷ
lệ,
Ở đây, p là tỷ lệ các phần tử có tính chất A trên tổng
thể. Dựa vào mẫu quan sát (X1, X2, …, Xn), ta đưa
ra quyết định: chấp nhận H hoặc bác bỏ H.
0
0
H: p p ,
H : p p .
Kiểm định so sánh tỷ lệ với một số
LÊ HỮU KỲ SƠN 183
- Xác định tỷ lệ trên mẫu : n
mf f
n
- Xác định từ đẳng thức (Tra bảng B).
1
t2
t
- Xác định giá trị thống kê:
0
0 0
f pt n.
p 1 p
- Kết luận: Nếu thì ta chấp nhận H.
Nếu thì ta bác bỏ H.
t t
t t
Kiểm định so sánh tỷ lệ với một số
LÊ HỮU KỲ SƠN 184
Kiểm định so sánh tỷ lệ với một số
VD 5. Tỷ lệ phế phẩm của một nhà máy trước đây
là 5%. Năm nay nhà máy áp dụng một biện pháp
kỹ thuật mới. Để nghiên cứu tác dụng của biện
pháp kỹ thuật mới, người ta lấy một mẫu gồm 800
sản phẩm để kiểm tra và thấy có 24 phế phẩm.
a) Với mức ý nghĩa 1%, hãy cho kết luận về biện pháp kỹ thuật mới này ?
b) Nếu nhà máy báo cáo tỷ lệ phế phẩm sau khi áp dụng biện pháp kỹ thuật mới là 2% thì có chấp nhận được không ? Kết luận với mức ý nghĩa 1%.
LÊ HỮU KỲ SƠN 185
Kiểm định so sánh tỷ lệ với một số
VD 6. Khảo sát ngẫu nhiên 400 sinh viên về mức
độ nghiêm túc trong giờ học thì thấy có 13 sinh
viên thừa nhận có ngủ gục trong giờ học. Trong
kiểm định giả thuyết H: “có 2% sinh viên ngủ trong
giờ học”, mức ý nghĩa tối đa là bao nhiêu để H
được chấp nhận ?
LÊ HỮU KỲ SƠN 186
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
32
Chương 6. Bài toán tương quan & Hồi quy
1. HỆ SỐ TƯƠNG QUAN MẪU
1.1. Định nghĩa
• Hệ số tương quan mẫu r là số đo mức độ phụ thuộc
tuyến tính giữa hai mẫu ngẫu nhiên cùng cỡ X và Y .
• Giả sử ta có mẫu ngẫu nhiên cỡ n về vector ngẫu nhiên
( , )X Y là ( , ); 1; 2;...;i ix y i n . Khi đó, hệ số tương
quan mẫu r được tính theo công thức:
1
. 1; .
ˆ ˆ.
n
i iix y
xy x yr xy x y
s s n
LÊ HỮU KỲ SƠN 187
Chương 6. Bài toán tương quan & Hồi quy
VD 1. Kết quả đo lường độ cholesterol (Y) có trong máu
của 10 đối tượng nam ở độ tuổi (X) như sau:
X 20 52 30 57 28 43 57 63 40 49
Y 1,9 4,0 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4,0
Tính hệ số tương quan mẫu giữa X và Y .
1.2. Tính chất
1) 1 1r .
2) Nếu 0r thì ,X Y không có quan hệ tuyến tính;
Nếu 1r thì ,X Y có quan hệ tuyến tính tuyệt đối.
3) Nếu 0r thì quan hệ giữa ,X Y là giảm biến.
4) Nếu 0r thì quan hệ giữa ,X Y là đồng biến.
LÊ HỮU KỲ SƠN 188
Chương 6. Bài toán tương quan & Hồi quy
Giải. Từ số liệu ở bảng trên, ta tính được:
20 1, 9 ... 49 4, 0
167,2610
xy ;
1
41
3,9n
ii
x xn
; ˆ 13,5385xs ;
1
31
,56n
ii
y yn
; ˆ 0,8333ys .
Vậy .
0, 9729ˆ .x y
xy x yr
s s.
LÊ HỮU KỲ SƠN 189
Chương 6. Bài toán tương quan & Hồi quy
2. Đường hồi quy trung bình tuyến tính thực nghiệm
• Từ mẫu thực nghiệm về vector ngẫu nhiên ( , )X Y , ta
biễu diễn các cặp điểm ( , )i ix y lên mpOxy . Khi đó,
đường cong nối các điểm là đường cong phụ thuộc của
Y theo X mà ta cần tìm (xem hình a), b)).
Hình a
Hình b
LÊ HỮU KỲ SƠN 190
Chương 6. Bài toán tương quan & Hồi quy
• Đường thẳng là đường hồi quy thực nghiệm xấp xỉ tốt
nhất các điểm mẫu đã cho, cũng là xấp xỉ đường cong
cần tìm. Trong hình a) ta thấy xấp xỉ tốt (phụ thuộc
tuyến tính chặt), hình b) xấp xỉ không tốt.
2.1. Phương pháp bình phương bé nhất
• Khi có sự phụ thuộc tuyến tính tương đối chặt giữa hai
biến ngẫu nhiên X và Y ta cần tìm biểu thức a bX
xấp xỉ Y tốt nhất theo nghĩa cực tiểu sai số bình
phương trung bình 2( )E Y a bX , phương pháp này
được gọi là bình phương bé nhất.
• Với mỗi cặp điểm ( , )i ix y thì sai số xấp xỉ là:
( )i i iy a bx (xem hình c)). LÊ HỮU KỲ SƠN 191
Chương 6. Bài toán tương quan & Hồi quy
Ta đi tìm các ước lượng a, b
sao cho 2
1
n
ii
đạt cực tiểu.
Đặt 2
1
n
iiQ
1
2( )i i
n
i
a bxy , ta có:
Hình c
/
1 1/
2
1 1 1
(1)0
0(2)
n n
i ia i i
n n nb
i i i ii i i
na b x yQ
Qa x b x x y
LÊ HỮU KỲ SƠN 192
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
33
Chương 6. Bài toán tương quan & Hồi quy
1 1
1 1(1) . .
n n
i ii i
a y b x y b xn n
.
Thay a vào (2), ta được:
2
1 1 1
.n n n
i i i ii i i
y b x x b x x y
2
1 1 1 1
1 1 1 1. .
n n n n
i i i i ii i i i
b x x x x y y xn n n n
2 2
2
..
x
xy x yb x x xy x y b
s.
LÊ HỮU KỲ SƠN 193
Chương 6. Bài toán tương quan & Hồi quy
• Vậy 2
.
x
xy x yb
s, .a y b x .
Đường hồi quy tuyến tính của Y theo X là:
.y a bx
• Tương tự: 2
.
y
xy x yb
s, .a x b y .
Đường hồi quy tuyến tính của X theo Y là:
.x a by
LÊ HỮU KỲ SƠN 194
Chương 6. Bài toán tương quan & Hồi quy
Giải. 1) ˆ ˆ1,55; 0,0707; 53; 5,099x yx s y s ;
82, 45 1,55 5382, 45 0,8322
0, 0707 5, 099xy r .
VD 2. Đo chiều cao (X: m) và khối lượng (Y: kg) của 5
học sinh nam, ta có kết quả:
X 1,45 1,60 1,50 1,65 1,55
Y 50 55 45 60 55
1) Tìm hệ số tương quan r.
2) Lập phương trình hồi quy tuyến tính của Y theo X.
3) Dự đoán nếu một học sinh cao 1,62m thì nặng khoảng
bao nhiêu kg?
LÊ HỮU KỲ SƠN 195
Chương 6. Bài toán tương quan & Hồi quy
2) 2 2
. 82, 45 1,55 5360, 0181
ˆ (0, 0707)x
xy x yb
s;
53 60,0181 1,55 40,0281a y bx .
Vậy 40,0281 60,0181y x .
3) Học sinh cao 1,62m thì nặng khoảng:
40,0281 60,0181 1,62 57,2012y kg.
LÊ HỮU KỲ SƠN 196
Chương 6. Bài toán tương quan & Hồi quy
VD 3. Số vốn đầu tư
(X: triệu đồng) và lợi
nhuận thu được (Y:
triệu đồng) trong một
đơn vị thời gian của
100 quan sát là:
Y
X
0,3
0,7
1,0
1 20 10
2 30 10
3 10 20
1) Lập phương trình hồi tuyến tính của X theo Y.
2) Dự đoán nếu muốn lợi nhuận thu được là 0,5 triệu
đồng thì cần đầu tư bao nhiêu?
LÊ HỮU KỲ SƠN 197
Chương 6. Bài toán tương quan & Hồi quy
Giải. 1) Ta có ˆ2; 0,7746; 0,71;xx s y
ˆ 0,2427ys ; 1,56xy .
2 2
. 1, 56 0,71 22, 3768
ˆ (0,2427)y
xy x yb
s;
2 2,3768 0,71 0,3125a x by .
Vậy 0,3125 2,3768x y .
2) Nếu muốn lợi nhuận thu được là 0,5 triệu thì cần đầu
tư khoảng:
0,3125 2,3768 0,5 1,5009x triệu đồng.
LÊ HỮU KỲ SƠN 198
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
34
Chương 6. Bài toán tương quan & Hồi quy
VD 4. Số thùng bia (Y: thùng) được bán ra phụ thuộc
vào giá bán (X: triệu đồng/ thùng). Điều tra 100 đại lý về
1 loại bia trong một đơn vị thời gian có bảng số liệu:
Y
X
100
110
120
0,150 5 15 30
0,160 10 25
0,165 15
1) Tính hệ số tương quan r.
2) Lập phương trình hồi tuyến tính của X theo Y.
3) Dự đoán nếu muốn bán được 115 thùng bia thì giá
bán mỗi thùng cỡ bao nhiêu? LÊ HỮU KỲ SƠN 199
Chương 6. Bài toán tương quan & Hồi quy
2) 2 2
. 17,1 0,1558 1100, 0006
ˆ (7,746)y
xy x yb
s;
0,1558 0,0006 110 0,2218a x by .
Vậy 0,2218 0,0006x y .
3) Nếu muốn bán được 115 thùng bia thì giá bán mỗi
thùng khoảng:
0,2218 0,0006 115 0,1528x triệu đồng.
Giải. 1) ˆ ˆ0,1558; 0,006; 110; 7,746x yx s y s ;
17,1 0,1558 11017,1 0,8176
0, 006 7,746xy r .
LÊ HỮU KỲ SƠN 200
Sử dụng máy tính bỏ túi tìm đường hồi quy
1. Số liệu không có tần số
a) Máy tính fx500MS, fx570MS
VD 1. Bài toán cho ở dạng cặp ( ),i ix y như sau:
X 20 52 30 57 28 43 57 63 40 49
Y 1,9 4,0 2,6 4,5 2,9 3,8 4,1 4,6 3,2 4,0
Tìm hệ số r , đường hồi quy Y theo X: y a bx .
Nhập số liệu:
MODE REG LIN
X, Y M+
20, 1.9 M+
52, 4.0 M+
… … … …
49 , 4.0 M+ LÊ HỮU KỲ SƠN 201
Sử dụng máy tính bỏ túi tìm đường hồi quy
Xuất kết quả:
SHIFT 2 (dịch chuyển mũi tên phải 2 lần)
1 (A chính là a trong phương trình)
2 (B chính là b trong phương trình)
3 (r chính là r ).
Đáp số: 0,9729r ; 0,9311 0,0599y x .
b) Máy tính fx500ES, fx570ES
Xét lại VD 1 ở trên.
Nhập số liệu:
SHIFT MODE dịch chuyển mũi tên tìm chọn
mục Stat 2 (chế độ không tần số)
MODE 3 (stat) 2 (A+Bx) (nhập các giá trị
của X, Y vào 2 cột) LÊ HỮU KỲ SƠN 202
Sử dụng máy tính bỏ túi tìm đường hồi quy
X Y
20 1.9
52 4.0
… …
49 4.0
Xuất kết quả:
SHIFT 1 7 1(A chính là a trong phương trình)
SHIFT 1 7 2(B chính là b trong phương trình)
SHIFT 1 7 3(r chính là r trong phương trình).
2. Số liệu có tần số
a) Máy tính fx500MS, fx570MS
VD 2. Tìm hệ số r , đường hồi quy thực nghiệm Y theo
X : y a bx với bài toán cho ở dạng bảng như sau: LÊ HỮU KỲ SƠN 203
Sử dụng máy tính bỏ túi tìm đường hồi quy
X
Y
21
23
25
3 2
4 5 3
5 11 8
Nhập số liệu:
MODE REG LIN
X, Y; n M+
21, 3; 2 M+
21, 4; 5 M+
… …
25 , 5; 8 M+
Xuất kết quả: làm như 1a).
Đáp số: 0,7326r ; 2,6694 0,3145y x . LÊ HỮU KỲ SƠN 204
HK1/2013-2014 - LÊ HỮU KỲ SƠN
K.KHCB
05/09/2013
35
Sử dụng máy tính bỏ túi tìm đường hồi quy
b) Máy tính fx500ES, fx570ES
Xét lại VD 2 ở trên
Nhập số liệu:
SHIFT MODE dịch chuyển mũi tên tìm chọn
Mục Stat 1 (chế độ có tần số)
MODE 3 (stat) 2 (A+Bx) (nhập các giá trị
của X, Y, tần số vào 3 cột)
X Y FREQ
21 3 2
21 4 5
... … …
25 5 8
Xuất kết quả: làm như 1b). ………………..Hết……………….. LÊ HỮU KỲ SƠN 205