Bài 2: Kiểm định giả thiết phương pháp khoảng tin cậy và trung bình của tổng thể

Mời các bạn cùng tham khảo nội dung bài giảng Bài 2: Kiểm định giả thiết phương pháp khoảng tin cậy và trung bình của tổng thể sau đây để tìm hiểu về kiểm định giả thiết: Phương pháp khoảng tin cậy và trung bình của tổng thể.

Bài 2: Kiểm định giả thiết phương pháp khoảng tin cậy và trung bình của tổng thể

Bài 2: Kiểm định giả thiết phương pháp khoảng tin cậy và trung bình của tổng thể

1. Kiểm định giả thiết: Phương pháp khoảng tin cậy

Giả sử ta cần kiểm định giả thiết: H0:θ=θ0;H1:θθ0; trong đó θ là tham số nào đó của một đại lượng ngẫu nhiên (kỳ vọng toán hoặc phương sai,....) ; θ0 là một hằng số đã biết.

Theo phương pháp ước lượng khoảng, với độ tin cậy 1α ta có thể tìm được khoảng (^θ1;^θ2) sao cho:

P(^θ1<θ<^θ2)=1α

Như vậy, với xác suất 1α, khoảng ngẫu nhiên (^θ1;^θ2)chứa được θ. Vì 1α lớn, nên theo nguyên lý xác suất lớn ta có thể coi biến cố (^θ1<θ<^θ2) hầu như chắc chắn xảy ra trong một phép thử. Với một mẫu cụ thể (được coi là một phép thử) ta sẽ tính được một giá trị của ^θ1 (ký hiệu là ^θ1 ). Giá trị của ^θ2 cũng tính được và ký hiệu là ^θ2.

Nếu θ(^θ1;^θ2) thì ta bác bỏ H0; Nếu θ(^θ1;^θ2) thì ta chưa có cơ sở để bác bỏ H0.

Thí dụ: Khảo sát hàm lượng Vitamin C của một loại trái cam (%) của một mẫu kích thước n = 100, người ta tính được:

¯X=9,45% và s = 2,98496.

Gọi μ là hàm lượng Vitamin C trung bình trong một trái của loại cam này. Hãy kiểm định giả thiết:

H0:μ=12%;H1:μ12%

Với mức ý nghĩa 5%.

Giải: Với mức ý nghĩa α=5% thì Z0025=1,96. Vậy khoảng tin cậy (với độ tin cậy 95%) của μ là:

9,45±1,962,98946100 hay (8,864<μ<10,036)

Vì 12(8,864;10,036) nên ta bác bỏ giả thiết H0.

Tức hàm lượng Vitamin C trung bình trong một trái của loại cam này thấp hơn 12% (vì ¯X=9,45<12)

2. Kiểm định giả thiết về trung bình của tổng thể

Giả sử trung bình của tổng thể (cũng chính là kỳ vọng toán của đại lượng ngẫu nhiên X) là μ (μ chưa biết), cần kiểm định giả thiết:

H0:μ=m0 với giả thiết đối H1:μm0

 (m0 là một giá trị đã biết khi đặt giả thiết H0).

Để kiểm định giả thiết trên ta tiến hành lấy mẫu với kích thức n và xét các trường hợp sau:

Trường hợp n  30 (hoặc n <30 nhưng X có phân phối chuẩn) σ2 đã biết.

Trường hợp này ta chọn thống kê:  Z=¯Xm0σ/n  làm tiêu chuẩn kiểm định.

Nếu giả thiết H0 đúng thì ZN(0,1)

Với mức ý nghĩa α, chọn miền bác bỏ giả thiết H0:

Wα={z:|z|>zα/2}

Trong đó zα/2 là giá trị của Z ~ N(0, 1) thoả mãn:

zα/2>0 và P(|Z|>zα/2)=α

Trên đồ thị, miền bác bỏ Wα được minh họa như sau:

để xác định zα/2 ta tra bảng ở phần phụ lục hoặc dùng hàm NORMSINV trong Excel (xem phụ lục 1)

Ta có:

P(ZWα)=P(|Z|>zα/2)=P(Z<zα/2)+P(Z>zα/2)=α/2+α/2=α

Như vậy xác suất để giá trị của Z rơi vào miền bác bỏ là α, tức xác suất để Z rơi vào miền chấp nhận sẽ là 1α. Vì α nhỏ, nên xác suất để Z rơi vào miền chấp nhận sẽ lớn. Nghĩa là: nếu giả thiết H0 đúng thì có thể coi rằng hầu hết các giá trị của Z sẽ rơi vào miền chấp nhận. Còn nếu giá trị của Z rơi vào miền bác bỏ có nghĩa là ta đã tìm được “bằng chứng” để chứng tỏ giả thiết H0 là không đúng và vì thế ta bác bỏ giả thiết đó.

Từ đó ta có qui tắc quyết định khi tiến hành kiểm định giả thiết H0 trong trường hợp này như sau: 

Lấy mẫu có kích thước n, từ mẫu cụ thể này tính z=(¯Xm0)σn

(Trong đó ¯X là trung bình mẫu).

Với mức ý nghĩa α cho trước, xác định Zα/2

(bằng cách tra bảng ở phần phụ lục hoặc dùng hàm NORMSINV trong Excel)

  • Nếu |z|>zα/2. Tức zWα thì ta bác bỏ giả thiết H0, chấp nhận H1.
  • Nếu |z|zα/2. Tức zWα thì có thể chấp nhận giả thiết H0

Từ việc chấp nhận (hay bác bỏ) H0 ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.

Thí dụ 1: Nếu máy móc làm việc bình thường thì trọng lượng của một loại sản phẩm là đại lượng ngẫu nhiên có kỳ vọng toán là 100 gr. Qua một thời gian sản xuất, người ta nghi ngờ trọng lượng trung bình của loại sản phẩm này đã thay đổi. Cân thử 100 sản phẩm và tính được ¯X=100,3 gr và s = 1.

Với mức ý nghĩa α=0,05  hãy kết luận điều nghi ngờ trên có đúng hay không?

Giải: Gọi trọng lượng trung bình thực tế của loại sản phẩm đó sau một thời gian sản xuất là μ (μ chưa biết). Đặt giả thiết:

H0:μ=100;H1:μ100

Để kiểm định giả thiết này ta áp dụng qui tắc kiểm định nêu trên (vì kích thước mẫu n = 100 > 30; σ chưa biết)

Z=(100,3100)1100=3

Với mức ý nghĩa α=0,05 tra bảng ta được z0,025=1,96

Vì |z|=3>z0,025=1,96 nên ta bác bỏ giả thiết H0. Tức điều nghi ngờ trên là đúng, trọng lượng trung bình của loại sản phẩm này đã khác 100 gr thực sự.

Chú ý:

Nếu kiểm định giả thiết H0:μ=m0; và giả thiết đối H0:μ>m0 với mức ý nghĩa α thì chọn miền bác bỏ giả thiết H0 là:

Wα={z=¯xm0σ/n:z>zα}

trong đó zα là giá trị của ĐLNN Z ~ N(0; 1) thỏa mãn:

zα>0 và P(|Z|>zα)=α

Trên đồ thị, miền bác bỏ Wα trong trường hợp này được minh họa như sau:

Nếu kiểm định giả thiết H0:μ=m0; và giả thiết đối H1:μ<m0 với mức ý nghĩa a thì chọn miền bác bỏ giả thiết H0 là:

Wα={z=¯xm0σ/n:z<zα}

Trên đồ thị, miền bác bỏ Wα trong trường hợp này được minh họa như sau:

Trường hợp n  30; σ2 chưa biết

Trường hợp này chọn: Z=(¯Xm0)Sn làm tiêu chuẩn kiểm định.

Nếu H0 đúng thì Z ~ N(0, 1), do đó miền bác bỏ giả thiết H0 và qui tắc quyết định trong trường hợp này tương tự như trường hợp trên. Chỉ khác là giá trị z được tính theo công thức:

z=(¯xm0)s/n

Chú ý:

Nếu kiểm định giả thiết: H0:μ=m0;H1:μm0 Trường hợp bác bỏ giả thiết H0

  • Nếu ¯x<m0 thì có thể kết luận μ<m0
  • Nếu ¯x>m0 thì có thể kết luận μ>m0

Trường hợp n < 30, σ2 chưa biết, X có phân phối chuẩn

Trường hợp này chọn: T=(¯Xm0)Sn làm tiêu chuẩn kiểm định. Nếu H0 đúng thì T phân phối theo qui luật Student với n-1 bậc tự do.

Ta có thể minh họa miền bác bỏ với các dạng giả thiết đối khác nhau trên đồ thị như sau:

Nếu kiểm định giả thiết hai phía, tức giả thiết đối có dạng: H1:μm0 thì miền bác bỏ Wα được minh họa trên đồ thị như sau:

Nếu kiểm định giả thiết một phía với giả thiết đối có dạng: H1:μ>m0 thì miền bác bỏ  được minh họa trên đồ thị như sau:

Nếu kiểm định giả thiết một phía với giả thiết đối có dạng: H1:μ<m0 thì miền bác bỏ Wα được minh họa trên đồ thị như sau:

Thí dụ 2: Trọng lượng của các bao gạo do một máy đóng bao sản xuất là đại lượng ngẫu nhiên có phân phối chuẩn với trọng lượng trung bình qui định là 50 kg. Để xem máy đóng bao làm việc có bình thường không (theo nghĩa máy sản xuất ra những bao gạo có trọng lượng trung bình đúng như qui định không), người ta cân thử 25 bao và tính được:

¯x=49,52kg;s=0,5

Với mức ý nghĩa α = 0,01, hãy cho kết luận về tình hình làm việc của máy đóng bao đó?

Giải: Gọi μ là trọng lượng trung bình thực tế của những bao gạo do máy sản xuất (μ chưa biết). Ta cần kiểm định giả thiết giả thiết:

H0:μ=50;H1:μ50

Trường hợp này kích thước mẫu n=25<30;σ2 chưa biết.

t=(49,5250)0,525=4,8

Với mức ý nghĩa α=0,01, tra bảng phân phối Student với bậc tự do là 25 - 1 = 24 ta được: tα/2=t0,005=2,797.

Vì |t|=4,8>2,797. Tức tWα nên ta bác bỏ giả thiết H0. Tức là máy đóng bao làm việc không bình thường. Nói cụ thể hơn, máy đã sản xuất ra những bao gạo có trọng lượng trung bình thấp hơn ưọng lượng trung bình qui định (vì ¯x=49,52<50).

Trường hợp n30; X có phân phôi Poisson

Giả sử đại lượng ngẫu nhiên X có phân phối Poisson với E(X) = λ chưa biết. Cần kiểm định giả thiết:

H0:λ=a0;H1:λa0

Do vậy ta chọn: 

Z=¯Xa0a0/n

làm tiêu chuẩn kiểm định.

Nếu n lớn và H0 đúng thì Z có phân phối xấp xỉ phân phối N(0, 1). Nên miền bác bỏ và qui tắc kiểm định giống trường hợp 2.1. Chỉ khác là trong qui tắc kiểm định ta tính z theo công thức sau:

z=(¯xa0)na0

Thí dụ 3: số người đến một trung tâm thương mại trong những khoảng thời gian 5 phút là đại lượng ngẫu nhiên X có phân phối Poisson. Trong mùa mưa, người ta xác định được E(X) = 4. Sang mùa khô, theo dõi 36 khoảng thời gian, (mỗi khoảng 5 phút) người ta thấy có 174 người đến trung tâm này.

Yới mức ý nghĩa α=0,05, hãy xét xem khí hậu có ảnh hưởng đến số người tới trung tâm thương mại đó hay không?

Giải: Gọi số người tới trung tâm thương mại trung bình trong khoảng thời gian 5 phút là X, (X, chưa biết). Đặt giả thiết:

H0:λ=4;H1:λ4

Với mức ý nghĩa α=0,05 thì Z0,025=1,96.

Theo giả thiết bài toán ta tính được số người đến trung tâm trung bình trong khoảng thời gian 5 phút của mẫu là:

¯x=17436=4,833

Vậy: 

z=(4,8334)364=2,499

Ta thấy |z| > 1,96 nên ta bác bỏ giả thiết H0. Nghĩa là khí hậu có ảnh hưởng tới dòng người đến trung tâm thương mại đó.

Trên đây là nội dung bài giảng Bài 2: Kiểm định giả thiết phương pháp khoảng tin cậy và trung bình của tổng thể mà eLib.VN muốn chia sẻ đến các bạn sinh viên. Hy vọng đây sẽ là tư liệu hữu ích giúp các bạn nắm được nội dung bài học tốt hơn. Chúc các bạn học tốt.

Ngày:23/11/2020 Chia sẻ bởi:Oanh

CÓ THỂ BẠN QUAN TÂM