Bài 2: Phương pháp khoảng tin cậy (phần 1)

Mời các bạn cùng eLib tham khảo nội dung bài giảng Bài 2: Phương pháp khoảng tin cậy (phần 1) sau đây để tìm hiểu về mô tả phương pháp khoảng tin cậy, ước lượng trung bình của tổng thể.

Bài 2: Phương pháp khoảng tin cậy (phần 1)

Bài 2: Phương pháp khoảng tin cậy (phần 1)

1. Mô tả phương pháp khoảng tin cậy

Để ước lượng tham số θθ của đại lượng ngẫu nhiên X, từ X ta lập mẫu ngẫu nhiên WX = (X1, X2,..., Xn).

Chọn thống kê ˆθ=f(X1,X2,...,Xn,θ) sao cho: Mặc dù chưa biết giá trị của θ nhưng qui luật phân phối xác suất của ˆθ vẫn hoàn toàn xác định. Do đó với xác suất α khá bé (trong thực tế người ta thường lấy (α0,05) ta có thể tìm được hai số: a và b thỏa mãn:

P(aˆθb)=1α  (7.2)

Nếu từ (7.2) giải ra được θ. Tức là ta đưa biểu thức (7.2) về dạng:

P(^θ1θ^θ2)=1α

thì:

  • Khoảng (^θ1,^θ2) được gọi là khoảng tin cậy của θ. Vì ^θ1,^θ2 là các đại lượng ngẫu nhiên nên khoảng (^θ1,^θ2) là khoảng ngẫu nhiên.
  • (1α) gọi là độ tin cậy (hệ số tin cậy) của ước lượng. Trong thực tế người ta thường yêu cầu 1α95 để có thể sử dụng nguyên lý xác suất lớn cho biến cố: (^θ1θ^θ2) =^θ2^θ1 gọi là độ dài khoảng tin cậy.
  • có thể là hằng số và cũng có thể là đại lượng ngẫu nhiên.

Do xác suất 1α khá lớn, nên theo nguyên lý xác suất lớn ta có thể coi biến cố (^θ1θ^θ2) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một phép thử đối với mẫu ngẫu nhiên WX, ta sẽ thu được mẫu cụ thể: WX = (X1, X2, . . . , Xn). Từ mẫu cụ thể này ta tính được giá trị của ^θ1^θ2, ký hiệu các giá trị đó tương ứng là ^θ1,^θ2

Như vậy có thể kết luận: Với độ tin cậy 1α, qua mẫu cụ thể WX, θ  nằm trong khoảng (^θ1,^θ2). Tức là: (^θ1<θ<^θ2)

Phương pháp ước lượng này có ưu điểm là: không những chỉ tìm được khoảng (^θ1,^θ2) để ước lượng θ mà còn cho biết độ tin cậy của ước lượng. Tuy nhiên nó cũng chứa đựng khả năng mắc phải sai lầm, xác suất mắc phải sai lầm là α.

Dưới đây chúng ta sẽ áp dụng phương pháp này để ước lượng các số đặc tnmg của tổng thể (cũng là các tham số đặc trưng của một đại lượng ngẫu nhiên).

2. Ước lượng trung bình của tổng thể

Giả sử trung bình của tổng thể (cũng chính là kỳ vọng toán của đại lượng ngẫu nhiên X) là μ chưa biết, ta cần ước lượng μ với độ tin cậy 1α.

Lập mẫu ngẫu nhiên Wx = (X1, X2,....,Xn)   và xét các trường hợp sau:

2.1 Trường hợp kích thước mẫu n30 (hoặc n < 30 nhưng X có phân phối chuẩn) σ2 đã biết.

Xét đại lượng ngẫu nhiên:

Z=¯Xμσ/n

n30, nên ta có thể áp dụng định lý Lindeberg-Levy. Nội dung của định lý này như sau:

Nếu các đại lượng ngẫu nhiên X1, X2, . . . , Xn độc lập, có cùng kỳ vọng toán μ và phương sai σ2 hữu hạn, thì đại lượng ngẫu nhiên:

Z=¯Xμσ/n

có phân phối xác suất xấp xỉ với phân phối N(0, 1) khi n khá lớn.

[Trường hợp n < 30 thì do giả thiết X có phân phối chuẩn nên dễ thấy rằng Z có phân phối N(0, 1)]

Với xác suất α khá bé ta tìm được một số Zα/2 thỏa mãn:

P(|Z|Zα/2)=1α

Thay biểu thức của z vào (7.3), ta được:

P(|¯Xμσ/n|Zα/2)=1α

hay:

P(Zα/2¯Xμσ/nZα/2)=1α

Hay:

P(¯XZα/2σnμ¯X+Zα/2σn)=1α

Cuối cùng ta được:

P(¯XZα/2σnμ¯X+Zα/2σn)=1α

Vậy với độ tin cậy 1α, khoảng tin cậy của μ là:

(¯XZα/2σn;¯X+Zα/2σn)

Ký hiệu:

ε=Zα/2σn

ε được gọi là độ chính xác của ước lượng.

Khi đó ta có thể viết:

Ý nghĩa của biểu thức (7.5) là: Với xác suất 1α, trung bình của mẫu ngẫu nhiên nhận giá trị sai lệch so với μ một lượng (theo giá trị tuyệt đối) nhỏ hơn ε.

(¯Xε;¯X+ε) được gọi là khoảng tin cậy đối xứng của μ.

Trong trường hợp này, độ dài khoảng tin cậy là:

1=(¯X+ε)(¯Xε)=2ε

Ứng với độ tin cậy 1α, khoảng tin cậy đôi xứng có độ dài ngắn nhất. Vì vậy khi cần tìm khoảng tin cậy, thông thường ta chỉ cần tìm khoảng tin cậy đối xứng.

Ngoài khoảng tin cậy đối xứng ta cũng có thể tìm khoảng tin cậy phía bên trái:

μ¯X+Zασn

hoặc khoảng tin cậy phía bên phải: 

μ¯XZασn

Giá trị ¯X+Zασn đươc dùng đế ước lượng chặn trên của μ

Giá trị ¯XZασn được dùng đế ước lượng chặn dưới của μ

Vì độ tin cậy 1α khá lớn, nên theo nguyên lý xác suất lớn ta có thể coi biến cố (¯Xε<μ<¯X+ε) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một phép thử đối với mẫu ngẫu nhiên WX, ta sẽ thu được mẫu cụ thể: WX = (x1, x2,...,xn)

Từ mẫu cụ thể đó ta tính được: ¯x=1nni=1xi

Với độ tin cậy 1α, tra bảng hàm Laplace (phụ lục 2) [hoặc dùng hàm NORMSINV(1α/2) trong Excel] ta sẽ tìm được giá trị Zα/2

Zα/2 là giá trị của đại lượng ngẫu nhiên Z ~ N(0, 1) thỏa mãn điều kiện: Zα/2>0P(Z>Zα/2)=α/2

Có thể minh họa giá trị Zα/2 trên đồ thị như sau:

Nếu sử dụng hàm Laplace thì:

2Φ(Zα/2)=1αhayΦ(Zα/2)=1α2

Như vậy, với độ tin cậy 1α, qua mẫu cụ thể Wx, khoảng tin cậy của μ là:

¯xε<μ<¯x+ε, trong đó: ε=Zα/2σn      (7.6)

2.2 Trường hợp n 30; σ2 chưa biết

Trường hợp này, vì kích thước mẫu lớn (n > 30) nên ta có thể dùng ước lượng của Var(X) là S2 để thay cho σ2 (chưa biết)

Tiến hành các bước tương tự như trường hợp 2.1, ta được khoảng tin cậy của μ (với độ tin cậy 1α) là:

¯xε<μ<¯x+ε trong đó: ε=Zα/2σn    (7.7)

2.3 Trường hợp n < 30; σ2 chưa biết X có phân phối chuẩn.

Trường hợp này ta xét đại lượng ngẫu nhiên: T=¯XμS/n

Người ta đã chứng minh được rằng: đại lượng ngẫu nhiên T có phân phối Student với (n - 1) bậc tự do.

Với xác suất α khá bé, ta có thể tìm được một số tα/2 sao cho:

P(|T|>tα/2)=α

Từ đó suy ra: 

P(tα/2<T<tα/2)=1α     (7.9)

Thay biểu thức của T vào (7.9) ta được:

P(tα/2<¯XμS/n<tα/2)=1α

Giải μ tương tự như đã làm ở phần 2.1, ta được:

P(¯Xtα/2Sn<μ<¯X+tα/2Sn)=1α

Vậy khoảng tin cậy của μ (với độ tin cậy 1α) là:

(¯Xtα/2Sn;¯X+tα/2Sn)

Từ mẫu cụ thể WX = (x1, x2,...,xn) ta tính được ¯X và S. Từ đó xác định khoảng tin cậy cụ thể của μ theo công thức:

(¯Xε<μ<¯X+ε) trong đó: ε=tα/2σn

Trong đó tα/2 là giá trị của đại lượng ngẫu nhiên T có phân phối Student với n - 1 bậc tự do thoả mãn điều kiện:

tα/2>0 và P(T>tα/2)=α/2

Để tìm tα/2 ta có thể ưa bảng ở phần phụ lục hoặc dùng hàm TINV trong Excel.

Chẳng hạn với độ tin cậy 1α=95 (tức α = 0,05) và kích thước mẫu n = 50 (tức bậc tự do là n - 1 = 49). Khi đó:

tα/2=t0,025=TINV(0,05.49)=2,0095742,1

Thí dụ 1: Điều tra năng suất lúa trên diện tích 100 héc ta ưồng lúa của một vùng, người ta tính được: ¯X = 5,8 tấn/ha; s = 2,05

Hãy ước lượng năng suất lúa trung bình của toàn vùng với độ tin cậy 95%.

Giải: Gọi μ là năng suất lúa trung bình của toàn vùng. Ta cần ước lượng μ với độ tin cậy 95%.

Trường hợp này, kích thước mẫu n=100>30;σ2 chưa biết. Nên khoảng tin cậy của μ là:

(¯Xε<μ<¯X+ε), trong đó: ε=Zα/2Sn

Do độ tin cậy 1 - α = 95% , tức Φ(Zα/2)=0,952=0,475 . Tra bảng hàm Laplace ta được: Φ(1,96)=0,475.

Vậy: Zα/2=Z0,025=1,96

Theo số liệu của bài toán ta có: ¯X = 5,8; s = 2,05; nên:

ε=1,96(2,05/10)=0,40180,4

Vậy khoảng tin cậy của μ là:

(5,80,4<μ<5,8+0,4)

Hay (5,4<μ<6,2) tấn/ha

Thí dụ 2: Theo dõi mức nguyên liệu hao phí để sản xuất một đơn vị sản phẩm người ta thu được các số liệu cho ở bảng sau:

Ước lượng mức hao phí nguyên liệu trung bình để sản xuất một đơn vị sản phẩm với độ tin cậy 1α=95%. Giả thiết mức hao phí nguyên liệu để sản xuất một đơn vị sản phẩm là đại lượng ngẫu nhiên có phân phối chuẩn.

Giải: Gọi mức nguyên liệu hao phí trung bình để sản xuất một đơn vị sản phẩm là μ. Ta cần ước lượng μ với độ tin cậy 95%.

Trường hợp này n=25<30;σ2 chưa biết.

Từ số liệu đã cho, ta tính được: ¯X=20,116;S=0,46

Với độ tin cậy 1α=95% , tra bảng phân phối Student với bậc tự do n -1 = 25 - 1 = 24 ta được: tα/2=t0,025=2,064.

Vậy:  ε=2,064.(0,45/5)=0,19

Khoảng tin cậy của μ là: (2,0640,19<μ<2,064+0,19)

Hay:

(19,926<μ<20,306)gr

Trên đây là nội dung bài giảng Bài 2: Phương pháp khoảng tin cậy (phần 1) mà eLib.VN muốn chia sẻ đến các bạn sinh viên. Hy vọng đây sẽ là tư liệu hữu ích giúp các bạn nắm được nội dung bài học tốt hơn. Chúc các bạn học tốt.

Ngày:23/11/2020 Chia sẻ bởi:Nguyễn Minh Duy

CÓ THỂ BẠN QUAN TÂM