Trung bình mẫu trong nguyên lý thống kê năm 2024
Định nghĩa. Hàm $g(X_1, · · · , X_n)$ với $(X_1, · · · , X_n)$ là một mẫu ngẫu nhiên được gọi là một hàm mẫu hay một thống kê. Vì mẫu $(X_1, · · · , X_n)$ là một véctơ ngẫu nhiên nên $g(X_1, · · · , X_n)$ là một BNN. Có hai nhóm thống kê mẫu quan trọng đặc trưng cho BNN của tổng thể:
Xét mẫu ngẫu nhiên $(X_1, · · · , X_n)$ của BNN $X$, thống kê $$\overline{X}=\dfrac{1}{n}(X_1+X_2+...+X_n)=\dfrac{1}{n}\sum\limits_{i=1}{n} X_i$$ gọi là trung bình mẫu. Với mẫu cụ thể $(x_1, · · · , x_n)$ thì: $$\overline{x}=\dfrac{1}{n}\sum\limits_{i=1}{n} x_i$$ là giá trị mà trung bình mẫu nhận được ứng với mẫu đã cho. Nếu số liệu cho dưới dạng bảng thì: $\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^{k} x_in_i$. Một cách tương tự trung bình mẫu, phương sai mẫu được định nghĩa là kì vọng của độ lệch bình phương các thành phần của mẫu với trung bình mẫu và kí hiệu: $$\hat{S}2=\dfrac{1}{n}\sum\limits_{i=1}{n}(X_i-\overline{X})2=\dfrac{1}{n}\sum\limits_{i=1}{n}X_i^2-(\overline{X})^2.$$ Nếu mẫu cho dưới dạng bảng thì ta có: $$\hat{S}2=\dfrac{1}{n}\sum_{i=1}{n}(x_i-\overline{X})2n_i=\dfrac{1}{n}\sum\limits_{i=1}{n}x_i^2n_i-(\overline{X})^2.$$ Chú ý.
Ví dụ: Tuổi thọ (đơn vị: 10 giờ) một loại linh kiện do công ty A sản xuất ra được kiểm tra ngẫu nhiên, kết quả ghi thành bảng sau:
Khoảng tin cậy là một dãy giá trị mà trong đó các tham số của tổng thể như số trung bình ((), tỉ lệ (p) và phương sai ((2) cần được ước lượng nằm trong khoảng này. Ứơc lượng khoảng tin cậy là một hình thức dự báo trong thống kê, một chỉ tiêu kinh tế nào đó có thể được ước lượng tại một điểm nào đó (dự báo điểm) hay nằm trong một khoảng nào đó (dự báo khoảng) với độ tin cậy cho trước. Ví dụ: Với độ tin cậy 90%, một mẫu gồm 16 quan sát có trung bình từ một tổng thể có phân phối chuẩn với độ lệch chuẩn s = 6 thì trung bình tổng thể ( có giá trị trong khoảng từ 17,4675 đến 22,5325. Khoảng tin cậy cho trung bình tổng thể được ước lượng dựa vào giá trị được quan sát của trung bình mẫu. Ðặt ( là một tham số chưa biết của tổng thể. Giả sử rằng chúng ta dựa vào thông tin của mẫu quan sát, tìm những biến ngẫu nhiên A và B sao cho: P ( A < q < B ) = 1 - trong đó (1 - () là độ tin cậy (level of confidence) và 100 (1 - ()% là khoảng tin cậy cho (, khoảng này sẽ chứa các tham số của tổng thể. II. ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO TRUNG BÌNH TỔNG THỂ (khi biết phương sai s2 ) Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n quan sát từ một phân phối chuẩn với trung bình ( và phương sai (2, và trung bình mẫu là Ġ. Một khoảng tin cậy 100 (1- ()% cho trung bình tổng thể ( được xác định như sau: Trong đóĠ là một số sao cho P ( Z ľ) = P ( Z < ĭ) Ľ và biến ngẫu nhiên Z có phân phối chuẩn tắc:Ġ |