Trung bình mẫu trong nguyên lý thống kê năm 2024

Định nghĩa. Hàm $g(X_1, · · · , X_n)$ với $(X_1, · · · , X_n)$ là một mẫu ngẫu nhiên được gọi là một hàm mẫu hay một thống kê.

Vì mẫu $(X_1, · · · , X_n)$ là một véctơ ngẫu nhiên nên $g(X_1, · · · , X_n)$ là một BNN.

Có hai nhóm thống kê mẫu quan trọng đặc trưng cho BNN của tổng thể:

  1. Các số đặc trưng cho ta hình ảnh về vị trí trung tâm của mẫu, tức là xu thế các số liệu trong mẫu tụ tập xung quanh những con số nào đó. Chẳng hạn trung bình mẫu, trung vị mẫu, Mode mẫu...
  2. Các số đặc trưng cho sự phân tán của các số liệu: độ lệch trung bình, độ lệch tiêu chuẩn và phương sai mẫu.

Xét mẫu ngẫu nhiên $(X_1, · · · , X_n)$ của BNN $X$, thống kê $$\overline{X}=\dfrac{1}{n}(X_1+X_2+...+X_n)=\dfrac{1}{n}\sum\limits_{i=1}{n} X_i$$ gọi là trung bình mẫu. Với mẫu cụ thể $(x_1, · · · , x_n)$ thì: $$\overline{x}=\dfrac{1}{n}\sum\limits_{i=1}{n} x_i$$ là giá trị mà trung bình mẫu nhận được ứng với mẫu đã cho.

Nếu số liệu cho dưới dạng bảng thì: $\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^{k} x_in_i$.

Một cách tương tự trung bình mẫu, phương sai mẫu được định nghĩa là kì vọng của độ lệch bình phương các thành phần của mẫu với trung bình mẫu và kí hiệu: $$\hat{S}2=\dfrac{1}{n}\sum\limits_{i=1}{n}(X_i-\overline{X})2=\dfrac{1}{n}\sum\limits_{i=1}{n}X_i^2-(\overline{X})^2.$$

Nếu mẫu cho dưới dạng bảng thì ta có: $$\hat{S}2=\dfrac{1}{n}\sum_{i=1}{n}(x_i-\overline{X})2n_i=\dfrac{1}{n}\sum\limits_{i=1}{n}x_i^2n_i-(\overline{X})^2.$$

Chú ý.

  1. Thống kê $\hat{S}$ gọi là độ lệch chuẩn mẫu chưa hiệu chỉnh và $\hat{s}$ là giá trị của $\hat{S}$với mẫu đã cho.
  2. Thống kê $S$ gọi là độ lệch chuẩn mẫu đã hiệu chỉnh và $s$ là giá trị của $S$ với mẫu đã cho.

Ví dụ: Tuổi thọ (đơn vị: 10 giờ) một loại linh kiện do công ty A sản xuất ra được kiểm tra ngẫu nhiên, kết quả ghi thành bảng sau:

Trung bình mẫu trong nguyên lý thống kê năm 2024

  1. KHÁI NIỆM

Khoảng tin cậy là một dãy giá trị mà trong đó các tham số của tổng thể như số trung bình

((), tỉ lệ (p) và phương sai ((2) cần được ước lượng nằm trong khoảng này. Ứơc lượng khoảng

tin cậy là một hình thức dự báo trong thống kê, một chỉ tiêu kinh tế nào đó có thể được ước

lượng tại một điểm nào đó (dự báo điểm) hay nằm trong một khoảng nào đó (dự báo khoảng)

với độ tin cậy cho trước.

Ví dụ: Với độ tin cậy 90%, một mẫu gồm 16 quan sát có trung bình từ một tổng thể có

phân phối chuẩn với độ lệch chuẩn s = 6 thì trung bình tổng thể ( có giá trị trong khoảng từ

17,4675 đến 22,5325.

Khoảng tin cậy cho trung bình tổng thể được ước lượng dựa vào giá trị được quan sát

của trung bình mẫu. Ðặt ( là một tham số chưa biết của tổng thể. Giả sử rằng chúng ta dựa vào

thông tin của mẫu quan sát, tìm những biến ngẫu nhiên A và B sao cho:

P ( A < q < B ) = 1 - 

trong đó (1 - () là độ tin cậy (level of confidence)

và 100 (1 - ()% là khoảng tin cậy cho (, khoảng này sẽ chứa các tham số của tổng thể.

II. ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO TRUNG BÌNH TỔNG THỂ (khi biết phương sai s2 )

Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n quan sát từ một phân phối chuẩn với

trung bình ( và phương sai (2, và trung bình mẫu là Ġ. Một khoảng tin cậy 100 (1- ()% cho

trung bình tổng thể ( được xác định như sau:

Trong đóĠ là một số sao cho P ( Z ľ) = P ( Z < ĭ) Ľ

và biến ngẫu nhiên Z có phân phối chuẩn tắc:Ġ