Hướng dẫn sử dụng stata 12 chèn dữ liệu excel

 Stata là phần mềm thống kê để quản lý, phân tích và vẽ đồ thị của số liệu. Sức mạnh lớn nhất của Stata là hồi quy. Ưu điểm: dùng để phân tích dữ liệu theo mẫu, có khả năng áp dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi quy.

1. Hướng dẫn cài đặt phần mềm Stata Bước 1: Tải bản rar phần mềm stata từ đường link bên dưới. drive.google/file/d/1Aw5lXDmEk2DvnMi2mjKH-Hc1yP5iQF_s/view Bước 2: Sau khi tải xuống thành công. Các bạn hãy giải nén file Stata “ Extract Here ”

Bước 3: Sau khi hoàn thành giải nén các bạn sẽ nhận được một file Stata 16 như hình.

Bước 4: Các bạn vào file Stata 16 và cho chạy chương trình RunAsDate.

Bước 5: Các bạn chọn “ Browse... ”

Bước 6: Khi hiện bảng này lên các bạn chọn “ Open ”

Bước 7: Và cuối cùng các bạn chọn vào “ Create Desktop Shortcut ” và “ Close ” chương trình

2. Nhập liệu vào Stata 2. Nhập liệu từ file Excel vào Stata - Trước khi đưa dữ liệu từ Excel vào Stata, chúng ta cần Mã hóa dữ liệu trên Excel [Dữ liệu chữ thành dữ liệu số]

  • Tất cả các biến đã từ dữ liệu chữ trở thành dữ liệu số, do đó mới thực hiện được bước nhập dữ liệu vào Stata. Nhập dữ liệu từ Excel vào Stata: Giao diện phần mềm Stata:

Bước 1: Vào File => Chọn Import => Chọn Excel spreadsheet [.xls;.xlsx] Khi đó sẽ hiện ra bảng import excel. Bước 2: Chọn Browse => Chọn file excel cần đưa vào Stata => mở

Bước 3: Chọn vào Import first row as variable names [chọn hàng đầu tiên để đặt tên cho các biến] => nhấn OK

Để chỉnh sửa lại bộ dữ liệu chúng ta nhập vào rồi thì chọn vào hình Data editor [edit] như sau:

Xuất hiện bảng Data Editor [Edit] - [Untitled]

Bước 2: Ta tiến hành nhập thủ công số liệu vào bảng Ta có ví dụ số liệu như sau

Bước 3: Tiến hành tính toán, trình bày từng biến theo yêu cầu 3. Trình bày dữ liệu

  • Minh họa trên số liệu của 72 sinh viên lớp môn Thống Kê Ứng Dụng ca 4 thứ 3 Bước 1: Chọn File -> Import -> Excel spreadsheet [*.xls, xlsx] Bước 2: Nhấn Browse ... [chọn file Excel cần đưa vào Stata]_ Bấm Open Bước 3: Nhấn Import first row as variable names -> OK 3. Trình bày dữ liệu bằng các đại lượng thống kê 3.1. Phân tổ dữ liệu Bước 1: Tạo biến mới bằng lệnh:

generate tenbienmoi = biểu thức toán học cho kết quả là giá trị của biến mới

Bước 2: Mã hóa phân loại các biến bằng lệnh:

recode varlist [rule] [[rule] ...] [, generate[newvar]]

Ví dụ: Phân tổ biến T8TIENDIEN

Nhập lệnh:

gen T8TIENDIENPT = T8TIENDIEN

recode T8TIENDIENPT [100000/700000=1] [700000/1300000=2] [1300000/1900000=3] [1900000/2500000=4] [2500000/3100000=5]

tab T8TIENDIENPT

\=> Với dữ liệu không phân nhóm, Mode là giá trị có tần số lớn nhất. 3.1. Đối với biến định lượng

  • Ví dụ dữ liệu Số người trong gia đình?
  • Nhập lệnh tại Command: sum T3SONGUOITRONGGIADINH [Số đối tượng quan sát, giá trị trung bình, độ lệch chuẩn, Min, Max]
  • Nhập lệnh tại Command: Sum T3SONGUOITRONGGIADINH, detail [Trung vị, tứ phân vị, số đối tượng quan sát, giá trị trung bình, phương sai, độ lệch chuẩn, hệ số bất đối xứng, hệ số nhọn]

3. Trình bày dữ liệu bằng đồ thị 3.2. Hướng dẫn vẽ đồ thị

  • Biểu đồ tròn [Graphics -> Pie Chart]
  • Biểu đồ cột [Graphics ->Histogram]
  • Biểu đồ hộp [Graphics -> Box Plot] Ví dụ dữ liệu Chỗ ở gia đình hiện nay? Biểu đồ tròn: Bước 1: Chọn Graphics → Pie chart Bước 2: Chọn biến cần vẽ tại Category variable → Nhấn OK

Biểu đồ:

3.2. Hướng dẫn gán tên biến vào biểu đồ 3.2.2. Biểu đồ tròn Graphics -> Pie Chart -> Legend -> Override default keys -> Nhập nhãn cần gán cho Biểu đồ. Ví dụ: Đối với biến Chỗ ở của gia đình bạn? Gán nhãn như sau: 1 “ Xã [nông thôn] ” 2 “ Thị trấn/ thị xã ” 3 “ Thành thị ”

Gán nhãn như sau: 1 " 1 = 0 - 3 trieu " 2 " 2 = 3 - 6 trieu " 3 " 3 = 6 - 9 trieu " 4 " 4 = 9 - 12 trieu " 5 " 5 = 12 - 15 trieu " 6 " 6 = 15 - 18 trieu " 7 " 7 = 18 - 21 trieu " 8 " 8 = tren 21 trieu " Hình ảnh minh họa

Kết quả:

3.2.2. Biểu đồ hộp Graphics -> Box plot

  • Cách gán tên biến vào Biểu đồ hộp : Graphics -> Box plot -> Legend -> Show Legend -> Override default keys -> Nhập nhãn cần gán cho Biểu đồ. Ví dụ: Biến Chi tiêu của gia đình bạn trong tháng 8/2021 là? Gán nhãn như sau: 1 " 1 = 0 - 3 trieu " 2 " 2 = 3 - 6 trieu " 3 " 3 = 6 - 9 trieu " 4 " 4 = 9 - 12 trieu " 5 " 5 = 12 - 15 trieu " 6 " 6 = 15 - 18 trieu " 7 " 7 = 18 - 21 trieu " 8 " 8 = tren 21 trieu " Hình ảnh minh họa

Khi có tần suất:

3. Tổng quát số liệu của dữ liệu định lượng

Để liệt kê từng biến và so sánh được ta sẽ dùng lệnh: bysort Varlist 1: Lệnh Varlist 2 [có thể thêm lệnh phụ]. Ví dụ: Nếu ta muốn xem biến “ Chỗ ở ” T2CHOO có bao nhiêu nhà có “ tiền điện ” T8TIENDIEN hơn 1.000 và liệt kê? Bước 1: Ta dùng lệnh bysort để có thể dùng lệnh cho các giá trị trong biến. bysort T2CHOO:.... Bước 2: Ta sẽ lựa lệnh theo nhu cầu [sum, tab, list,..] trong TH ví dụ ta sẽ dùng lệnh “list” để có thể nhìn rõ được tần suất của các giá trị. bysort T2CHOO: list T8TIENDIEN Bước 3: Ta sẽ thêm yêu cầu theo đề. bysort T2CHOO: list T8TIENDIEN if T8TIENDIEN >= 1000000.

Chủ Đề