Hướng dẫn sử dụng stata 12 chèn dữ liệu excel
Stata là phần mềm thống kê để quản lý, phân tích và vẽ đồ thị của số liệu. Sức mạnh lớn nhất của Stata là hồi quy. Ưu điểm: dùng để phân tích dữ liệu theo mẫu, có khả năng áp dụng chúng trong phân tích số liệu điều tra bởi các công cụ hồi quy. 1. Hướng dẫn cài đặt phần mềm Stata Bước 1: Tải bản rar phần mềm stata từ đường link bên dưới. drive.google/file/d/1Aw5lXDmEk2DvnMi2mjKH-Hc1yP5iQF_s/view Bước 2: Sau khi tải xuống thành công. Các bạn hãy giải nén file Stata “ Extract Here ” Bước 3: Sau khi hoàn thành giải nén các bạn sẽ nhận được một file Stata 16 như hình. Bước 4: Các bạn vào file Stata 16 và cho chạy chương trình RunAsDate. Bước 5: Các bạn chọn “ Browse... ” Bước 6: Khi hiện bảng này lên các bạn chọn “ Open ” Bước 7: Và cuối cùng các bạn chọn vào “ Create Desktop Shortcut ” và “ Close ” chương trình 2. Nhập liệu vào Stata 2. Nhập liệu từ file Excel vào Stata - Trước khi đưa dữ liệu từ Excel vào Stata, chúng ta cần Mã hóa dữ liệu trên Excel (Dữ liệu chữ thành dữ liệu số)
Bước 1: Vào File => Chọn Import => Chọn Excel spreadsheet (.xls;.xlsx) Khi đó sẽ hiện ra bảng import excel. Bước 2: Chọn Browse => Chọn file excel cần đưa vào Stata => mở Bước 3: Chọn vào Import first row as variable names (chọn hàng đầu tiên để đặt tên cho các biến) => nhấn OK Để chỉnh sửa lại bộ dữ liệu chúng ta nhập vào rồi thì chọn vào hình Data editor (edit) như sau: Xuất hiện bảng Data Editor (Edit) - [Untitled] Bước 2: Ta tiến hành nhập thủ công số liệu vào bảng Ta có ví dụ số liệu như sau Bước 3: Tiến hành tính toán, trình bày từng biến theo yêu cầu 3. Trình bày dữ liệu
generate tenbienmoi = biểu thức toán học cho kết quả là giá trị của biến mới Bước 2: Mã hóa phân loại các biến bằng lệnh: recode varlist (rule) [(rule) ...] [, generate(newvar)] Ví dụ: Phân tổ biến T8TIENDIEN Nhập lệnh: gen T8TIENDIENPT = T8TIENDIEN recode T8TIENDIENPT (100000/700000=1) (700000/1300000=2) (1300000/1900000=3) (1900000/2500000=4) (2500000/3100000=5) tab T8TIENDIENPT \=> Với dữ liệu không phân nhóm, Mode là giá trị có tần số lớn nhất. 3.1. Đối với biến định lượng
3. Trình bày dữ liệu bằng đồ thị 3.2. Hướng dẫn vẽ đồ thị
Biểu đồ: 3.2. Hướng dẫn gán tên biến vào biểu đồ 3.2.2. Biểu đồ tròn Graphics -> Pie Chart -> Legend -> Override default keys -> Nhập nhãn cần gán cho Biểu đồ. Ví dụ: Đối với biến Chỗ ở của gia đình bạn? Gán nhãn như sau: 1 “ Xã (nông thôn) ” 2 “ Thị trấn/ thị xã ” 3 “ Thành thị ” Gán nhãn như sau: 1 " 1 = 0 - 3 trieu " 2 " 2 = 3 - 6 trieu " 3 " 3 = 6 - 9 trieu " 4 " 4 = 9 - 12 trieu " 5 " 5 = 12 - 15 trieu " 6 " 6 = 15 - 18 trieu " 7 " 7 = 18 - 21 trieu " 8 " 8 = tren 21 trieu " Hình ảnh minh họa Kết quả: 3.2.2. Biểu đồ hộp Graphics -> Box plot
Khi có tần suất: 3. Tổng quát số liệu của dữ liệu định lượng Để liệt kê từng biến và so sánh được ta sẽ dùng lệnh: bysort Varlist 1: Lệnh Varlist 2 (có thể thêm lệnh phụ). Ví dụ: Nếu ta muốn xem biến “ Chỗ ở ” T2CHOO có bao nhiêu nhà có “ tiền điện ” T8TIENDIEN hơn 1.000 và liệt kê? Bước 1: Ta dùng lệnh bysort để có thể dùng lệnh cho các giá trị trong biến. bysort T2CHOO:.... Bước 2: Ta sẽ lựa lệnh theo nhu cầu (sum, tab, list,..) trong TH ví dụ ta sẽ dùng lệnh “list” để có thể nhìn rõ được tần suất của các giá trị. bysort T2CHOO: list T8TIENDIEN Bước 3: Ta sẽ thêm yêu cầu theo đề. bysort T2CHOO: list T8TIENDIEN if T8TIENDIEN >= 1000000. |