Hệ số hồi quy và hệ số tương quan cùng đánh giá cường độ của mối liên hệ

Hệ số tương quan [tiếng Anh: Correlation Coefficient] là chỉ số thống kê đo lường mức độ mạnh yếu của mối quan hệ giữa hai biến số.

Hình minh họa. Nguồn: Investopedia

Khái niệm

Hệ số tương quan trong tiếng Anh là Correlation coefficient.

Hệ số tương quan là chỉ số thống kê đo lường mức độ mạnh yếu của mối quan hệ giữa hai biến số. Trong đó:

Hệ số tương quan có giá trị từ -1.0 đến 1.0. Kết quả được tính ra lớn hơn 1.0 hoặc nhỏ hơn -1 có nghĩa là có lỗi trong phép đo tương quan.

- Hệ số tương quan có giá trị âm cho thấy hai biến có mối quan hệ nghịch biến hoặc tương quan âm [nghịch biến tuyệt đối khi giá trị bằng -1]

- Hệ số tương quan có giá trị dương cho thấy mối quan hệ đồng biến hoặc tương quan dương [đồng biến tuyệt đối khi giá trị bằng 1]

- Tương quan bằng 0 cho hai biến độc lập với nhau.

Cách tính hệ số tương quan Pearson

Có nhiều loại hệ số tương quan, nhưng loại phổ biến nhất là tương quan Pearson. Chỉ số này đo lường sức mạnh và mối quan hệ tuyến tính giữa hai biến. Nó không thể đo lường các mối quan hệ phi tuyến giữa hai biến và không thể phân biệt giữa các biến phụ thuộc và biến độc lập.

Công thức tính hệ số tương quan Pearson

Trong đó:

ρxy:          Hệ số tương quan Pearson
Cov[x, y]: Hiệp phương sai của biến x và y
σx:           Độ lệch chuẩn của x
σy:            Độ lệch chuẩn của y

Độ lệch chuẩn thể hiện độ phân tán dữ liệu từ so với mức trung bình. Hiệp phương sai thể hiện mối quan hệ tuyến tính giữa hai biến.

Ứng dụng của hệ số tương quan trong tài chính

Sức mạnh của mối quan hệ dựa trên giá trị của hệ số tương quan. Ví dụ: Giá trị 0,2 cho thấy có mối tương quan đồng biến, nhưng nó yếu và không đáng kể. Các chuyên gia cho rằng tương quan có ý nghĩa khi ít nhất đạt giá trị 0,8. Tuy nhiên, hệ số tương quan với giá trị tuyệt đối là 0,9 hoặc lớn hơn sẽ thể hiện mối quan hệ rất mạnh mẽ.

Ví dụ 1:
Một hệ số tương quan có thể được tính để xác định mức độ tương quan giữa giá dầu thô và giá cổ phiếu của một công ty sản xuất dầu, như Exxon Mobil Corporation. Vì các công ty dầu mỏ kiếm được lợi nhuận lớn hơn khi giá dầu tăng nên hai biến này có mối tương quan dương.

Ví dụ 2:
Hệ số tương quan dùng để xác định mức độ hiệu quả của một quĩ tương hỗ so với chỉ số chuẩn của nó [benchmark index], hoặc các tài sản hoặc quĩ khác. Bằng cách thêm một quĩ tương hỗ thấp có mức độ tương quan thấp hoặc tương quan nghịch vào danh mục đầu tư hiện có, nhà đầu tư đạt được lợi ích đa dạng hóa.

Nói cách khác, các nhà đầu tư có thể sử dụng các tài sản hoặc chứng khoán có mối tương quan âm để phòng ngừa danh mục đầu tư của họ và giảm rủi ro biến động của thị trường.

Thống kê về mối tương quan cũng cho phép các nhà đầu tư xác định khi nào mối tương quan giữa hai biến thay đổi. Ví dụ, cổ phiếu ngân hàng thường có mối tương quan tích cực với lãi suất vì lãi suất cho vay thường được tính dựa trên lãi suất thị trường:

- Nếu giá cổ phiếu của một ngân hàng đang giảm trong khi lãi suất đang tăng, các nhà đầu tư có thể đặt ra nghi vấn gì đó.

- Nếu giá cổ phiếu của các ngân hàng tương tự trong ngành cũng tăng, nhà đầu tư có thể kết luận rằng cổ phiếu ngân hàng giảm không phải do lãi suất, có thể do ngân hàng hoạt động kém hoặc gặp vấn đề về nội bộ...

[Tài liệu tham khảo: Investopedia]

Tuệ Thi

Các hệ số hồi quy trong mô hình hồi quy tuyến tính bội còn có tên gọi khác là hệ số hồi quy riêng phần. Chúng ta gọi nó là hệ số hồi quy riêng phần bởi nó cho biết mức thay đổi của Y khi một đơn vị của Xi thay đổi [Xi có thể là X1, X2, X3 …] trong điều kiện các biến độc lập khác không thay đổi, nghĩa là chúng ta loại trừ sự ảnh hưởng của các biến độc lập khác lên Y. “Riêng phần” – phần tác động lên Y của riêng biến Xi.

Hệ số hồi quy vừa phản ánh mức độ tác động đồng thời cũng thể hiện chiều tác động của biến độc lập lên biến phụ thuộc. Nếu hệ số hồi quy mang dấu dương [không có dấu hoặc dấu +], biến độc lập có sự tác động thuận chiều lên biến phụ thuộc; nếu hệ số hồi quy mang dấu âm [dấu -], biến độc lập có sự tác động ngược chiều lên biến phụ thuộc. Khi biến độc lập tác động thuận chiều lên biến phụ thuộc, biến độc lập tăng sẽ kéo theo sự tăng lên của biến phụ thuộc; khi biến độc lập tác động nghịch chiều lên biến phụ thuộc, biến độc lập tăng sẽ kéo theo sự giảm xuống của biến phụ thuộc.

1. Hệ số hồi quy chuẩn hóa và chưa chuẩn hóa

Trong hồi quy, thường chúng ta sẽ có hai hệ số hồi quy: chưa chuẩn hóa [trong SPSS gọi là B] và đã chuẩn hóa [trong SPSS gọi là Beta]. Mỗi hệ số hồi quy này có vai trò khác nhau trong việc diễn giải hàm ý quản trị của mô hình hồi quy.

1.1 Hệ số hồi quy chưa chuẩn hóa

Hệ số hồi quy [trọng số hồi quy] chưa chuẩn hóa phản ánh sự thay đổi của biến phụ thuộc khi một đơn vị biến độc lập Xi thay đổi và các biến độc lập còn lại được giữ nguyên. Chúng ta không nhận xét thứ tự tác động của các biến độc lập lên biến phụ thuộc dựa vào hệ số hồi quy chưa chuẩn hóa bởi các biến độc lập không đồng nhất về đơn vị hoặc nếu đồng nhất về đơn vị thì độ lệch chuẩn các biến tham gia vào hồi quy cũng khác nhau. Sự khác biệt về độ lệch chuẩn hoặc đơn vị đo khiến việc đưa các biến độc lập vào cùng một phép so sánh là hoàn toàn không chính xác, do lúc này các biến không cùng nằm trong một hệ quy chiếu.

Trong SPSS, hệ số hồi quy chưa chuẩn hóa được ký hiệu là B. Phương trình hồi quy chưa chuẩn hóa có dạng:

Y = B0 + B1X1 + B2X2 + … + BnXn + ε

Trong đó:

  • Y: biến phụ thuộc
  • X1, X2, Xn: biến độc lập
  • B0: hằng số hồi quy
  • B1, B2, Bn: hệ số hồi quy chưa chuẩn hóa
  • ε: phần dư

Ví dụ: Giả sử, biến Y là Tốc độ chạy của xe [km/h], biến X1 là Khối lượng của xe [kg], biến X2 là Đường kính bánh xe [cm] … Các biến độc lập Khối lượng của xe, Đường kính bánh xe sẽ tác động đến Tốc độ chạy của xe [X1, X2…. tác động đến Y]. Khi đó chúng ta sẽ diễn giải hàm ý quản trị như sau:

  • Trong điều kiện các biến khác không thay đổi, khi khối lượng của xe [biến X1] thay đổi 1kg thì tốc độ chạy của xe [Y] thay đổi B1 km/h.
  • Trong điều kiện các biến khác không thay đổi, khi đường kính bánh xe [biến X2] thay đổi 1cm thì tốc độ chạy của xe [Y] thay đổi B2 km/h.

Cụm “thay đổi” trong câu nhận xét sẽ tùy trường hợp hệ số hồi quy dương hay âm mà chuyển thành “tăng” và “giảm”.

Ở ví dụ trên đây, thực tế chúng ta thấy rằng, khối lượng xe tăng làm xe chạy chậm hơn, nghĩa là hệ số hồi quy B1 âm [tương quan nghịch, X giảm Y tăng, X tăng Y giảm]. Chính vì vậy, câu nhận xét sẽ sửa lại: “Trong điều kiện các biến khác không thay đổi, khi khối lượng của xe [biến X1] tăng 1kg thì tốc độ chạy của xe [Y] giảm B1 km/h”.

Ngược lại, trên thực tế, đường kính bánh xe tăng sẽ làm xe chạy nhanh hơn, nghĩa là hệ số hồi quy B2 dương [tương quan thuận, X tăng Y tăng, X giảm, Y giảm]. Chính vì vậy, câu nhận xét sẽ sửa lại: “Trong điều kiện các biến khác không thay đổi, khi đường kính bánh xe [biến X2] tăng 1cm thì tốc độ chạy của xe [Y] tăng B2 km/h”.

1.2 Hệ số hồi quy chuẩn hóa

Trong nghiên cứu, chúng ta thường xem xét tầm quan trọng của các biến độc lập. Nếu dùng hệ số hồi quy chưa chuẩn hóa, chúng ta không thể so sánh được vì đơn vị đo và sai số chuẩn của các biến là khác nhau. Vì vậy, chúng ta sẽ cần dùng đến hệ số đã chuẩn hóa để đưa tất cả các biến cần so sánh về cùng một hệ quy chiếu.

Phương trình hồi quy chuẩn hóa có dạng:

Y = Beta1X1 + Beta2X2 + … + BetanXn + ε

Trong đó:

  • Y: biến phụ thuộc
  • X1, X2, Xn: biến độc lập
  • Beta1, Beta2, Betan: hệ số hồi quy chưa chuẩn hóa
  • ε: phần dư

Chúng ta sẽ căn cứ vào trị tuyệt đối của hệ số hồi quy chuẩn hóa để so sánh tầm quan trọng của các biến độc lập [mức tác động của các biến độc lập]. Trị tuyệt đối hệ số Beta lớn hơn thì tầm quan trọng của biến độc lập đó lớn hơn, biến đó tác động mạnh hơn lên biến phụ thuộc. Cũng lưu ý rằng, tổng các hệ số hồi quy chuẩn hóa cộng lại không bắt buộc bằng 1.

Hệ số hồi quy chuẩn hóa được tính từ hệ số hồi quy chưa chuẩn hóa theo biến thiên của biến độc lập và biến phụ thuộc trong mẫu. Công thức liên hệ giữa hai hệ số hồi quy như sau:

Trong đó:

  • Y: biến phụ thuộc
  • X: biến độc lập
  • BetaX: hệ số hồi quy chuẩn hóa của biến X
  • BX: hệ số hồi quy chưa chuẩn hóa của X
  • SX, SY: độ lệch chuẩn của biến X và biến Y

Để dễ hiểu hơn, chúng ta sẽ cùng xem xét ví dụ bên dưới. Ở đây có 3 biến tham gia vào hồi quy: biến độc lập là F_DN, F_LD và biến phụ thuộc là F_HL.

Chúng ta đối chiếu với công thức chuyển đổi và lấy các thông số cần thiết để tính Beta của biến F_TL.

Đối chiếu kết quả Beta của biến F_TL vừa tính được với chỉ số Beta trong bảng Coefficients, hai giá trị này hoàn toàn trùng khớp với nhau.

2. Giả thuyết ý nghĩa hệ số hồi quy

Chúng ta sẽ đánh giá hệ số hồi quy của mỗi biến độc lập có ý nghĩa trong mô hình hay không dựa vào kiểm định t [student] với giả thuyết H0: Hệ số hồi quy của biến độc lập Xi bằng 0. Mô hình hồi quy có bao nhiêu biến độc lập, chúng ta sẽ đi kiểm tra bấy nhiêu giả thuyết H0. Kết quả kiểm định:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến X1 có tác động lên biến phụ thuộc.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.

Trong SPSS, các số liệu của kiểm định t được lấy từ bảng hệ số hồi quy Coefficients. Cũng lưu ý rằng, nếu một biến độc lập không có ý nghĩa thống kê trong kết quả hồi quy, chúng ta sẽ kết luận biến độc lập đó không có sự tác động lên biến phụ thuộc mà không cần thực hiện loại biến và phân tích lại hồi quy.

Nếu bạn gặp khó khăn khi kết quả hồi quy không có ý nghĩa, giá trị R2 quá thấp, các biến độc lập bị loại nhiều, vi phạm đa cộng tuyến, vi phạm các giả định hồi quy. Bạn có thể tham khảo dịch vụ xử lý SPSS của Xử Lý Định Lượng để team có thể hỗ trợ bạn xử lý nhanh và hiệu quả nhất.

Video liên quan

Chủ Đề