1. 𝑯𝒆̣̂ 𝒔𝒐̂́ 𝒕𝒓𝒐𝒏𝒈 𝑳𝒐𝒈𝒊𝒔𝒕𝒊𝒄 𝑹𝒆𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒍𝒂̀ 𝒈𝒊̀?
Trong Logistic Regression, mục tiêu là dự đoán xác suất của một sự kiện (ví dụ: có bệnh hay không). Mô hình thực hiện việc này thông qua hàm sigmoid, chuyển đổi tổng trọng số thành giá trị nằm trong khoảng từ 0 đến 1. Công thức tổng quát được biểu diễn dưới dạng:
logit(p) = log(p/(1-p)) = beta0 + beta1 * x
Trong đó:
- p là xác suất dự đoán,
- beta0 là hệ số chặn (intercept),
- beta1 là hệ số (coefficient) của biến x.
Ý nghĩa của beta1:
- Nếu beta1 > 0: Khi biến x tăng 1 đơn vị, log-odds (tỉ số log của xác suất xảy ra sự kiện so với không xảy ra) tăng, tức là tỷ lệ odds (p/(1-p)) cũng tăng và từ đó xác suất p tăng.
- Nếu beta1 < 0: Khi x tăng 1 đơn vị, log-odds giảm, odds giảm và xác suất p giảm.
Để diễn giải trực quan hơn, ta có thể chuyển beta1 thành dạng tỷ lệ odds bằng cách tính exp(beta1). Ví dụ, nếu beta1 = 0.69 thì exp(0.69) khoảng 2, nghĩa là odds tăng gấp đôi khi biến x tăng 1 đơn vị. 

2. 𝑯𝒆̣̂ 𝒔𝒐̂́ 𝒕𝒓𝒐𝒏𝒈 𝑳𝒊𝒏𝒆𝒂𝒓 𝑹𝒆𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒍𝒂̀ 𝒈𝒊̀?
Trong Linear Regression, mô hình dự đoán giá trị liên tục (như giá nhà, nhiệt độ, v.v...) thông qua một phương trình tuyến tính đơn giản:
y_hat = w0 + w1 * x
Ở đây:
- w0 là intercept,
- w1 là hệ số của biến x.
Ý nghĩa của w1:
- Khi x tăng 1 đơn vị, giá trị dự đoán y_hat tăng thêm đúng w1 (nếu w1 dương) hoặc giảm (nếu w1 âm).
- Mối quan hệ giữa x và y_hat là sự thay đổi trực tiếp và tuyến tính, không liên quan đến xác suất hay odds như trong Logistic Regression. 

3. 𝑺𝒖̛̣ 𝒌𝒉𝒂́𝒄 𝒃𝒊𝒆̣̂𝒕 𝒄𝒉𝒊́𝒏𝒉 𝒈𝒊𝒖̛̃𝒂 𝑳𝒐𝒈𝒊𝒔𝒕𝒊𝒄 𝑹𝒆𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒗𝒂̀ 𝑳𝒊𝒏𝒆𝒂𝒓 𝑹𝒆𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏
Một số điểm khác biệt quan trọng giữa hai mô hình này bao gồm:
𝑩𝒂̉𝒏 𝒄𝒉𝒂̂́𝒕 đ𝒂̂̀𝒖 𝒓𝒂:
𝘓𝘪𝘯𝘦𝘢𝘳 𝘙𝘦𝘨𝘳𝘦𝘴𝘴𝘪𝘰𝘯: Dự đoán giá trị thực, không giới hạn (có thể âm, dương).
𝘓𝘰𝘨𝘪𝘴𝘵𝘪𝘤 𝘙𝘦𝘨𝘳𝘦𝘴𝘴𝘪𝘰𝘯: Dự đoán xác suất, giá trị luôn nằm trong khoảng từ 0 đến 1.
𝒀́ 𝒏𝒈𝒉𝒊̃𝒂 𝒄𝒖̉𝒂 𝒉𝒆̣̂ 𝒔𝒐̂́:
𝘓𝘪𝘯𝘦𝘢𝘳 𝘙𝘦𝘨𝘳𝘦𝘴𝘴𝘪𝘰𝘯: Hệ số cho biết khi x tăng 1 đơn vị, giá trị y_hat thay đổi trực tiếp thêm w1.
𝘓𝘰𝘨𝘪𝘴𝘵𝘪𝘤 𝘙𝘦𝘨𝘳𝘦𝘴𝘴𝘪𝘰𝘯: Hệ số cho biết khi x tăng 1 đơn vị, log-odds thay đổi tương ứng; sau đó, ta có thể chuyển thành tỷ lệ odds bằng cách lấy exp(beta1) để hiểu mức độ tác động.
𝑷𝒉𝒖̛𝒐̛𝒏𝒈 𝒑𝒉𝒂́𝒑 𝒖̛𝒐̛́𝒄 𝒍𝒖̛𝒐̛̣𝒏𝒈:
𝘓𝘪𝘯𝘦𝘢𝘳 𝘙𝘦𝘨𝘳𝘦𝘴𝘴𝘪𝘰𝘯: Sử dụng phương pháp bình phương tối thiểu (Least Squares) để tối ưu.
𝘓𝘰𝘨𝘪𝘴𝘵𝘪𝘤 𝘙𝘦𝘨𝘳𝘦𝘴𝘴𝘪𝘰𝘯: Sử dụng Maximum Likelihood Estimation (MLE) do hàm sigmoid không phù hợp với cách giải tích như trong Linear Regression.
Nhờ những khác biệt này, các hệ số trong Logistic Regression được diễn giải dưới dạng tỷ lệ odds, giúp chúng ta hiểu rõ hơn mức độ ảnh hưởng của từng biến đầu vào lên xác suất xảy ra một sự kiện.
Không có nhận xét nào:
Đăng nhận xét
Cảm ơn bạn rất nhiều ạ