Yêu nhau tình cờ…
1.Một trong những vấn đề dễ sai nhất của bọn dốt xác suất thống kê như mình là hay kiểm tra xem hai thứ chả liên quan tới nhau có mối tương quan không thông qua một hàm thần thánh có tên là CORREL – viết tắt của Correlation trong Excel. Hàm này trả lại giá trị giữa hai cực là -1 và 1. Nếu mà là -1 thì có vẻ tương quan âm lắm lắm (nghĩa là anh rẽ trái, chị rẽ phải), nếu mà là +1 thì có vẻ tương quan dương lắm lắm (nghĩa là anh đi đâu chị đi đó) còn nếu mà gần 0 thì chả ai liên quan tới ai.
2.Cái hàm này có hai thứ nguy hiểm khủng khiếp. Thứ nhất hơi hơi nguy hiểm là việc giá trị của hàm chỉ nói lên được là hai thứ đang được xét nghiệm có liên quan tới nhau hay không, còn liên quan như thế nào (định lượng) thì không nói được.
Ví dụ : Số lượng người bị tiểu đường hàng năm có liên quan (dương) tới trung bình lượng đường mỗi người hấp thụ hàng năm. Có nghĩa là, số người tiểu đường tăng song song với trung bình lượng đường mỗi người hấp thụ. Tăng song song như thế nào thì không biết, ví dụ là lượng đường tăng gấp đôi thì số lượng người tiểu đường tăng gấp mấy? Không ai biết rõ – chính xác hơn là hàm thần thánh CORREL không chỉ ra được
Thứ nguy hiểm thứ hai mới là điều đau khổ nhất. Thứ này được nói ngắn gọn trong một câu tiếng Anh như vầy :
Ngắn gọn, chúng nó có liên quan tới nhau nhưng là do yếu tố ẩn – yếu tố thứ ba khiến chúng VÔ TÌNH liên quan tới nhau chứ không phải sự liên quan có chủ đích.
3.Một ví dụ kinh điển cho sai lầm thứ hai được đăng trên Scientific American dưới tên “Sex Makes You Rich? Why We Keep Saying “Correlation Is Not Causation” Even Though It’s Annoying” Bài báo chỉ trích một kết luận thống kê (được đăng tải trên Gawkers) nói rằng nếu người ta quan hệ tình dục càng nhiều, người ta càng có khả năng nhận lương cao hơn.
Lần ngược lại đúng nghiên cứu khoa học thì tác giả (Nick Drydakis) đã có kết luận khoa học hơn rất nhiều so với title được giật trên Gawkers. Tác giả cho rằng việc quan hệ tình dục nhiều hơn là một trong những yếu tố chỉ ra rằng người đó có sức khoẻ tốt hơn dẫn tới khả năng kiếm được tiền cao hơn.
4.Vậy thì bạn nên cẩn thận với mọi mối tương quan. Hãy cố gắng giải thích rõ lý do đằng sau của mối tương quan là gì thay vì việc chỉ đưa ra kết luận với một con số nào đó từ -1 tới +1 rồi cắm đầu vào tin kết luận của mình.
“Này sếp, nếu em burn thêm tiền cho agency A, doanh thu/số like trên FB/số view trên Youtube của anh sẽ tăng. Em có biểu đồ đàng hoàng, tính toán bằng Excel hẳn hoi. Burn tiếp thôi sếp, ngại gì nữa?”
Nghe quen, phải không?
24Jul :
Bài này khá hay, đến từ tác giả của cuốn Spurious Correlations. Có khá nhiều ví dụ tương quan ngẫu nhiên nực cười trong bài (+sách).
4 thoughts on “Yêu nhau tình cờ…”
Mấy cái ví dụ kiểu này cũng được nhắc tới nhiều trong Freakconomics và SuperFreakconomics – mấy ông kinh tế giỏi giỏi cũng sai như thường :-s
dạ quen ạ ><