logo-maybe-vn
Mở app

Mọi Người Đều Nói Dối - Những khía cạnh của con người dưới cái nhìn của một nhà khoa học dữ liệu

Trên internet, chúng ta thường cố gắng tạo ra một ấn tượng hoàn hảo cho những người theo dõi chúng ta trên các trang mạng xã hội. Nhưng đồng thời, khi chúng ta “ẩn danh”, chúng ta cũng nói cho internet biết những bí mật đen tối nhất của mình. Chúng ta trung thực với internet khác với cách mà chúng ta trung thực với nhau. Có phải internet biết về chúng ta nhiều hơn chúng ta nghĩ hay không? Rất có thể là như thế. Nó biết bạn đang muốn mua gì, có khả năng sẽ xem bộ phim nào tiếp theo, hay thậm chí là biết cả xu hướng tình dục của bạn.

Trong quyển sách Mọi Người Đều Nói Dối - Dữ Liệu Lớn, Dữ Liệu Mới Và Những Điều Internet Tiết Lộ Về Chính Chúng Ta của Seth Stephens-Davidowitz, một nhà khoa học dữ liệu tại Google có bằng tiến sĩ kinh tế, tác giả lập luận rằng dữ liệu lớn đang cung cấp một cái nhìn sâu sắc về con người. Bằng việc phân tích dữ liệu lớn từ Google, Facebook, PornHub,... tác giả đã mang lại những tiết lộ bất ngờ liên quan đến phân biệt chủng tộc, bất an về tình dục, những lời nói dối,... Dữ liệu lớn là một thuật ngữ mơ hồ dùng để mô tả khối lượng, tính đa dạng và chất lượng tuyệt đối của dữ liệu mà công nghệ hiện đại cung cấp cho chúng ta. Tác giả đánh giá cao dữ liệu lớn trên internet bởi chúng có tính trung thực, mới lạ, phong phú và phù hợp với các thử nghiệm ngẫu nhiên có đối chứng.

Mình phải thừa nhận rằng lượng dữ liệu trong cuốn sách này là rất “lớn” đối với mình. Tác giả đưa ra vô vàn những kết luận mà ông rút ra được khi làm việc với tư cách một nhà khoa học dữ liệu, trong đó có những kết luận rất khác với những gì mình từng nghĩ, ví dụ như những người ở vùng khí hậu ấm có xu hướng ít bị trầm cảm hơn những người ở vùng khí hậu lạnh, người ta thích tìm kiếm chuyện cười khi mọi thứ đang tốt đẹp hơn là khi đang gặp trắc trở, hay những tin tức tích cực thì dễ lan truyền hơn những tin tức tiêu cực. Việc phân tích nguồn dữ liệu chính thức cũng lật tẩy được sự dối trá vốn có của con người chúng ta khi được hỏi về tình trạng học tập, tài chính, việc làm,... Chúng ta thường nói dối, dù là khi đang làm khảo sát nặc danh, để tạo ra ấn tượng tốt và che giấu những điều đáng xấu hổ. Thói quen “nói dối vô hại” trong đời sống thường ngày đã ăn sâu vào chúng ta, khiến cho chúng ta cũng nói dối trong lúc làm khảo sát.

Bạn cảm thấy thế nào về việc các trang web trên internet thu thập thông tin về bạn? Chắc sẽ có nhiều người cho rằng việc đó giống như là “bị soi mói” và cảm thấy khó chịu. Nhưng mình tin rằng việc thu thập thông tin trên internet cũng có mặt tốt. Những dữ liệu này giúp cho các trang web biết cách tiếp thị tốt hơn theo nhu cầu của chúng ta, và cũng có thể được sử dụng để cải thiện xã hội nữa. Tác giả tin rằng việc thu thập dữ liệu về các vấn đề của thế giới là bước đầu tiên để khắc phục các vấn đề ấy. Ví dụ như số người tìm kiếm các cụm từ liên quan đến tự sát ở một khu vực nhất định tăng đột biến, đây là một dấu hiệu đáng báo động. Dựa vào điều này, chính phủ có thể xem xét những cách để tác động tốt hơn đến cuộc sống của người dân khu vực đó.

Điều quan trọng trong việc sử dụng dữ liệu lớn là khả năng sử dụng các mối tương quan để dự đoán hành vi và tình trạng của các cá nhân. Quá trình dự đoán này thật sự rất phức tạp. Mình rất nể phục công sức của tác giả khi ông liên tục đưa ra các nghiên cứu và số liệu của các nhà khoa học khác để bổ trợ, so sánh, đối chiếu cho những kết luận của ông. Các mối tương quan rất dễ tìm thấy, thế nhưng không phải mối tương quan nào cũng ngụ ý cho quan hệ nhân quả. Càng xem xét kỹ, càng có nhiều khả năng chúng ta sẽ bắt gặp mối tương quan ngẫu nhiên giữa hai biến số có vẻ hoàn toàn độc lập với nhau. Thế nên tác giả đã để lại lời cảnh báo rằng dữ liệu lớn đi kèm với trách nhiệm lớn. Nếu đưa ra kết luận sai có thể dẫn đến hậu quả khó lường. 

Điều mình đánh giá cao ở cuốn sách này là cách viết của tác giả mang tính đàm thoại và dễ nắm bắt, mặc dù bản thân chủ đề vốn khó hiểu. Có nhiều ví dụ tương tự với nhau, có lẽ là do tác giả sợ rằng độc giả không hiểu được quan điểm của ông ngay lập tức. Một số kết luận không có gì đáng ngạc nhiên, ví dụ như những kết luận về thành kiến giới tính và phân biệt chủng tộc, nhưng quá trình đưa ra những kết luận đó thì rất đáng đọc. Đối với những độc giả đang muốn tìm hiểu về ngành phân tích dữ liệu thì mình tin rằng cuốn sách này rất hữu ích đó!

Chấm điểm: 8/10.

  • 32
  • 0Bình luận
Bình luận
BÀI TƯƠNG TỰ
30

Đăng nhập một phát, tha hồ bình luận (^3^)