Tin KHCN nước ngoài
Phương pháp mới có thể cải thiện dự đoán (20/12/2016)
-   +   A-   A+   In  

Các nhà nghiên cứu tại Trường Đại học Princeton, Columbia và Harvard tại Hoa Kỳ đã tạo ra một phương pháp mới để phân tích dữ liệu lớn tốt hơn, nhằm dự đoán kết quả về chăm sóc sức khỏe, chính trị và các lĩnh vực khác.

Theo tài liệu của Intel, hiện nay thế giới đang tạo ra 1 petabyte dữ liệu trong mỗi 11 giây và nó tương đương với một đoạn video HD dài 13 năm. Bản thân các công ty, doanh nghiệp cũng đang sở hữu Big Data của riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình. Nhà bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng một hệ thống Linux và hồi năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB. Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên quan. Tuy nhiên, để khai thác được các nguồn dữ liệu lớn và đưa ra quyết định thì việc dự báo/dự đoán là rất quan trọng.

 

Để giảm tỷ lệ lỗi ở các phương pháp dự đoán dựa trên việc đánh giá các biến để tìm biến dự báo, các nhà nghiên cứu đã đề xuất một biện pháp mới được gọi là điểm ảnh hưởng hoặc I-score, mang đến khả năng dự đoán của biến tốt hơn. Trong nghiên cứu, các nhà nghiên cứu tìm thấy rằng I-score hiệu quả trong việc phân biệt giữa các biến ồn ào và tiên đoán trong dữ liệu lớn và có thể cải thiện đáng kể tỷ lệ dự đoán.

 

Tác giả nghiên cứu Adeline Lo, cho biết: "I-score được đánh giá đặc biệt tốt trong dữ liệu lớn và có nhiều tương tác phức tạp giữa các biến, là một lợi thế cho các nhà nghiên cứu hoặc chuyên gia chính sách quan tâm về dự đoán trong một lĩnh vực nào đó với dữ liệu lớn”. I-score cải thiện tỷ lệ dự đoán trong dữ liệu ung thư vú từ 70% đến 92%. I-score có thể được áp dụng trong nhiều lĩnh vực, kể cả khủng bố, chiến tranh dân sự, các cuộc bầu cử và các thị trường tài chính.

 

Nghiên cứu này đã được công bố trên tạp chí Proceedings of the National Academy of Sciences.

Nguồn: vista.gov.vn

Số lượt đọc: 1410

Về trang trước Về đầu trang