Big Data sẽ tạo nên cách mạng trong dự báo kinh tế?
Trong quá khứ, người ta đưa ra các dự đoán theo phương pháp ngoại suy từ một vài nguồn dữ liệu không đáng tin cậy và vì vậy không có được cái nhìn tổng quát trong hoạt động kinh tế như khi sử dụng Big Data.
- 17-08-2013Big data ở giải Ngoại hạng Anh
- 21-12-2012Big Data (1): Lá chắn tên lửa từ những con số
- 18-12-2012Thời của Big Data
Big Data (dữ liệu lớn) là thuật ngữ để chỉ một tập hợp thông tin, dữ liệu cực lớn.
Vào hồi đầu tháng 8, báo chí Mỹ đã đưa ra ánh sáng vụ việc Cục dự trữ Liên bang (Fed) vô tình công bố dự báo kinh tế cho 5 năm tới trên trang web chính thức. Các dự báo này cho thấy rằng Fed không muốn một cuộc khủng hoảng kinh tế diễn ra trước thời điểm năm 2020. Ngoài ra chúng còn tiết lộ những vấn đề mà Fed đang lo ngại, trong đó có bảo mật dữ liệu kinh tế và việc sử dụng các phương pháp đánh giá dữ liệu kinh tế của các nhà kinh tế.
Theo lý thuyết thì Fed sẽ dựa vào những số liệu dự báo để đưa ra các quyết định, nhưng sự thiếu liên kết giữa các số liệu báo của Fed và những gì xảy ra thực tế không phải là điều đáng ngạc nhiên.
Dù chính xác hay không, ít ra thì những nỗ lực dự báo của các nhà kinh tế phải cho ra những kết quả cụ thể; thế nhưng lại có rất ít dự báo về mức độ của cuộc Đại suy thoái năm 2008 - 2009, thậm chí là cả sau khi nó đã diễn ra thì vẫn thiếu những dự báo với các con số cụ thể.
Vấn đề nằm ở chỗ trên thực tế các chỉ số quan trọng nhất để đo lường, phân tích, đánh giá nền kinh tế lại dựa trên những dữ liệu không đẩy đủ và không được cập nhật liên tục.
Ví dụ như, các nhà dự báo tính toán GDP thực tế chỉ căn cứ vào những dữ liệu ước tính đầu mỗi tháng trong thống kê GDP hàng quý, trong khi các chỉ số này được điều chỉnh nhiều lần sau đó. Kết quả là dự báo đưa ra sẽ chậm trễ, xa rời thực tế.
Trong quý III năm 2008, chỉ có chưa đầy 30% các nhà dự báo chuyên nghiệp tham gia khảo sát The Survey of Professional Forecasters dự đoán đúng về đà suy giảm của GDP Mỹ trong những tháng còn lại. Trên thực tế, GDP Mỹ giảm tới hơn 8% trong quý IV/2008.
Các nhà kinh tế, hoạch định chính sách và lãnh đạo doanh nghiệp đều cần những dữ liệu kinh tế sát với thực tế hơn để làm cơ sở cho các dự báo của mình. May thay, nhờ có Internet bùng nổ, gần đây họ đang có một nguồn thông tin mới: các bộ dữ liệu cá nhân khổng lồ được thu thập bởi các công cụ tìm kiếm và các công ty Internet khác.
Giờ đây người ta có thể theo dõi dữ liệu việc làm theo thời gian thực (tức là không có độ trễ), từ đó nhận biết ngay được những lĩnh vực nào đang có lượng tuyển dụng lớn nhất. Đây là ví dụ về một trong những công cụ mạnh mẽ để đánh giá về thị trường lao động một cách chính xác và thực tế. Có thể đánh giá mức độ tăng trưởng của một ngành thông qua số lượng thông tin tuyển dụng được đăng tải, hay có thể hiểu về nhận thức của người lao động về sức khỏe của thị trường lao động thông qua xu hướng tìm kiếm việc làm.
Dự án “Billion Prices” tại Viện công nghệ Massachusetts tính toán lạm phát bằng cách sử dụng dữ liệu theo thời gian thực về mua hàng trực tuyến từ hàng trăm nhà bán lẻ trên toàn cầu. “Google Price Index” (cũng có ý nghĩa như chỉ số đo giá tiêu dùng nhưng do Google tổng hợp từ giá các hàng hóa mọi người mua online để tạo nên chỉ số đánh giá lạm phát theo thời gian thực) cũng cung cấp thông tin tương tự. Google Trends cung cấp những thông tin được phân tích xu hướng tìm kiếm trên Internet.
Các nhà nghiên cứu cũng có thể khai thác thông tin từ các mạng xã hội. Ví dụ, hashtag #NFPGuesses trên trang Twiter tổng hợp theo tuần các dự đoán về mức tăng trưởng của bảng lương phi nông nghiệp NFP của Mỹ. Zillow, dịch vụ bất động sản trực tuyến, giúp thu thập thông tin về doanh số bán nhà và thế chấp. Những công ty như SpaceKnow đang sử dụng ảnh vệ tinh để theo dõi hoạt động sản xuất.
Không giống như các cuộc dữ liệu khảo sát hiện đang được dùng để phục vụ cho việc dự báo kinh tế, Big Data phản ánh được hành vi theo thời gian thực của các thành phần kinh tế, do đó cho thấy những chuyển biến trong nền kinh tế “theo giời gian thực”. Ví dụ, dữ liệu tìm kiếm việc làm và thông tin việc làm có thể được sử dụng để dự đoán về thị trường việc làm cho các tháng tiếp theo.
Nếu sử dụng đúng cách, các nguồn dữ liệu mới này có khả năng tạo nên cuộc cách mạng trong việc dự báo kinh tế.Trong quá khứ, người ta đưa ra các dự đoán theo phương pháp ngoại suy từ một vài nguồn dữ liệu không đáng tin cậy và vì vậy không có được cái nhìn tổng quát trong hoạt động kinh tế như khi sử dụng Big Data. Trong thời đại của Big Data, thách thức sẽ nằm trong việc sàng lọc cẩn thận và phân tích một lượng lớn thông tin. Nó sẽ không còn chỉ đơn giản là thu thập dữ liệu mà dữ liệu được qua xử lý với một cơ cấu phân tích dữ liệu chuyên biệt.
Có thể Fed đã mắc sai lầm trong việc công bố dữ liệu dự báo kinh tế của mình trước thời hạn. Nhưng sai lầm đó đem lại cho chúng ta một cơ hội quan trọng. Để cải thiện dự báo kinh tế, cần khuyến khích các nhà kinh tế tìm kiếm các nguồn dữ liệu mới và phát triển các mô hình dự báo mới. Thậm chí Big Data có thể giúp ngăn ngừa một cuộc suy thoái kinh tế tiếp theo.