Chào mọi người, hôm nay tôi sẽ chia sẻ một chút kinh nghiệm “thực chiến” của mình về trận đấu giữa Ajax và Brighton nhé. Nghe tên thì có vẻ to tát, nhưng thực ra là tôi nghịch ngợm tí thôi.
Bắt đầu mày mò
Chuyện là thế này, tôi vốn là một fan bóng đá, lại hay táy máy mấy thứ liên quan đến dữ liệu. Thế là tôi nảy ra ý định, hay là thử tự mình thu thập và phân tích dữ liệu về các trận đấu nhỉ? Trận Ajax gặp Brighton vừa rồi là một cơ hội tốt để tôi thử nghiệm.
Ban đầu, tôi cũng hơi lúng túng, không biết bắt đầu từ đâu. Tôi lên mạng tìm kiếm lung tung, xem người ta làm thế nào. Sau một hồi mò mẫm, tôi quyết định sẽ tự mình “cào” dữ liệu từ các trang web thể thao.
Quá trình “cào” dữ liệu
Nghe “cào” có vẻ ghê gớm, nhưng thực ra là tôi dùng mấy công cụ có sẵn thôi. Tôi tìm được vài trang web cung cấp thông tin khá chi tiết về trận đấu, bao gồm đội hình, số lần sút bóng, phạt góc, các kiểu.
Tôi bắt đầu “cào” dữ liệu về. Đại khái là copy rồi paste vào file Excel, thủ công thôi. Cũng hơi mất thời gian, nhưng được cái là mình chủ động, muốn lấy thông tin gì thì lấy.
- Đội hình xuất phát: Lấy thông tin về cầu thủ của cả hai đội, xem ai đá chính, ai dự bị.
- Các chỉ số trong trận: Ghi lại số lần sút bóng, kiểm soát bóng, phạt góc, thẻ phạt… của cả hai đội.
- Diễn biến chính: Ghi lại những sự kiện quan trọng trong trận, ví dụ như bàn thắng, thay người…
Cứ thế, tôi cặm cụi “cào” dữ liệu từ nhiều nguồn khác nhau, gom lại thành một file Excel. Trông cũng ra gì phết!
“Vọc vạch” dữ liệu
Có dữ liệu rồi, tôi bắt đầu “vọc vạch”. Tôi dùng Excel để thống kê, tính toán các kiểu. Ví dụ như tính tỉ lệ kiểm soát bóng của mỗi đội, số lần sút bóng trung bình mỗi hiệp… Đại khái là làm cho dữ liệu nó “biết nói”.
Tôi cũng thử vẽ vài cái biểu đồ cho nó trực quan. Trông cũng hay hay, nhìn vào là thấy ngay đội nào chơi tốt hơn, đội nào có nhiều cơ hội hơn.
Kết quả “thực chiến”
Sau một hồi “vọc vạch”, tôi cũng thu được một số kết quả thú vị. Ví dụ như tôi nhận ra là Brighton tuy không nổi tiếng bằng Ajax, nhưng họ lại có số lần sút bóng nhiều hơn, chứng tỏ họ cũng có khả năng tấn công rất tốt.
Tất nhiên, đây chỉ là một thử nghiệm nhỏ của tôi thôi. Còn nhiều thứ tôi chưa làm được, ví dụ như phân tích sâu hơn về chiến thuật của hai đội, hay dự đoán kết quả trận đấu dựa trên dữ liệu. Nhưng dù sao, tôi cũng thấy vui vì đã tự mình làm được một điều gì đó có ích.
Hy vọng qua chia sẻ này, các bạn cũng có thêm chút cảm hứng để tự mình “vọc vạch” với dữ liệu. Biết đâu, bạn lại khám phá ra những điều thú vị không ngờ đấy!