SAOT hoạt động như thế nào?
VCK World Cup 2022 đã diễn ra được khoảng một nửa chặng đường. Và có thể nói, công nghệ việt vị mới này đang là một điểm nhấn tại giải đấu năm nay, khi nó giúp các trong tài xác định tình huống nhanh hơn hẳn so với VAR - công nghệ vốn chỉ dựa vào băng ghi hình, sự phân tích khá thủ công và sự quan sát bằng mắt thường của các trọng tài.
Công nghệ việt vị bán tự động (SAOT) đang phát huy hiệu quả ở VCK World Cup 2022. Ảnh: FIFA
Hệ thống này được gọi là công nghệ việt vị bán tự động (SAOT). Nó có 12 camera gắn trên nóc SVĐ để theo dõi đường bóng và chuyển động của từng cầu thủ. SAOT sử dụng trí thông minh nhân tạo để nhận biết cầu thủ và trái bóng, tính toán vị trí của họ với tần suất 50 lần mỗi giây.
Một cảm biến được gắn vào quả bóng chính thức của World Cup ở Qatar, được gọi là Al Rihla - tiếng Ả Rập có nghĩa là 'Hành trình' - cho phép SAOT so sánh chính xác thời điểm quả bóng được chuyền đi với vị trí của hậu vệ cuối cùng và tiền đạo đối phương - 3 yếu tố để xác định một tình huống việt vị.
Mức độ chính xác này là chìa khóa để giải quyết các tình huống khó mà trước đây thường được mô tả “nhạy cảm” mà trong đó trọng tài khó có thể chắc chắn nên thổi việt vị hay không. Đôi khi một bàn thắng và thậm chí là kết quả của cả trận đấu có thể phụ thuộc vào quyết định “cảm tính” này.
Nhưng giờ, bất cứ khi nào SAOT phát hiện lỗi việt vị nhờ trí tuệ nhân tạo, một tính hiệu sẽ xuất hiện trong phòng VAR. Sau đó, trọng tài VAR sẽ thông báo cho trọng tài chính, người sẽ có tiếng nói cuối cùng. Đó là lý do tại sao hệ thống được coi là 'bán tự động'. Và cho đến nay, công nghệ này đã hoạt động rất hiệu quả và có thể nói chính xác gần như tuyệt đối.
Bản nâng cấp của VAR
Trong các trận đấu mà hệ thống trợ lý trọng tài video (VAR) được sử dụng, phải mất khoảng 70 giây để phát hiện lỗi việt vị - lâu hơn nhiều so với SAOT. Sử dụng công nghệ VAR, các trọng tài phải tự tìm ra thời điểm tình huống diễn ra (ví như khi nào trái bóng được chuyền đi) và tự phải vạch ra đường việt vị.
Với SAOT, tất cả những gì các trọng tài phải làm bây giờ chỉ là công nhận lỗi việt vị do hệ thống đưa ra, giống cách công nhận bàn thắng thông qua công nghệ Goal-line vốn đã quá quen thuộc và đã được chứng minh chính xác tuyệt đối trong nhiều năm qua.
Việc xác định đâu là trái bóng, đâu là cầu thủ hay trọng tài là quá dễ dàng với AI. Ảnh: FIFA
Theo trang web của FIFA, quy trình xác định việt vị mới 'chỉ diễn ra trong vòng vài giây, có nghĩa là các quyết định việt vị có thể được đưa ra nhanh hơn và chính xác hơn'.
Nếu trọng tài xác nhận đề xuất của SAOT, hệ thống sẽ tạo hoạt ảnh 3D về lỗi việt vị và được phát trên một màn hình lớn trong SVĐ để NHM có thể xem lý do tại sao lại quyết định được đưa ra. Theo FIFA, hệ thống SAOT đã được thử nghiệm trong 3 năm và hiện là 'hệ thống hỗ trợ việt vị chính xác nhất dành cho các trọng tài VAR'.
Làm thế nào AI phân biệt con người và đồ vật?
Công nghệ SAOT xác định các vị trí việt vị từ dữ liệu và video thông qua một trường giả lập trí tuệ nhân tạo. Hãy tưởng tượng rằng bạn là một chiếc máy tính và bạn không thể nhìn giống như con người. Đôi mắt của bạn được thay thế bằng máy ảnh kỹ thuật số nhận ánh sáng và biến thông tin đó thành dữ liệu. Dữ liệu này thường xuất hiện dưới dạng một bảng giá trị khổng lồ, chính xác đến từng pixel.
Điều này hẳn sẽ khiến nhiều người liên tưởng đến một số loại mũ mà phi công sử dụng trên các loại máy bay siêu thanh, khi thay vì nhìn bằng mắt thường phi công sẽ nhìn cảnh vật xung quanh qua các lớp camera siêu tinh vi, giúp họ có thể nhìn được mục tiêu hàng km dưới mặt đất và dù đang di chuyển với tốc độ hàng nghìn km/h. Bởi vậy, việc xác định lỗi việt vị trong bóng đá có thể nói là quá dễ dàng với AI, khi dữ liệu còn được phân tích bằng trí tuệ nhân tạo, chứ không phải bởi con người.
Còn việc xác định đâu là đồ vật và đâu là con người thực ra là một trong những thứ tốt nhất mà trí tuệ nhân tạo có thể làm. Các nhà khoa học dữ liệu đã phát triển các kỹ thuật khác nhau để tiếp cận vấn đề này. Trong đó có công nghệ được gọi là mạng thần kinh tích chập (CNN). Bạn có thể xem quy trình này diễn ra như thế nào trên trang web phân tích đồ họa do Adam Harley, một nhà nghiên cứu tại Đại học Stanford, thực hiện.
AI có thể phân biệt được hàng trăm, hàng nghìn người trong đám đông. Ảnh: AFP
CNN hoạt động bằng cách phát hiện các đối tượng theo từng lớp. Nói một cách dễ hiểu thì cách thức hoạt động của công nghệ này giống như bạn đang đứng trong một căn phòng tối đen như mực và xác định một vật thể. Đầu tiên bạn sẽ chạm vào xem 'nó cứng hay mềm?'. Và sau khi thực hiện nhiều lần dò xét thì đến một lúc nào đó, bạn sẽ thu thập đủ thông tin để có thể đoán đối tượng là gì.
Nếu bạn đã biết rằng vật thể này có lông, bốn chân và tai nhô lên, thì hẳn bạn sẽ dễ dàng trả lời được câu hỏi đó là một con mèo, một cầu thủ hay một trái bóng? Và với trí tuệ nhân tạo thì cả quá trình này sẽ chỉ diễn ra trong tích tắc, bởi các hệ thống máy tính hiện đại có thể xử lý hàng triệu phép tính, thuật toán mỗi giây.
Trí tuệ nhân tạo như SAOT thường dựa trên cơ sở dữ liệu và nguồn video khổng lồ, chứa đầy các đối tượng đã được con người xác định. Và trong trường hợp này, sau khi được tinh chỉnh chuyên sâu và thử nghiệm trong 3 năm, SAOT đã có thể dễ dàng phát hiện và phân biệt cầu thủ, trọng tài và mọi đồ vật trên sân một cách nhanh chóng.
Thậm chí trong tương lai, nếu cả trái bóng lẫn cầu thủ cũng được dán một thiết bị cảm biến thường chỉ mỏng như một lớp băng keo, thì việc xác định việt vị nhờ trí tuệ nhân tạo còn dễ dàng, nhanh chóng và chính xác hơn nhiều!