VietBF - View Single Post

june04

Hai M� h�nh Ng�n ngữ Lớn (LLMs) của Trung Quốc đều thua 0-4 trước đại diện Mỹ OpenAI, tại tứ kết giải cờ vua AI đầu ti�n trong lịch sử.

Cả bốn trận đấu tứ kết s�ng 6/8 đều c� tỷ số 4-0, nhưng ch�nh lệch nhất thuộc về chiến thắng của o3 trước Kimi K2. Cả bốn v�n đều kết th�c kh�ng qu� t�m nước đi, đều v� Kimi K2 đi nước cờ kh�ng hợp lệ.

o3 l� LLMs sử dụng cho chatbot nổi tiếng ChatGPT, thuộc c�ng ty OpenAI (Mỹ). Kimi K2 l� m� h�nh của c�ng ty Moonshot AI, c� trụ sở Trung Quốc.

Chẳng hạn ở v�n thứ ba, o3 cầm qu�n đen, đưa hậu l�n e5 chiếu ở nước thứ t�m. Kimi K2 nhận thức đ�ng hết vị tr� c�c qu�n, v� biết rằng n� phải chạy vua hoặc đỡ nước chiếu. Nhưng trong cả bốn lần thử sức, n� đều đi nước cờ kh�ng đ�ng luật. V� thế, AI Trung Quốc bị xử thua.

Thế cờ sau nước 8...Qxe5. L�c n�y, AI của Trung Quốc (qu�n trắng) lần lượt đi bốn nước, l� 9.Kf2, 9.Ke2, 9.Nxe5 v� 9.Nxe5, đều kh�ng hợp lệ. Trong thế cờ n�y, chỉ c� s�u nước cờ hợp lệ cho trắng, l� chạy vua l�n d2 hoặc đưa hậu, tượng v� m� sang cột e để chắn nước chiếu.

Tỷ lệ nước cờ của o3 tr�ng c�ng cụ đ�nh cờ Stockfish trong trận n�y lần lượt l� 96,5%, 95,1%, 100% v� 100%. Nhưng th�ng số n�y kh�ng c� nhiều � nghĩa, v� Kimi K2 thất bại qu� sớm.

Đại diện c�n lại của Trung Quốc dự giải l� Deepseek, m� h�nh của c�ng ty c�ng t�n c� trụ sở tại th�nh phố H�ng Ch�u, tỉnh Chiết Giang. Deepseek l�m tốt hơn đồng hương Kimi K2, nhưng vẫn chịu thất bại 0-4 trước o4-mini của OpenAI.

V�n đầu diễn ra 28 nước cờ, cho đến khi Deepseek đi qu�n sai luật lần thứ tư. Trong v�n hai, o4-mini chiếu hết đối thủ chỉ sau 17 nước cờ. Hai v�n c�n lại kết th�c sau 25 v� 26 nước cờ, trong đ� đại diện Mỹ chiếu hết đối thủ ở v�n cuối.

Hai m� h�nh tạo n�n ChatGPT tỏa s�ng, nhưng g�y ấn tượng nhất tứ kết l� Grok 4, m� h�nh của c�ng ty xAI thuộc tỷ ph� Elon Musk. Grok 4 c� thể được sử dụng để tương t�c như chatbot tr�n X (t�n mới của Twitter), với người d�ng trả ph�. Bại tướng của n� l� một sản phẩm của Google, Gemini 2.5 Flash.

M� h�nh của �ng Musk to�n thắng bốn v�n. N� trừng phạt mọi sai lầm của đối thủ, chẳng hạn như để mất kh�ng qu�n. Tỷ lệ ch�nh x�c trong c�c nước đi của Grok 4 lần lượt l� 77,8%, 97,5%, 94,4% v� 94,8%, cao nhất v�ng đấu, nếu kh�ng t�nh trận đấu giữa o3 v� Kimi K2.

Khi b�nh luận v�n đấu, kỳ thủ số hai thế giới Hikaru Nakamura cũng ấn tượng với c�c nước cờ của Grok 4. "Chắc chắn Grok 4 l� LLM đ�nh cờ mạnh nhất giải n�y. Ch�nh lệch tr�nh độ giữa n� v� c�c m� h�nh kh�c kh�ng nhỏ đ�u", anh n�i. "Chắc chắn �ng Musk sẽ khoe khoang chiến thắng n�y tr�n Twitter".

Sau đ�, �ng Musk chia sẻ lại một b�i đăng c� h�nh ảnh Nakamura b�nh luận trực tuyến, k�m lời b�nh: "Đ�y mới chỉ l� t�c dụng phụ th�i. xAI gần như kh�ng d�nh ch�t thời gian n�o cho cờ vua".

Gemini 2.5 Flask bị loại, nhưng Google vẫn c�n một đại diện tại giải, l� Gemini 2.5 Pro, với chiến thắng 4-0 trước Claude 4 Opus. Claude l� m� h�nh của c�ng ty Anthropic, c� trụ sở tại th�nh phố San Francisco, bang California. N� chơi kh�ng tồi khi cầm cự khoảng 30 nước trong cả bốn v�n, nhưng Gemini 2.5 Pro đơn giản l� mạnh hơn.

V�ng b�n kết sẽ diễn ra từ 0h30 thứ Năm ng�y 7/8, giờ H� Nội. Grok 4 sẽ gặp Gemini 2.5 Pro. Trận b�n kết c�n l� l� derby OpenAI, giữa o3 v� o4-mini.

Giải đấu n�y do Google tổ chức tr�n nền tảng Kaggle, từ 5/8 đến 7/8, quy tụ 8 LLMs đấu loại trực tiếp để chọn ra nh� v� địch.

LLMs l� một loại m� h�nh tr� tuệ nh�n tạo (AI), chủ yếu d�ng để xử l� ng�n ngữ, dịch thuật hay s�ng tạo nội dung. Người d�ng c� thể tương t�c với LLMs th�ng qua chatbot, như ChatGPT thuộc OpenAI. Về kỹ thuật, LLMs hoạt động theo c�ch thức "đo�n từ tiếp theo".