View Single Post
  #1  
Old  Default AI Trung Quốc thua đậm Mỹ ở cờ vua
Hai Mô hình Ngôn ngữ Lớn (LLMs) của Trung Quốc đều thua 0-4 trước đại diện Mỹ OpenAI, tại tứ kết giải cờ vua AI đầu tiên trong lịch sử.

Cả bốn trận đấu tứ kết sáng 6/8 đều có tỷ số 4-0, nhưng chênh lệch nhất thuộc về chiến thắng của o3 trước Kimi K2. Cả bốn ván đều kết thúc không quá tám nước đi, đều vì Kimi K2 đi nước cờ không hợp lệ.

o3 là LLMs sử dụng cho chatbot nổi tiếng ChatGPT, thuộc công ty OpenAI (Mỹ). Kimi K2 là mô hình của công ty Moonshot AI, có trụ sở Trung Quốc.

Chẳng hạn ở ván thứ ba, o3 cầm quân đen, đưa hậu lên e5 chiếu ở nước thứ tám. Kimi K2 nhận thức đúng hết vị trí các quân, và biết rằng nó phải chạy vua hoặc đỡ nước chiếu. Nhưng trong cả bốn lần thử sức, nó đều đi nước cờ không đúng luật. Vì thế, AI Trung Quốc bị xử thua.


Thế cờ sau nước 8...Qxe5. Lúc này, AI của Trung Quốc (quân trắng) lần lượt đi bốn nước, là 9.Kf2, 9.Ke2, 9.Nxe5 và 9.Nxe5, đều không hợp lệ. Trong thế cờ này, chỉ có sáu nước cờ hợp lệ cho trắng, là chạy vua lên d2 hoặc đưa hậu, tượng và mã sang cột e để chắn nước chiếu.

Tỷ lệ nước cờ của o3 trùng công cụ đánh cờ Stockfish trong trận này lần lượt là 96,5%, 95,1%, 100% và 100%. Nhưng thông số này không có nhiều ý nghĩa, vì Kimi K2 thất bại quá sớm.

Đại diện còn lại của Trung Quốc dự giải là Deepseek, mô hình của công ty cùng tên có trụ sở tại thành phố Hàng Châu, tỉnh Chiết Giang. Deepseek làm tốt hơn đồng hương Kimi K2, nhưng vẫn chịu thất bại 0-4 trước o4-mini của OpenAI.


Ván đầu diễn ra 28 nước cờ, cho đến khi Deepseek đi quân sai luật lần thứ tư. Trong ván hai, o4-mini chiếu hết đối thủ chỉ sau 17 nước cờ. Hai ván còn lại kết thúc sau 25 và 26 nước cờ, trong đó đại diện Mỹ chiếu hết đối thủ ở ván cuối.

Hai mô hình tạo nên ChatGPT tỏa sáng, nhưng gây ấn tượng nhất tứ kết là Grok 4, mô hình của công ty xAI thuộc tỷ phú Elon Musk. Grok 4 có thể được sử dụng để tương tác như chatbot trên X (tên mới của Twitter), với người dùng trả phí. Bại tướng của nó là một sản phẩm của Google, Gemini 2.5 Flash.

Mô hình của ông Musk toàn thắng bốn ván. Nó trừng phạt mọi sai lầm của đối thủ, chẳng hạn như để mất không quân. Tỷ lệ chính xác trong các nước đi của Grok 4 lần lượt là 77,8%, 97,5%, 94,4% và 94,8%, cao nhất vòng đấu, nếu không tính trận đấu giữa o3 và Kimi K2.


Khi bình luận ván đấu, kỳ thủ số hai thế giới Hikaru Nakamura cũng ấn tượng với các nước cờ của Grok 4. "Chắc chắn Grok 4 là LLM đánh cờ mạnh nhất giải này. Chênh lệch trình độ giữa nó và các mô hình khác không nhỏ đâu", anh nói. "Chắc chắn ông Musk sẽ khoe khoang chiến thắng này trên Twitter".

Sau đó, ông Musk chia sẻ lại một bài đăng có hình ảnh Nakamura bình luận trực tuyến, kèm lời bình: "Đây mới chỉ là tác dụng phụ thôi. xAI gần như không dành chút thời gian nào cho cờ vua".

Gemini 2.5 Flask bị loại, nhưng Google vẫn còn một đại diện tại giải, là Gemini 2.5 Pro, với chiến thắng 4-0 trước Claude 4 Opus. Claude là mô hình của công ty Anthropic, có trụ sở tại thành phố San Francisco, bang California. Nó chơi không tồi khi cầm cự khoảng 30 nước trong cả bốn ván, nhưng Gemini 2.5 Pro đơn giản là mạnh hơn.

Vòng bán kết sẽ diễn ra từ 0h30 thứ Năm ngày 7/8, giờ Hà Nội. Grok 4 sẽ gặp Gemini 2.5 Pro. Trận bán kết còn là là derby OpenAI, giữa o3 và o4-mini.

Giải đấu này do Google tổ chức trên nền tảng Kaggle, từ 5/8 đến 7/8, quy tụ 8 LLMs đấu loại trực tiếp để chọn ra nhà vô địch.

LLMs là một loại mô hình trí tuệ nhân tạo (AI), chủ yếu dùng để xử lý ngôn ngữ, dịch thuật hay sáng tạo nội dung. Người dùng có thể tương tác với LLMs thông qua chatbot, như ChatGPT thuộc OpenAI. Về kỹ thuật, LLMs hoạt động theo cách thức "đoán từ tiếp theo".
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

10.000 Tin mới nhất

Tin nóng nhất 24h qua


june04
R10 Vô Địch Thiên Hạ
june04's Avatar
Release: 1 Week Ago
Reputation: 17495


Profile:
Join Date: Oct 2014
Posts: 68,492
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	AI.jpg
Views:	0
Size:	94.4 KB
ID:	2557842  
june04_is_offline
Thanks: 2
Thanked 3,302 Times in 2,906 Posts
Mentioned: 0 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 79
june04 Reputation Uy Tín Level 6
june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6june04 Reputation Uy Tín Level 6
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
 
Page generated in 0.04250 seconds with 10 queries