Hé lộ cách thức tinh quái để làm ra DeepSeek: Thế mới thấy kỹ sư Trung Quốc "giỏi và liều" thế nào - VietBF
 
 
 

HOME

24h

DEM

GOP

Phim Bộ

Online

Clips

Breaking
News Library Technology Giải Trí Portals Tin Sốt Home

Go Back   VietBF > World Box| Thế Giới > World News|Tin Thế Giới


Reply
 
Thread Tools
  #1  
Old  Default Hé lộ cách thức tinh quái để làm ra DeepSeek: Thế mới thấy kỹ sư Trung Quốc "giỏi và liều" thế nào
Tháng trước, thị trường tài chính Mỹ lao dốc sau khi một công ty khởi nghiệp Trung Quốc có tên DeepSeek cho biết họ đă xây dựng một trong những hệ thống trí tuệ nhân tạo mạnh nhất thế giới nhưng lại sử dụng ít chip máy tính hơn nhiều so với b́nh thường.

Các công ty AI thường đào tạo chatbot bằng siêu máy tính chứa 16.000 chip chuyên dụng trở lên. Nhưng DeepSeek cho biết họ chỉ cần khoảng 2.000.

Như các kỹ sư DeepSeek công bố trong một bài báo nghiên cứu sau đó, công ty khởi nghiệp này đă sử dụng một số thủ thuật công nghệ để giảm đáng kể chi phí xây dựng hệ thống.

Các kỹ sư của công ty chỉ cần khoảng 6 triệu USD cho sức mạnh tính toán thô, chỉ bằng khoảng 1/10 số tiền mà Meta đă chi để xây dựng công nghệ AI mới nhất.

Vậy DeepSeek đă làm thế nào?
Cách tạo ra AI

Các công nghệ AI hàng đầu dựa trên cái mà các nhà khoa học gọi là mạng nơ-ron, hệ thống tính toán học kỹ năng bằng cách phân tích lượng dữ liệu khổng lồ.



Các hệ thống mạnh nhất dành nhiều tháng để phân tích hầu hết các văn bản tiếng Anh trên internet cũng như nhiều h́nh ảnh, âm thanh và dữ liệu đa phương tiện khác. Điều đó đ̣i hỏi một lượng lớn sức mạnh tính toán.

Khoảng 15 năm trước, các nhà nghiên cứu AI nhận ra rằng các chip máy tính chuyên dụng được gọi là bộ xử lư đồ họa, hay GPU, là cách hiệu quả để thực hiện loại phân tích dữ liệu này. Các công ty như Nvidia ban đầu thiết kế những con chip này để phục vụ cho việc chơi game trên máy tính. Nhưng GPU cũng có khả năng chạy phép tính cung cấp sức mạnh cho mạng nơ-ron.

Càng tích hợp nhiều GPU vào trung tâm dữ liệu máy tính, hệ thống AI càng phân tích nhiều dữ liệu hơn.

Nhưng GPU mạnh nhất hiện nay có giá lên tới 40.000 USD và chúng cần lượng điện rất lớn. Việc gửi dữ liệu giữa các chip có thể sử dụng nhiều điện năng hơn là chạy chính các chip đó. Chính v́ vậy, việc đào tạo AI vốn rất tốn kém, đ̣i hỏi số tiền lên tới cả tỷ USD.
Vậy DeepSeek có thể giảm chi phí bằng cách nào?

Công ty Trung Quốc làm điều này bằng rất nhiều cách. Đáng chú ư nhất là họ áp dụng một phương pháp gọi là "hỗn hợp các chuyên gia".

Các công ty thường tạo ra một mạng nơ-ron duy nhất có thể học mọi mẫu trong tất cả dữ liệu trên internet. Điều này rất tốn kém v́ cần một lượng dữ liệu khổng lồ để truyền giữa các chip GPU.

Nếu một con chip đang học cách viết một bài thơ và con chip khác đang học cách viết một chương tŕnh máy tính, chúng vẫn cần phải nói chuyện với nhau, đề pḥng trường hợp có sự chồng chéo giữa thơ ca và lập tŕnh.

Với sự kết hợp của phương pháp chuyên gia, các nhà nghiên cứu đă giải quyết vấn đề này bằng cách chia hệ thống thành nhiều mạng nơ-ron: một cho thơ ca, một cho lập tŕnh máy tính, một cho sinh học, một cho vật lư, v.v. Có thể có 100 hệ thống "chuyên gia" nhỏ hơn này. Mỗi chuyên gia có thể tập trung vào lĩnh vực cụ thể.

Nhiều công ty gặp khó trong việc áp dụng phương pháp trên, nhưng DeepSeek lại làm rất tốt. Bí quyết của họ là ghép nối các hệ thống "chuyên gia" nhỏ hơn với một hệ thống "tổng quát".

Các chuyên gia vẫn cần trao đổi một số thông tin với nhau, và chuyên gia đa ngành – hệ thống có hiểu biết ở mức khá nhưng không quá chi tiết về từng chủ đề - có thể giúp điều phối tương tác giữa các chuyên gia.

H́nh dung dễ hơn, điều này giống như một biên tập viên điều phối một pḥng tin tức toàn là các phóng viên chuyên ngành.

Nhưng đó không phải là điều duy nhất DeepSeek làm được. Công ty cũng áp dụng thành thạo một mẹo đơn giản liên quan đến số thập phân mà bất kỳ cũng từng học qua thời tiểu học.

Hăy nhớ lại giáo viên toán của bạn giải thích khái niệm pi. Pi, c̣n được kư hiệu là π, là một con số không bao giờ kết thúc: 3.14159265358979 …

Bạn có thể sử dụng π để thực hiện các phép tính hữu ích, như xác định chu vi của một h́nh tṛn. Khi thực hiện các phép tính đó, bạn rút gọn π thành chỉ một vài chữ số thập phân: 3,14. Nếu sử dụng con số đơn giản hơn này, bạn sẽ có được ước tính khá tốt về chu vi của một h́nh tṛn.

DeepSeek đă làm điều tương tự — nhưng ở quy mô lớn hơn nhiều — trong việc đào tạo công nghệ AI của ḿnh.

Phép toán cho phép mạng nơ-ron nhận biết các mẫu trong văn bản thực chất chỉ là phép nhân — rất nhiều phép nhân.

Thông thường, chip nhân các số vừa với 16 bit bộ nhớ. Nhưng DeepSeek đă nén mỗi số chỉ vào 8 bit bộ nhớ — một nửa không gian. Về bản chất, nó cắt bỏ một số chữ số thập phân từ mỗi số.

Điều này có nghĩa là mỗi phép tính đều kém chính xác hơn. Nhưng điều đó không quan trọng. Các phép tính đủ chính xác để tạo ra một mạng nơ-ron thực sự mạnh mẽ.

Vẫn chưa hết. DeepSeek c̣n có thêm một mánh lới khác.

Sau khi nén từng số vào 8 bit bộ nhớ, DeepSeek thực hiện một lộ tŕnh khác khi nhân các số đó với nhau. Khi xác định câu trả lời cho từng bài toán nhân — thực hiện phép tính quan trọng giúp quyết định cách mạng nơ-ron sẽ hoạt động — nó đă kéo dài câu trả lời trên 32 bit bộ nhớ. Nói cách khác, nó giữ lại nhiều số thập phân hơn, làm cho câu trả lời chính xác hơn.

Các kỹ sư DeepSeek đă chỉ ra trong bài nghiên cứu của ḿnh rằng họ rất giỏi trong việc viết mă máy tính phức tạp để chỉ cho GPU biết phải làm ǵ. Họ biết cách khai thác hiệu quả hơn nữa từ những con chip này.

Rất ít người có được kỹ năng đó. Nhưng các pḥng thí nghiệm AI nghiêm túc thực tế vẫn có những kỹ sư tài năng cần thiết để sánh ngang với những ǵ DeepSeek đă làm.
Vậy th́ tại sao các công ty khác không làm như vậy?

Một số pḥng thí nghiệm AI có thể đă sử dụng ít nhất một số thủ thuật tương tự. Các công ty như OpenAI không phải lúc nào cũng tiết lộ những ǵ họ đang làm sau cánh cửa đóng kín.

Nhưng các công ty khác rơ ràng đă ngạc nhiên trước công tŕnh của DeepSeek. Để làm được những ǵ mà công ty khởi nghiệp này làm là không hề dễ dàng. Thử nghiệm cần thiết để t́m ra một bước đột phá như vậy có thể tiêu tốn hàng triệu — nếu không muốn nói là hàng tỷ đô la — tiền điện.

Nói cách khác, cách làm của DeepSeek có thể hay nhưng rủi ro về đầu tư cũng rất lớn. Công ty này tỏ ra mạo hiểm trong việc t́m cách thức mới.

Tim Dettmers, nhà nghiên cứu tại Viện Trí tuệ nhân tạo Allen ở Seattle, người chuyên xây dựng các hệ thống AI hiệu quả và trước đây từng làm việc với tư cách là nhà nghiên cứu AI tại Meta, cho biết: "Bạn phải đầu tư rất nhiều tiền để thử những điều mới - và thường th́ chúng sẽ thất bại".

"Đó là lư do tại sao chúng ta không thấy nhiều sự đổi mới: Mọi người sợ mất hàng triệu đô la chỉ để thử một thứ ǵ đó không hiệu quả", ông nói thêm.

Nhiều chuyên gia chỉ ra rằng 6 triệu USD của DeepSeek chỉ đủ để trang trải những ǵ công ty khởi nghiệp đă chi khi đào tạo phiên bản cuối cùng của hệ thống. Trong báo cáo của ḿnh, các kỹ sư DeepSeek cho biết họ đă chi thêm tiền cho nghiên cứu và thử nghiệm trước khi chạy đào tạo cuối cùng. Nhưng điều tương tự cũng đúng với bất kỳ dự án AI tiên tiến nào.

DeepSeek đă thử nghiệm và thành công. Bây giờ, v́ công ty khởi nghiệp Trung Quốc đă chia sẻ phương pháp của ḿnh với các nhà nghiên cứu AI khác, các thủ thuật công nghệ của họ đă sẵn sàng để giảm đáng kể chi phí xây dựng AI.

Vietbf@Sưu tập
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

therealrtz
R10 Vô Địch Thiên Hạ
Release: 02-14-2025
Reputation: 234182


Profile:
Join Date: Nov 2014
Posts: 86,790
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	Screenshot 2025-02-14 at 20.37.01.jpg
Views:	0
Size:	71.0 KB
ID:	2490412
therealrtz_is_offline
Thanks: 28
Thanked 6,571 Times in 5,854 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 34 Post(s)
Rep Power: 108 therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10
therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10therealrtz Reputation Uy Tín Level 10
Reply

User Tag List


Phim Bộ Videos PC6

 
iPad Tablet Menu

HOME

Breaking News

Society News

VietOversea

World News

Business News

Other News

History

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

Sport News

DEM

GOP

Phim Bộ

Phim Lẻ

Ca Nhạc

Thơ Ca

Help Me

Sport Live

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOT 30 Days

NEWS 30 Days

Member News

Tin Sôi Nổi Nhất 24h Qua

Tin Sôi Nổi Nhất 3 Ngày Qua

Tin Sôi Nổi Nhất 7 Ngày Qua

Tin Sôi Nổi Nhất 14 Ngày Qua

Tin Sôi Nổi Nhất 30 Ngày Qua
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. V́ một tương lai tươi đẹp cho các thế hệ Việt Nam hăy ghé thăm chúng tôi, hăy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.


All times are GMT. The time now is 13:08.
VietBF - Vietnamese Best Forum Copyright ©2006 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.03975 seconds with 12 queries