Thể loại
Lưu trữ

Khiến cả thung lũng Silicon chao đảo, startup AI Trung Quốc DeepSeek đang sở hữu bao nhiêu GPU NVIDIA: Không nhiều như OpenAI, nhưng hiệu suất thì sao

Viết bởi Theo Thanhnienviet.vn    28/01/2025

 

DeepSeek đang có trong tay một lượng GPU lớn hơn so với những gì công chúng tưởng tượng, mặc dù họ không thể công khai điều này do các lệnh kiểm soát xuất khẩu của Mỹ.

 

Phòng thí nghiệm trí tuệ nhân tạo DeepSeek tại Trung Quốc đang trở thành cái tên gây chú ý trên toàn cầu khi mô hình AI R1 của họ được đánh giá ngang ngửa, thậm chí vượt mặt các nền tảng hàng đầu của Mỹ như o1 của OpenAI hay Llama của Meta. Theo Alexandr Wang, CEO của Scale AI, DeepSeek hiện sở hữu một lượng lớn GPU NVIDIA, được sử dụng để đào tạo mô hình AI tiên tiến này.

 

 

Hàng chục nghìn GPU NVIDIA trong tay DeepSeek

 

Trong một cuộc phỏng vấn với CNBC, Alexandr Wang đã chia sẻ chi tiết về "Humanity's Last Exam" – bài kiểm tra AI được đánh giá là khó nhất thế giới với các câu hỏi từ các chuyên gia trong các lĩnh vực như toán học, vật lý, hóa học, và sinh học. Kết quả cho thấy DeepSeek R1 là mô hình AI hàng đầu, vượt qua hoặc ngang tầm với các mô hình tốt nhất của Mỹ.

 

Khiến cả thung lũng Silicon chao đảo, startup AI Trung Quốc DeepSeek đang sở hữu bao nhiêu GPU NVIDIA: Không nhiều như OpenAI, nhưng hiệu suất lại ngang ngửa- Ảnh 1.

 

Wang nhận xét rằng mặc dù Mỹ từ lâu đã dẫn đầu trong lĩnh vực trí tuệ nhân tạo, nhưng sự xuất hiện của R1 từ Trung Quốc đã thay đổi cục diện. Ông còn chỉ ra rằng việc DeepSeek tung ra mô hình này vào đúng dịp Giáng sinh mang tính biểu tượng, vì khi đó hầu hết các nước phương Tây đang tận hưởng kỳ nghỉ lễ.

 

 

Một trong những yếu tố quan trọng giúp DeepSeek đạt được hiệu suất vượt trội chính là quyền truy cập vào lượng lớn GPU NVIDIA. Alexandr Wang tiết lộ rằng DeepSeek hiện sở hữu khoảng 50.000 GPU NVIDIA H100 – một con số gây kinh ngạc, đặc biệt khi Mỹ đã áp dụng lệnh cấm xuất khẩu các dòng GPU cao cấp như H100 và H200 sang Trung Quốc từ năm 2022.

 

NVIDIA trước đó đã phát triển các phiên bản thay thế như H800 và A800 để đáp ứng quy định xuất khẩu, nhưng những phiên bản này cũng bị cấm vào năm 2023. Dù vậy, DeepSeek vẫn có trong tay một lượng GPU lớn hơn so với những gì công chúng tưởng tượng, mặc dù họ không thể công khai điều này do các lệnh kiểm soát xuất khẩu của Mỹ.

 

Dù sở hữu số lượng GPU ấn tượng, Wang cho rằng việc Trung Quốc tiếp cận thêm các GPU tiên tiến sẽ ngày càng khó khăn do các lệnh cấm xuất khẩu hiện tại và trong tương lai. Điều này đặt ra những giới hạn lớn đối với khả năng mở rộng sức mạnh tính toán của các phòng thí nghiệm AI Trung Quốc.

 

Tuy nhiên, với những gì DeepSeek đã đạt được, rõ ràng họ đang trở thành một đối thủ đáng gờm, đủ sức cạnh tranh với các công ty công nghệ hàng đầu tại Mỹ. Việc sở hữu và sử dụng GPU NVIDIA một cách hiệu quả đang giúp Trung Quốc khẳng định vị thế trong cuộc đua AI toàn cầu.

 

Hiện tại, DeepSeek không chỉ dừng lại ở mô hình R1. Startup này còn phát triển thêm các mô hình khác như DeepSeek-V3 và mới đây nhất là DeepSeek-R1, ra mắt vào ngày 20/1. DeepSeek-V3 sở hữu 175 tỷ tham số và được huấn luyện trên 570GB dữ liệu văn bản từ nhiều nguồn như sách, bài báo, và Wikipedia. Điều đáng kinh ngạc là DeepSeek-V3 chỉ cần 2.000 GPU NVIDIA để xử lý dữ liệu đào tạo, so với 10.000 GPU mà ChatGPT cần. Điều này cho thấy khả năng tối ưu hóa thuật toán vượt trội của DeepSeek, đặc biệt trong bối cảnh các lệnh cấm xuất khẩu chip AI từ Mỹ gây ra nhiều hạn chế.

 

 

DeepSeek-R1 tiếp tục nâng tầm bằng cách áp dụng phương pháp "chain of thought" (chuỗi suy nghĩ), cho phép mô hình quay lại và đánh giá logic của chính mình. Phương pháp này giúp R1 giải quyết các bài toán phức tạp hơn với độ chính xác cao hơn, thậm chí vượt qua cả các mô hình hàng đầu như GPT-4o của OpenAI hay Claude Sonnet 3.5 của Anthropic.

 

Theo Thanhnienviet.vn

 

Gợi ý cho bạn

Phát triển công nghệ tạo ra thực phẩm thông minh Tin báo chí Phát triển công nghệ tạo ra thực phẩm thông minh

Các nhà nghiên cứu từ Đại học Tổng hợp Liên bang Bắc Kavkaz đã phát triển phương pháp bào chế vi nang để đưa vitamin, lợi khuẩn và các chất có lợi khác trực tiếp vào ruột.

Chỉ mất 2 tháng, Trung Quốc đã tạo ra được đối thủ đáng sợ nhất cho ChatGPT, cả Thung lũng Silicon đều chấn động đến cha đẻ AI cũng phải kinh ngạc Tin báo chí Chỉ mất 2 tháng, Trung Quốc đã tạo ra được đối thủ đáng sợ nhất cho ChatGPT, cả Thung lũng Silicon đều chấn động đến cha đẻ AI cũng phải kinh ngạc

Không chỉ có khả năng xử lý tương đương ChatGPT, mô hình AI mới của Trung Quốc còn vượt trội về hiệu quả chi phí khi giá thành tính toán chỉ bằng một phần nhỏ so với mô hình AI của OpenAI cũng như các đối thủ khác.