Home / Tin tức / NVIDIA GB300: Bước đột phá về hiệu suất AI, vượt trội trong thử nghiệm suy luận DeepSeek R1

NVIDIA GB300: Bước đột phá về hiệu suất AI, vượt trội trong thử nghiệm suy luận DeepSeek R1

NVIDIA GB300: Bước đột phá về hiệu suất AI, vượt trội trong thử nghiệm suy luận DeepSeek R1

NVIDIA, gã khổng lồ trong ngành công nghiệp chip AI, vừa công bố những kết quả thử nghiệm đầy ấn tượng cho dòng GPU thế hệ mới Blackwell Ultra GB300 trên mô hình AI suy luận mã nguồn mở DeepSeek R1. Dữ liệu cho thấy nền tảng này mang lại hiệu suất vượt trội, củng cố vị thế dẫn đầu của NVIDIA trong kỷ nguyên “nhà máy AI”.

Theo các báo cáo từ thử nghiệm, hệ thống GB300 NVL72 đã trình diễn một bước nhảy vọt đáng kinh ngạc. Khi xử lý mô hình DeepSeek R1 với 671 tỷ tham số, nền tảng này có khả năng tăng tốc độ xử lý từ 100 token/giây (trên nền tảng H100) lên tới 1.000 token/giây. Điều này đồng nghĩa với việc thời gian phản hồi giảm từ 90 giây xuống chỉ còn 10 giây, mang lại trải nghiệm tương tác gần như tức thì cho người dùng cuối.

Những cải tiến đột phá này đến từ sự kết hợp giữa phần cứng tiên tiến và các tối ưu hóa kiến trúc. Nền tảng GB300 NVL72 được cấu tạo từ 72 GPU Blackwell Ultra và 36 CPU Grace, hoạt động như một “siêu chip” khổng lồ nhờ công nghệ NVLink thế hệ thứ 5 với băng thông lên tới 130 TB/giây. Hơn nữa, với dung lượng bộ nhớ HBM3e tăng 50% lên 288GB, GPU Blackwell Ultra có thể xử lý các mô hình có bối cảnh dài hơn và phức tạp hơn, vốn là yêu cầu cốt lõi của các tác vụ suy luận AI.

Kết quả thử nghiệm cho thấy hiệu suất thông lượng trên mỗi GPU của GB300 cao hơn tới 6 lần so với H100, dẫn đến tiềm năng tăng hiệu suất tổng thể của “nhà máy AI” lên tới 50 lần. Đây là một bước tiến mang tính chuyển đổi, không chỉ nâng cao tốc độ mà còn tối ưu hóa chi phí và hiệu quả năng lượng cho các trung tâm dữ liệu.

Sự xuất hiện của các mô hình suy luận mạnh mẽ như DeepSeek R1 ban đầu đã đặt ra câu hỏi về tương lai của các trung tâm dữ liệu AI quy mô lớn. Tuy nhiên, NVIDIA đã chứng minh rằng những bước đột phá này càng làm tăng nhu cầu về các nền tảng điện toán mạnh mẽ hơn. CEO Jensen Huang của NVIDIA chia sẻ rằng ngành công nghiệp cần “sức mạnh tính toán lớn gấp 100 lần so với những gì chúng ta nghĩ một năm trước” để đáp ứng nhu cầu phát triển bùng nổ của AI. Với lộ trình phát triển chip 3 năm (Blackwell Ultra năm 2025, Vera Rubin năm 2026 và Rubin Ultra năm 2027), NVIDIA đang tiếp tục củng cố vị thế thống trị của mình trong cuộc đua AI toàn cầu.

Nguồn: Gizmochina

Tagged:

Leave a Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *