Vào ngày 14/08/2025, những tin đồn xung quanh việc ra mắt DeepSeek-R2, mô hình ngôn ngữ lớn thế hệ tiếp theo của DeepSeek, đã chính thức bị dập tắt. Theo đó, mặc dù trước đó đã có nhiều suy đoán trong giới công nghệ Trung Quốc, và thậm chí là gợi ý từ chính AI của DeepSeek, rằng mô hình này sẽ được phát hành trong khoảng thời gian từ ngày 15 đến 30 tháng 8, một nguồn tin thân cận với công ty đã lên tiếng phủ nhận.
Nguồn tin này cho biết DeepSeek hiện không có kế hoạch ra mắt R2 trong tháng 8. Nguyên nhân của sự trì hoãn này được cho là xuất phát từ việc Giám đốc điều hành của DeepSeek chưa hài lòng với hiệu suất của mô hình. Bên cạnh đó, các vấn đề về cơ sở hạ tầng, đặc biệt là nguồn cung điện toán hạn chế, cũng là một rào cản lớn.
DeepSeek đã phải hoạt động trong điều kiện khó khăn, đặc biệt là sau lệnh cấm xuất khẩu chip H20 của Nvidia sang Trung Quốc. Hiện tại, công ty được cho là đang huấn luyện R2 trên chip Ascend 910B của Huawei, nhưng vẫn chưa rõ liệu hệ thống này có đủ khả năng để triển khai mô hình trên quy mô lớn hay không.
Bài báo kết luận rằng, mặc dù R2 đang trong quá trình thử nghiệm tích cực, nó vẫn chưa sẵn sàng để ra mắt công chúng. DeepSeek cần một mô hình ổn định, có khả năng mở rộng và sẵn sàng cạnh tranh trên thị trường AI đầy khốc liệt hiện nay.
Nguồn: Gizmochina