Home / Tin tức / DeepSeek V3.1 ra mắt: Sức mạnh vượt trội, chi phí cực rẻ, thách thức các ông lớn AI

DeepSeek V3.1 ra mắt: Sức mạnh vượt trội, chi phí cực rẻ, thách thức các ông lớn AI

DeepSeek V3.1 ra mắt: Sức mạnh vượt trội, chi phí cực rẻ, thách thức các ông lớn AI

Một mô hình ngôn ngữ lớn mới mang tên DeepSeek-V3.1 đã chính thức ra mắt, đánh dấu bước tiến đáng kể trong lĩnh vực trí tuệ nhân tạo. Được phát triển bởi công ty AI Trung Quốc DeepSeek, phiên bản mới này đã gây bất ngờ cho cộng đồng khi ra mắt sớm hơn dự kiến.

Điểm nổi bật nhất của DeepSeek-V3.1 là khả năng xử lý ngữ cảnh được mở rộng lên tới 128.000 token, tương đương với dung lượng của một cuốn sách 300-400 trang. Điều này giúp mô hình có thể xử lý và hiểu các văn bản dài, phức tạp một cách hiệu quả hơn.

Bên cạnh đó, DeepSeek-V3.1 còn được cải thiện về cấu trúc và hiệu suất. Mặc dù sở hữu 685 tỷ tham số, mô hình này vẫn sử dụng kiến trúc Mixture-of-Experts (MoE) với chỉ 37 tỷ tham số được kích hoạt cho mỗi token, giúp tối ưu hóa hiệu suất tính toán.

Những cải tiến này đã được thể hiện rõ qua các bài kiểm tra độc lập. Trong thử nghiệm mã hóa Aider, DeepSeek-V3.1 đạt 71.6%, vượt qua Claude Opus 4 và xếp vào nhóm các mô hình mã nguồn mở mạnh nhất hiện nay. Mô hình cũng cho thấy hiệu suất tốt hơn trong các tác vụ liên quan đến toán học và logic.

Một thay đổi chiến lược đáng chú ý khác là việc DeepSeek đã tích hợp khả năng suy luận vào DeepSeek-V3.1 và loại bỏ mô hình R1 riêng biệt khỏi giao diện chatbot. Việc ra mắt phiên bản V3.1 được cho là nhằm bù đắp cho sự chậm trễ của mô hình R2, vốn đang gặp vấn đề kỹ thuật với chip AI Ascend của Huawei.

Với những nâng cấp đáng giá, DeepSeek-V3.1 hứa hẹn sẽ mang đến những trải nghiệm vượt trội cho người dùng và tiếp tục củng cố vị thế của DeepSeek trên bản đồ công nghệ AI toàn cầu.

Nguồn: Gizmochina

Tagged:

Leave a Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *