Một startup công nghệ Trung Quốc có tên DeepSeek đang gây chấn động làng AI toàn cầu khi trình làng chatbot AI mới có hiệu suất sánh ngang với ChatGPT của OpenAI nhưng với chi phí phát triển thấp hơn đáng kể. Mới đây, DeepSeek đã vượt qua ChatGPT để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của Apple tại Hoa Kỳ, Vương quốc Anh, Trung Quốc và nhiều quốc gia khác, khẳng định vị thế “người chơi mới” đầy tiềm năng.
DeepSeek AI Hoạt Động Như Thế Nào? Điểm Khác Biệt So Với Đối Thủ
DeepSeek hoạt động tương tự như một chatbot thông thường: người dùng nhập câu hỏi và mô hình mã nguồn mở của nó sẽ tạo ra câu trả lời. Mô hình nền tảng DeepSeek-V3 sở hữu 671 tỷ tham số, cho phép ứng dụng có khả năng “suy nghĩ” trước khi đưa ra lời giải cho vấn đề.
Khác với mô hình của OpenAI chỉ có thể chạy trên máy chủ của chính hãng, DeepSeek có thể hoạt động cục bộ trên các máy tính có cấu hình cao và nhiều máy chủ tăng tốc GPU. Công ty này tuyên bố mô hình của họ đạt được hiệu suất tương đương với mô hình OpenAI’s o1 trên các tiêu chuẩn cụ thể. Một điểm khác biệt lớn nữa là DeepSeek hiển thị rõ ràng quá trình lý luận và cách nó đưa ra câu trả lời, tăng cường tính minh bạch. Tuy nhiên, là một ứng dụng Trung Quốc, DeepSeek có kiểm duyệt một số chủ đề nhạy cảm như Thiên An Môn. Ứng dụng này, ra mắt vào ngày 20 tháng 1, cũng đã có mặt trên Google Play Store.
Ưu Thế Vượt Trội Về Chi Phí Đào Tạo Của DeepSeek
Sự nổi tiếng đột ngột của DeepSeek phần lớn đến từ khả năng sánh ngang hoặc vượt trội các mô hình AI đã có tên tuổi. Báo cáo nghiên cứu của họ, được công bố vào thứ Hai, tiết lộ cách DeepSeek-V3 được đào tạo một cách cực kỳ hiệu quả về chi phí.
Mặc dù các tuyên bố vẫn chưa được xác minh hoàn toàn, DeepSeek dường như chỉ sử dụng 2.048 chip Nvidia H800 chuyên dụng để đào tạo mô hình R1 của mình. Trong khi đó, các mô hình hàng đầu của OpenAI yêu cầu hơn 16.000 chip Nvidia. DeepSeek cho biết việc giảm đáng kể số lượng GPU tiên tiến cần thiết cho việc đào tạo AI đã giúp họ chỉ tốn 5,6 triệu đô la để đào tạo R1. Con số này hoàn toàn trái ngược với OpenAI, công ty đã chi hơn 100 triệu đô la để đào tạo mô hình GPT-4 có kích thước tương đương. Tuy nhiên, công ty này chưa định lượng mức tiêu thụ năng lượng của DeepSeek so với các đối thủ.
Giao diện chatbot DeepSeek AI trên iPhone, hiển thị cách mô hình đưa ra lập luận trước khi trả lời
Bản thân R1 dựa trên mô hình ngôn ngữ lớn (LLM) V3 của DeepSeek, mà công ty này khẳng định ngang bằng với GPT-4o của OpenAI và Claude 3.5 Sonnet của Anthropic. Thành tựu của DeepSeek càng ấn tượng hơn trong bối cảnh chính phủ Hoa Kỳ đang áp đặt lệnh trừng phạt thương mại đối với các chip Nvidia tinh vi được sử dụng cho việc đào tạo AI. Với việc các “ông lớn” AI như Nvidia, OpenAI, Meta và Microsoft đang chi hàng tỷ đô la cho các trung tâm dữ liệu AI của họ, chúng ta sẽ thấy rất nhiều tiêu đề trong tuần này đặt câu hỏi về vị thế dẫn đầu của Mỹ trong lĩnh vực AI.
Ảnh Hưởng Của DeepSeek Đến Thị Trường AI Toàn Cầu
Sẽ rất thú vị khi xem bước đột phá của DeepSeek ảnh hưởng như thế nào đến dự án Stargate trị giá tỷ đô la của chính quyền Trump – được hỗ trợ bởi OpenAI, Softbank và Oracle – với mục tiêu đầu tư 500 tỷ đô la vào việc xây dựng cơ sở hạ tầng và trung tâm dữ liệu AI mới cho OpenAI trong bốn năm tới. Mọi thứ sẽ đặc biệt hấp dẫn khi OpenAI chuyển đổi từ tổ chức phi lợi nhuận sang tổ chức vì lợi nhuận, bởi vì DeepSeek đã mở mã nguồn các mô hình AI của mình.
Meta cũng đã mở mã nguồn một số khía cạnh công nghệ AI của mình, như LLM Lama. Tuy nhiên, DeepSeek là một “tân binh” mà mọi người đang nói đến, và thực tế là các nhà phát triển có thể tự do xây dựng dựa trên công nghệ của DeepSeek có thể sẽ khiến OpenAI gặp nhiều thách thức hơn trong cuộc đua AI.
DeepSeek, với chi phí phát triển thấp và hiệu suất ấn tượng, đã và đang tạo ra một làn sóng mới trong ngành công nghiệp AI. Sự xuất hiện của nó không chỉ thách thức vị thế của các mô hình hàng đầu mà còn mở ra nhiều câu hỏi về chi phí, tính bền vững và sự cạnh tranh toàn cầu trong lĩnh vực công nghệ đầy tiềm năng này. Bạn nghĩ sao về tương lai của cuộc đua AI với sự góp mặt của DeepSeek? Hãy để lại bình luận bên dưới nhé!