Cuộc đua AI vừa xuất hiện thêm một mặt trận mới. Sau nhiều năm cạnh tranh bằng mô hình ngôn ngữ và chatbot, các hãng công nghệ đang chuyển trọng tâm sang phần cứng, nơi quyết định hiệu năng, chi phí cũng như khả năng mở rộng của toàn bộ hệ sinh thái AI.
Ngày 24/6, OpenAI chính thức công bố Jalapeño, bộ xử lý AI đầu tiên do hãng phát triển cùng Broadcom. Thông tin ngay lập tức thu hút sự quan tâm của giới bán dẫn bởi đây không đơn thuần là một sản phẩm mới, mà còn đánh dấu việc OpenAI chính thức bước vào sân chơi vốn nhiều năm do Nvidia thống trị.

Theo Reuters, Jalapeño đã hoàn thành tape-out chỉ sau khoảng 9 tháng phát triển, một tốc độ rất hiếm gặp trong ngành bán dẫn, nơi chu kỳ thiết kế chip thường kéo dài nhiều năm. Việc ứng dụng AI để hỗ trợ thiết kế cũng góp phần rút ngắn đáng kể thời gian phát triển.
OpenAI bắt đầu tự xây dựng hạ tầng AI
Kể từ khi ChatGPT bùng nổ vào cuối năm 2022, nhu cầu tính toán của OpenAI tăng theo tốc độ chưa từng có. Hàng trăm triệu người dùng gửi yêu cầu mỗi ngày khiến số lượng GPU cần thiết để vận hành dịch vụ liên tục tăng lên.
Khác với suy nghĩ của nhiều người, phần tiêu tốn tài nguyên nhất không phải lúc huấn luyện mô hình mà là giai đoạn inference, tức quá trình AI tạo câu trả lời cho từng truy vấn của người dùng. Mỗi lần ChatGPT phản hồi, hệ thống đều phải thực hiện khối lượng tính toán rất lớn. Khi lượng truy cập tăng theo cấp số nhân, chi phí vận hành cũng tăng tương ứng.
Đó là lý do Jalapeño không được thiết kế để thay thế GPU Nvidia trong quá trình huấn luyện mô hình AI. Thay vào đó, OpenAI lựa chọn tối ưu cho inference, đúng lĩnh vực đang tiêu tốn nhiều tài nguyên nhất của hãng. Reuters cho biết Jalapeño được phát triển nhằm nâng cao hiệu quả xử lý trên mỗi watt điện tiêu thụ, đồng thời giảm đáng kể chi phí vận hành khi triển khai ở quy mô trung tâm dữ liệu.
Không chỉ OpenAI, cả ngành AI đều đang tự thiết kế chip
Việc OpenAI phát triển chip riêng không phải câu chuyện cá biệt. Google đã sử dụng TPU trong hệ thống AI nội bộ nhiều năm nay. Amazon có Trainium và Inferentia dành cho AWS. Microsoft phát triển Maia để phục vụ Azure AI, trong khi Meta cũng đầu tư mạnh cho dòng MTIA nhằm tối ưu các mô hình trí tuệ nhân tạo của mình.
Điểm chung của các doanh nghiệp này là đều muốn giảm sự phụ thuộc vào GPU đa năng, vốn có giá thành rất cao và thường xuyên rơi vào tình trạng khan hiếm nguồn cung.
Thay vì sử dụng một loại chip cho mọi tác vụ, các hãng công nghệ bắt đầu thiết kế bộ xử lý chuyên biệt cho từng nhu cầu cụ thể. Điều này giúp giảm điện năng tiêu thụ, tối ưu hiệu suất và tiết kiệm hàng tỷ USD chi phí hạ tầng trong dài hạn.
Nvidia vẫn giữ lợi thế nhưng áp lực đang lớn dần
Sự xuất hiện của Jalapeño chưa đủ để làm thay đổi vị thế của Nvidia. Hiện nay, phần lớn các mô hình AI lớn vẫn được huấn luyện trên nền tảng GPU H100 và Blackwell. CUDA cùng hệ sinh thái phần mềm mà Nvidia xây dựng suốt gần hai thập kỷ vẫn là lợi thế rất khó thay thế trong ngắn hạn. Tuy nhiên, thị trường đang bắt đầu xuất hiện xu hướng mới. Nếu trước đây các doanh nghiệp chỉ tập trung mua GPU từ Nvidia thì nay nhiều tập đoàn công nghệ đã chuyển sang chiến lược tự phát triển chip phục vụ nhu cầu nội bộ.
Đối với OpenAI, mục tiêu trước mắt không phải thay thế hoàn toàn Nvidia mà là giảm dần sự phụ thuộc ở những tác vụ có thể tối ưu bằng phần cứng chuyên dụng.
Điều gì khiến Jalapeño được giới công nghệ quan tâm?
Bản thân Jalapeño chưa phải bộ xử lý AI mạnh nhất thế giới. Điều đáng chú ý nằm ở chiến lược phía sau sản phẩm này. OpenAI đang chuyển từ một công ty phát triển mô hình AI thành doanh nghiệp sở hữu toàn bộ chuỗi hạ tầng, từ phần mềm, trung tâm dữ liệu cho đến phần cứng tính toán. Đây là bước đi tương tự những gì Google và Amazon đã thực hiện trước đó. Nếu các thế hệ chip tiếp theo tiếp tục đạt hiệu quả như kỳ vọng, OpenAI sẽ giảm đáng kể chi phí cho mỗi truy vấn ChatGPT, đồng thời chủ động hơn trong việc mở rộng quy mô dịch vụ mà không hoàn toàn phụ thuộc vào nguồn cung GPU bên ngoài.
Xu hướng mới của ngành AI toàn cầu
AI đang bước sang giai đoạn cạnh tranh mới. Nếu giai đoạn 2023-2025 là cuộc đua phát triển mô hình ngôn ngữ, thì từ năm 2026 trở đi, lợi thế sẽ thuộc về những doanh nghiệp làm chủ được hạ tầng tính toán. Chip AI, trung tâm dữ liệu, hệ thống làm mát, điện năng và mạng tốc độ cao sẽ trở thành những yếu tố quyết định khả năng mở rộng của các nền tảng AI trong tương lai. Jalapeño vì thế không đơn thuần là một con chip mới. Đây là tín hiệu cho thấy cuộc cạnh tranh AI đang dịch chuyển xuống tầng hạ tầng, nơi chi phí vận hành và hiệu suất xử lý sẽ quyết định doanh nghiệp nào có thể phát triển AI ở quy mô hàng tỷ người dùng.
AI không còn chỉ là câu chuyện của phần mềm. Hạ tầng tính toán, máy chủ GPU, trung tâm dữ liệu và hệ thống hiển thị đang trở thành nền tảng cho mọi dự án AI hiện đại. Liên hệ HCOM để được tư vấn các giải pháp hạ tầng AI, phòng điều hành IOC/NOC/SOC và hệ thống AV chuyên nghiệp cho doanh nghiệp.
