Tại Tọa đàm "Thiết kế chip bán dẫn: Cơ hội mới - Tương lai" diễn ra vào 13/4/2024, ông Harsh Bharwani - CEO Tập đoàn Jetking (hơn 75 năm hoạt động trong lĩnh vực giáo dục và đào tạo công nghệ) - cho biết, hiện nay giá trị ngành chip trên toàn cầu là 500 tỷ USD, nhưng trong thời gian tới dự kiến sẽ tăng lên gần gấp 4 lần đạt 1.800 tỷ USD.
Mới đây, startup Etched có trụ sở tại San Francisco tạo nên cơn địa chấn trong giới công nghệ khi tuyên bố chip AI mới của họ có tên là Sohu, sở hữu sức mạnh xử lý vượt trội, gấp 20 lần so với GPU H100 đình đám của Nvidia.
Sohu là một dạng mạch tích hợp dành riêng cho ứng dụng (ASIC) được thiết kế tối ưu cho mô hình ngôn ngữ lớn (LLM). Theo Etched, Sohu cho thấy khả năng suy luận vượt trội hơn hẳn H100 trong các tác vụ liên quan đến LLM. Thậm chí, một hệ thống trang bị 8 chip Sohu có thể đạt hiệu suất tương đương với 160 GPU H100 kết hợp.
Startup Etched chỉ ra rằng các hệ thống tăng tốc AI hiện nay, bao gồm cả CPU và GPU, đều được thiết kế để tương thích với nhiều kiến trúc AI khác nhau, từ Mạng thần kinh tích chập (CNN), Mạng bộ nhớ ngắn hạn (LSTM) cho đến mô hình không gian trạng thái. Do đó, cần phải phân bổ một lượng lớn tài nguyên tính toán cho khả năng lập trình, dẫn đến lãng phí hiệu suất đáng kể.
Theo ước tính của Etched, GPU H100 của Nvidia chỉ sử dụng 3,3% số lượng bóng bán dẫn cho tác vụ chính, trong khi 96,7% còn lại dành cho các tác vụ phụ trợ. Điều này khá lãng phí dù là vấn đề này khó tránh khỏi đối với các chip AI đa năng.
Etched đã giải quyết được vấn đề này nhờ tích hợp kiến trúc AI biến áp (Transformer) vào Sohu, cho phép phân bổ tối đa số lượng bóng bán dẫn cho tác vụ tính toán AI. Từ đó, thay vì tạo ra một con chip "đa di năng" kém hiệu quả, Etched tập trung tối ưu hóa Sohu cho một dạng mô hình AI cụ thể là Transformer, vốn là nền tảng của nhiều mô hình ngôn ngữ lớn như GPT, Sora, Gemini, Stable Diffusion và Dall-E.
Giám đốc điều hành Etched, Gavin Uberti cho biết, "quyết định táo bạo khi đặt cược vào kiến trúc Transformer, nếu Transformer thất bại, công ty sẽ sụp đổ, nhưng nếu nó tiếp tục phát triển, công ty có tiềm năng trở thành một trong những công ty lớn nhất thế giới".
Trước đây, Etched thông báo đã huy động được 120 triệu USD trong vòng gọi vốn series-A. Số tiền này sẽ được sử dụng để phát triển sâu hơn chip xử lý chuyên dụng của công ty. Etched hướng đến việc sản xuất bộ xử lý chuyên dụng để vận hành một mô hình AI tương tự ChatGPT của OpenAI và Gemini của Google đang được sử dụng rộng rãi hiện nay.
Các kỹ sư của công ty đang thiết kế chip để thực hiện chức năng tạo nội dung và phản hồi của điện toán AI. Đây là con chip đầu tiên do công ty thiết kế, sẽ được tối ưu hóa để chạy mô hình AI transformer.
Theo Minh Tiến