3,6 tỷ USD tài trợ “giả mạo” bị phát hiện! Kiếm tiền khó khăn, cựu kỹ sư AI của Apple đã tuyên bố rút lui khỏi cuộc đua mô hình sau 3 năm tạo ra “OpenAI châu Âu”.

Tháng 9 năm 2023, Thâm Quyến đã thành lập trung tâm tính toán thông minh (AI) đầu tiên ở Quảng Đông sử dụng công nghệ TPU nội địa. Dự án giai đoạn một được xây dựng từ 32 nút tính toán liên kết hiệu quả, và sẽ mở rộng lên hàng nghìn card trong tương lai, tạo nên một trung tâm huấn luyện và suy luận thống nhất, trở thành một phần quan trọng của cao nguyên tính toán AI của China Unicom tại Thâm Quyến.
Thâm Quyến luôn là tiền tuyến đổi mới công nghệ quốc gia, và ngành công nghiệp AI đang phát triển mạnh mẽ. Ông Zhao Guibiao, Phó tổng giám đốc China Unicom Thâm Quyến, cho biết dự án hợp tác giữa Trung Quốc Zhexin Ying và China Unicom không chỉ đáp ứng yêu cầu về phân bố năng lực AI quốc gia mà còn thúc đẩy sự phát triển AI không chỉ ở Thâm Quyến mà còn trên toàn quốc.
Trung tâm này chủ yếu phục vụ khách hàng từ các doanh nghiệp chính phủ, ngành công nghiệp sản xuất, tài chính và y tế.
Để xây dựng trung tâm AI này, có hai yếu tố quan trọng: chip TPU và điều phối sức mạnh tính toán.
Kiến trúc TPU được thiết kế đặc biệt cho học sâu AI. So với CPU và GPU, TPU tập trung vào tối ưu hóa phần cứng cho các loại tính toán cụ thể trong học sâu AI, giúp tăng hiệu suất tính toán. Hệ thống TPU đa chip được thiết kế cho các mô hình huấn luyện và suy luận, hỗ trợ luồng dữ liệu và cơ sở hạ tầng mạng chuyên dụng, tạo ra lợi thế trong việc triển khai mô hình lớn hơn.
Trung tâm AI này sử dụng máy chủ AI và hệ thống tính toán AI quy mô lớn “Taize®” do Trung Quốc Zhexin Ying phát triển, tích hợp chip TPU “Chacha®” tự nghiên cứu. Ông Yang Gongyifan, người sáng lập và CEO của Trung Quốc Zhexin Ying, cho biết: “Chúng tôi muốn biến kiến trúc TPU thành chuẩn X86 trong lĩnh vực AI.”
Công ty Groq, được thành lập bởi các thành viên cốt lõi của nhóm TPU cũ của Google, gần đây đã ra mắt chip LPU mới. Ông Yang giải thích rằng từ các bài viết của Groq, có thể thấy LPU có kiến trúc tương tự như TPU. Ông Yang từng phụ trách phát triển chip TPU tại Google và tham gia thiết kế và phát triển 12 chip CPU cấp máy chủ tại Oracle. Đội ngũ nghiên cứu cốt lõi của Trung Quốc Zhexin Ying bao gồm các chuyên gia phần cứng và phần mềm AI từ Google, Microsoft, Samsung và Oracle, có kinh nghiệm từ 28nm đến 7nm trong thiết kế và tối ưu hóa chip quy mô lớn.
Ông Yang nói: “Việc thiết kế và phát triển chip thực sự là một dự án hệ thống phức tạp, đòi hỏi nhiều nguồn lực con người và trí tuệ. Quá trình này mất rất nhiều thời gian. Chip đầu tiên “Chacha®” của chúng tôi mất 4 năm rưỡi để thiết kế và sản xuất. Tuy nhiên, sau khi có chip đầu tiên, quá trình cải tiến sẽ dễ dàng hơn.”
Về ứng dụng thực tế của năng lực tính toán thông minh, ông Yang nhấn mạnh thách thức lớn nhất là tích hợp chip và hệ thống. Với số lượng chip tăng đột biến, hiệu suất truyền thông trở thành vấn đề. Việc điều phối trở nên khó khăn hơn, nhiễu thông tin gia tăng, và hiệu suất truyền đạt giảm mạnh. Cần thiết kế giao thức trao đổi thông tin và đường truyền vật lý hiệu quả để đảm bảo giao tiếp mượt mà giữa hàng ngàn đến hàng chục ngàn lõi.
TPU nổi bật với khả năng liên kết chip hiệu quả, có thể dễ dàng liên kết hàng nghìn chip, tạo ra mạng lưới dữ liệu và hỗ trợ giao tiếp linh hoạt giữa các nút. Đặc điểm này làm cho việc xây dựng hệ thống quy mô lớn dễ dàng hơn. Hệ thống TPU thế hệ thứ sáu của Google có thể kết nối 16.000 chip trong nội bộ, không cần phụ thuộc vào mạng Ethernet bên ngoài, tạo nền tảng vững chắc cho việc triển khai hệ thống quy mô hàng nghìn đến hàng triệu card.
Ngoài ra, một đặc điểm khác của trung tâm này là mật độ máy đơn và mật độ công suất ngày càng tăng. Mật độ công suất của máy chủ đã tăng từ 4 kW, 6 kW, 8 kW, 20 kW lên 40 kW.
Ông Zhao Guibiao cho biết việc kiểm soát năng lượng chủ yếu phụ thuộc vào hai yếu tố: trước hết, việc quy hoạch và xây dựng phải dũng cảm chấp nhận công nghệ mới, sử dụng thiết bị hiệu suất cao như hệ thống làm mát bằng chất lỏng, máy lạnh từ tính và nguồn điện module. Bằng cách sử dụng các thiết bị này, có thể tận dụng nguồn lạnh tự nhiên để giảm tiêu thụ năng lượng. Thứ hai, quản lý vận hành liên tục tích lũy kinh nghiệm quản lý năng lượng chi tiết, tối ưu hóa và nâng cao hiệu suất PUE để giảm tiêu thụ năng lượng. Trung tâm tính toán cuối cùng là cuộc cạnh tranh về năng lượng, giảm tiêu thụ năng lượng là vấn đề mà cả ngành công nghiệp phải đối mặt và khắc phục liên tục.
China Unicom theo định hướng phân bổ năng lực AI quốc gia, nhằm thúc đẩy sự phát triển AI trên toàn quốc, chọn Thâm Quyến làm cao nguyên AI cốt lõi. Dự án này sẽ tích hợp nền tảng quản lý tính toán tự nghiên cứu “Starluo” của China Unicom, phù hợp và tổ chức dịch vụ tính toán đa dạng, tạo ra khả năng điều phối tổng hợp “Tính toán phổ thông + Tính toán thông minh + Tính toán siêu cấp”. Điều này có thể cung cấp dịch vụ tính toán tổng thể cho khách hàng và cũng có thể được sử dụng để xây dựng và quản lý mạng lưới tính toán thông minh riêng tư cho doanh nghiệp. Theo giới thiệu, lợi thế của trung tâm này là chia sẻ năng lực tính toán, tránh tình trạng lãng phí hoặc thiếu hụt năng lực tính toán do dao động nhu cầu kinh doanh, tăng cường sử dụng năng lực tổng thể và giảm chi phí vận hành.
Ngày 18-19 tháng 8 năm 2024, Hội nghị Phát triển và Ứng dụng Toàn cầu về Trí tuệ Nhân tạo (AICon) tại Thượng Hải đã thành công tốt đẹp, thu hút hơn 60 chuyên gia hàng đầu trong lĩnh vực mô hình lớn, thảo luận về cơ chế huấn luyện và suy luận mô hình lớn, sự kết hợp đa phương thức, tiến bộ mới nhất về đại diện thông minh (Agent), chiến lược tạo ra RAG và tối ưu hóa mô hình bên cạnh thiết bị. Sau sự cho phép của diễn giả, “AI Frontline” đã tổng hợp độc quyền bộ sưu tập slide thuyết trình, không thể bỏ qua. Hãy theo dõi “AI Frontline” và trả lời từ khóa “PPT” để tải miễn phí.
### Từ khóa:
– Trung tâm tính toán thông minh
– TPU
– AI
– China Unicom
– Thâm Quyến
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...