MiniMax nâng cấp hệ thống ghi chép dựa trên Apache Doris, công nghệ truy vấn dữ liệu PB trong tích tắc.

công nghệ số5tháng trướccập nhật AIANT
52 00





Triển khai Hệ thống Nhật ký mới dựa trên Apache Doris tại MiniMax


MiniMax nâng cấp hệ thống ghi chép dựa trên Apache Doris, công nghệ truy vấn dữ liệu PB trong tích tắc.

MiniMax là công ty hàng đầu trong lĩnh vực trí tuệ nhân tạo đa mô đun, đã phát triển các mô hình lớn đa mô đun như mô hình văn bản, giọng nói và hình ảnh với hàng nghìn tỷ tham số. Với tầm nhìn “Sáng tạo thông minh cùng người dùng”, MiniMax đã hoàn thành việc phát triển thuật toán lõi MoE, dẫn đầu trong việc xây dựng mô hình ngôn ngữ lớn có thể sử dụng thương mại.

Với sự gia tăng của độ phức tạp và lượng yêu cầu mô hình, việc ghi chép và suy luận tạo ra một lượng lớn dữ liệu nhật ký. Việc này quan trọng đối với việc giám sát, tối ưu hóa và xác định vấn đề của ứng dụng AI. Ban đầu, MiniMax đã xây dựng hệ thống nhật ký dựa trên Grafana Loki, nhưng gặp nhiều thách thức về tài nguyên, hiệu suất ghi và ổn định hệ thống. Do đó, họ bắt đầu tìm kiếm giải pháp mới và so sánh giữa Apache Doris và Elasticsearch. Kết quả, họ đã chọn Apache Doris do khả năng vượt trội về hiệu suất, chi phí và dễ sử dụng.

MiniMax nâng cấp hệ thống ghi chép dựa trên Apache Doris, công nghệ truy vấn dữ liệu PB trong tích tắc.

Hệ thống mới dựa trên Apache Doris hiện đã tích hợp tất cả dữ liệu nhật ký nội bộ của MiniMax, với quy mô dữ liệu lên đến hàng PB và khả năng sẵn sàng đạt 99,9% trở lên. Hệ thống có thể trả lời truy vấn cho 1 tỷ dữ liệu nhật ký chỉ trong vài giây.

Hệ thống nhật ký cũ dựa trên Grafana Loki bao gồm ba phần chính: Loki (chủ server), Promtail (proxy) và Grafana (giao diện người dùng). Mặc dù Loki được thiết kế để linh hoạt và mở rộng, nhưng nó vẫn gặp phải một số vấn đề trong thực tế:

  • Tiêu thụ tài nguyên quá mức khi truy vấn: Loki không tạo chỉ mục cho nội dung nhật ký, do đó cần phải sử dụng toàn bộ dữ liệu để tìm kiếm, gây ra tiêu thụ tài nguyên lớn.
  • Cấu trúc phức tạp: Loki có nhiều module như Index Gateway, Memcache, Compactor, làm tăng độ khó quản lý và cấu hình.
  • Chi phí bảo trì cao: Mỗi cụm cần một cấu trúc Loki riêng biệt, dẫn đến chi phí bảo trì và quản lý cao.

Với yêu cầu về dữ liệu lớn, hiệu suất truy vấn cao, tính linh hoạt và chi phí thấp, MiniMax đã quyết định sử dụng iLogtail cho phần thu thập, Kafka cho phần hàng đợi tin nhắn và Apache Doris cho phần lưu trữ và truy vấn.

MiniMax nâng cấp hệ thống ghi chép dựa trên Apache Doris, công nghệ truy vấn dữ liệu PB trong tích tắc.

Hệ thống mới (Mlogs) đơn giản hơn, với một cấu trúc duy nhất phục vụ tất cả cụm. Phần điều khiển trên đỉnh bao gồm giao diện truy vấn và mô-đun tự động tạo và phân phối cấu hình. Phần dữ liệu dưới cùng bao gồm thu thập nhật ký, hàng đợi tin nhắn, trình ghi nhật ký và cơ sở dữ liệu Doris.

Hệ thống mới đã giúp giảm đáng kể chi phí bảo trì và quản lý, đồng thời cải thiện đáng kể hiệu suất truy vấn. Hiện nay, hệ thống có thể xử lý truy vấn từ 1 tỷ dữ liệu trong khoảng 2 giây và có khả năng ghi dữ liệu với tốc độ lên đến 10GB mỗi giây.

MiniMax sẽ tiếp tục phát triển hệ thống nhật ký của mình, tập trung vào việc nâng cao khả năng tiền xử lý dữ liệu, tích hợp khả năng theo dõi và mở rộng phạm vi sử dụng của Doris.

MiniMax nâng cấp hệ thống ghi chép dựa trên Apache Doris, công nghệ truy vấn dữ liệu PB trong tích tắc.

Bạn có thể tìm hiểu thêm về những phát triển mới nhất trong lĩnh vực trí tuệ nhân tạo tại Hội nghị AICon diễn ra ở Thượng Hải vào tháng 8 năm 2024.

Từ khóa:

  • MiniMax
  • Apache Doris
  • Nhật ký
  • Trí tuệ nhân tạo
  • Hệ thống


© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...