Các công ty công nghệ lớn “tập hợp” gặp sự cố, tất cả đều do giảm chi phí và tăng “tiếng cười”?

công nghệ số5tháng trướccập nhật AIANT
37 00





Khủng hoảng ổn định: Liệu giảm chi phí có phải là nguyên nhân?

Khủng hoảng ổn định: Liệu giảm chi phí có phải là nguyên nhân?

Nguồn tin từ công ty nghiên cứu quốc tế IDC, đã xuất bản báo cáo theo dõi về thị trường dịch vụ đám mây công cộng tại Trung Quốc (trong nửa đầu năm 2023). Báo cáo này cho biết, tổng quy mô thị trường dịch vụ đám mây công cộng của Trung Quốc (bao gồm IaaS, PaaS và SaaS) đạt 19,01 tỷ đô la Mỹ trong nửa đầu năm 2023. Trong đó, quy mô thị trường IaaS đạt 11,29 tỷ đô la Mỹ với tốc độ tăng trưởng 13,2%, còn quy mô thị trường PaaS đạt 3,29 tỷ đô la Mỹ với tốc độ tăng trưởng 26,3%.

Sự phát triển nhanh chóng của thị trường đám mây công cộng được thúc đẩy bởi sự nổi lên của công nghệ AIGC. Tuy nhiên, không thể không chú ý đến việc các sự cố hỏng hóc hệ thống mạng gần đây đã xảy ra tần suất cao hơn. Máy chủ, một thời gian dài được xem là bất khả chiến bại, hiện đang gặp vấn đề do quá tải. Sự sụp đổ của máy chủ như một quả núi sụp đổ, gây ra chấn động và ảnh hưởng lớn hơn nhiều so với dự đoán ban đầu.

Khi các sự cố hỏng hóc xảy ra, chúng ta như bị mắc kẹt trên một hòn đảo cô lập, chỉ có thể nhìn thấy thế giới bên ngoài tiếp tục vận hành mà không thể sử dụng các công cụ quen thuộc. Điều này tạo ra sự thất vọng và phẫn nộ vô tận cho khách hàng.

Cuối cùng, chúng ta bắt đầu suy nghĩ về nguyên nhân gốc rễ của vấn đề. Điều gì đã gây ra thảm họa công nghệ này? Là do công nghệ chưa tiên tiến, hay quản lý có vấn đề? Là do đánh giá rủi ro không chính xác, hay là do thiếu chuẩn bị cho kế hoạch dự phòng?

Bản tổng hợp các sự cố hỏng hóc trong nửa cuối năm 2023

Vào ngày 3 tháng 12, ứng dụng Tencent Video đã gặp sự cố mạng. Nhiều người dùng phản ánh rằng trang chủ không thể tải nội dung và người dùng VIP không thể xem video độc quyền. Không lâu sau, Tencent Video đã đăng tải lời xin lỗi về sự cố này:

Quý khách hàng thân mến, hiện tại ứng dụng Tencent Video đang gặp sự cố kỹ thuật và chúng tôi đang cố gắng khắc phục. Tất cả các chức năng đang dần được khôi phục. Chúng tôi xin lỗi vì sự bất tiện này.

Ngoài Tencent Video, nhiều ứng dụng khác cũng gặp sự cố hỏng hóc gần đây, bao gồm Didi, Yuku, Boss, DingTalk, Taobao, Xianyu và nhiều ứng dụng khác.

Vào ngày 27 tháng 11, máy chủ của Alibaba Cloud đã gặp sự cố kéo dài khoảng hai giờ, ảnh hưởng đến khách hàng ở Trung Quốc và Hoa Kỳ. Đây là lần thứ hai trong tháng, dịch vụ này gặp sự cố.

Sau đó, vào ngày 28 tháng 11, Alibaba Cloud đã thông báo trên trang web rằng từ 9 giờ 16 phút sáng ngày 27 tháng 11, hệ thống giám sát của họ đã phát hiện lỗi truy cập vào sản phẩm cơ sở dữ liệu, bao gồm PostgreSQL, Redis và MySQL. Lỗi này đã được giải quyết vào 10 giờ 58 phút cùng ngày.

Tương tự, vào ngày 12 tháng 11, Alibaba Cloud đã gặp sự cố, ảnh hưởng đến các sản phẩm như DingTalk, Taobao và Xianyu. Sự cố này cũng ảnh hưởng đến một số khách hàng doanh nghiệp sử dụng dịch vụ của Alibaba Cloud. Vùng ảnh hưởng từ Đông Á và Đông Nam Á mở rộng ra Trung Đông và Bắc Mỹ. Dịch vụ đã được khôi phục sau vài giờ sửa chữa.

Phân tích và thảo luận

Một số người đoán rằng sự cố của Alibaba Cloud vào ngày 27 tháng 11 có thể đã gây ra sự sụp đổ của ứng dụng Didi suốt đêm, nhưng các chuyên gia trong ngành cho rằng khả năng này rất thấp.

Vào đêm 27 tháng 11, người dùng Didi ở Thượng Hải, Bắc Kinh và Quảng Châu đã phản ánh rằng ứng dụng Didi không thể sử dụng, hiển thị lỗi mạng, bản đồ không thể tải và người dùng không thể sử dụng chức năng định vị hoặc đặt xe.

Chủ đề “Didi sập” đã lên xu hướng trên Weibo. Nhiều người dùng đã đăng bài viết trên diễn đàn, mô tả các vấn đề gặp phải khi sử dụng ứng dụng Didi.

Có người dùng phản ánh rằng mặc dù họ đã đặt được xe, nhưng lại có nhiều xe khác xuất hiện, một số người gặp phải tình huống có ba xe, một số người gặp phải tình huống có bốn xe. Họ không thể hủy đặt và không thể liên hệ với bộ phận hỗ trợ khách hàng.

Từ phản hồi trên các nền tảng khác nhau, có thể thấy rằng nền tảng Didi đã gặp phải các vấn đề trong quá trình nhận đơn, định vị, tính phí, v.v.

Có tài xế Grab cho biết, vào đêm hôm đó khi họ đang nhận đơn, ứng dụng bị sập từ 10 giờ 20 phút tối và không thể thực hiện bất kỳ tác vụ nào, cả cuộc gọi đến bộ phận hỗ trợ cũng không thể kết nối. Hiện tại, một số chức năng đã được khôi phục, nhưng vẫn chưa thể sử dụng bình thường, có nhiều đơn đặt sai và tình trạng nhiều tài xế nhận cùng một đơn.

Nhận định và đề xuất

Mặc dù có những biện pháp cắt giảm chi phí, nhưng điều này không nhất thiết đảm bảo sự ổn định. Mức độ ổn định luôn là một vấn đề tiềm ẩn và cần được xem xét cẩn thận trước khi thực hiện bất kỳ biện pháp cắt giảm chi phí nào. Cần có sự đánh giá chi tiết trước, lập kế hoạch dự phòng và tiến hành các buổi tập huấn trước khi tiến hành cắt giảm chi phí.

Mặc dù có nhiều yếu tố khác nhau có thể dẫn đến sự cố, nhưng việc không có sự chuẩn bị đầy đủ cho các kịch bản xấu vẫn là một yếu tố chính. Việc phân chia trách nhiệm giữa đội ngũ phát triển và đội ngũ vận hành cũng cần được rõ ràng để đảm bảo rằng mọi người đều hiểu rõ trách nhiệm của mình.

Các công ty công nghệ lớn

### Từ khóa:
– Công nghệ đám mây
– Quản lý rủi ro
– Hệ thống đám mây
– Giảm chi phí
– Đánh giá sự cố

© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...