ByteDance và Vấn Đề Sử Dụng API của OpenAI
Theo The Verge, tài liệu nội bộ của ByteDance xác nhận rằng việc phát triển mô hình cơ bản của họ phụ thuộc vào API của OpenAI. Dự án có tên là “Project Seed” bao gồm hầu hết các giai đoạn phát triển từ huấn luyện mô hình đến đánh giá.
Để đảm bảo an toàn, OpenAI đã tạm dừng tài khoản của ByteDance. Người phát ngôn của OpenAI cho biết tất cả khách hàng API phải tuân thủ chính sách sử dụng của họ để đảm bảo công nghệ được sử dụng một cách có trách nhiệm.
Mặc dù ByteDance chỉ sử dụng rất ít API của OpenAI, tài khoản của họ đã bị tạm dừng trong quá trình điều tra thêm. Nếu họ không tuân thủ chính sách, tài khoản của họ có thể bị chấm dứt.
Theo Điều khoản của OpenAI, khách hàng không được phép “phát triển bất kỳ mô hình trí tuệ nhân tạo nào cạnh tranh với sản phẩm và dịch vụ của chúng tôi”. Người dùng cũng không được phép “trích xuất dữ liệu từ dịch vụ hoặc API bằng bất kỳ phương pháp nào không được phép”.
The Verge tuyên bố ByteDance vẫn tiếp tục sử dụng API để huấn luyện và so sánh mô hình của họ, ngay cả khi họ đã nhận thức được vấn đề này. Họ còn chỉ đạo nhân viên sử dụng “bỏ ẩn dữ liệu” để che giấu bằng chứng.
Khi chatbot Doubao của ByteDance được phê duyệt bởi cơ quan quản lý trong nước, công ty yêu cầu nhân viên ngừng sử dụng API để phát triển dự án Project Seed. Tuy nhiên, The Verge báo cáo rằng API vẫn được sử dụng để đánh giá hiệu suất của chatbot riêng của họ.
Doubao, sản phẩm đầu tiên của ByteDance về AI đối thoại được ra mắt vào tháng 8, đã không nhận được phản hồi tích cực từ nhiều cơ quan truyền thông.
Người đại diện của ByteDance đã trả lời rằng công ty luôn tuân thủ các điều khoản sử dụng của OpenAI. Công ty đang liên hệ với OpenAI để giải quyết những hiểu lầm có thể xảy ra từ các báo cáo bên ngoài.
Năm nay, khi nhóm kỹ thuật bắt đầu khám phá mô hình lớn, một số kỹ sư đã áp dụng API của GPT cho các dự án thí nghiệm nhỏ. Mô hình này chỉ nhằm mục đích thử nghiệm và chưa từng được đưa vào sử dụng.
Từ tháng 4, ByteDance đã đặt ra yêu cầu rõ ràng không được thêm dữ liệu từ mô hình GPT vào tập dữ liệu huấn luyện của họ. Họ cũng đã đào tạo đội ngũ kỹ sư tuân thủ các điều khoản khi sử dụng GPT.
Vào tháng 9, công ty đã thực hiện kiểm tra bổ sung để đảm bảo việc gọi API GPT tuân thủ các quy định. Họ đã phân loại và kiểm tra mẫu dữ liệu huấn luyện để tránh việc sử dụng GPT một cách trái phép.
Những ngày sắp tới, ByteDance sẽ tiến hành kiểm tra toàn diện một lần nữa để đảm bảo tuân thủ các điều khoản sử dụng của dịch vụ.