Cập nhật gia đình mô hình OpenAI: Dữ liệu huấn luyện GPT-4 đến tháng 12 năm 2023.

công nghệ số5tháng trướccập nhật AIANT
44 00

Đánh giá các mô hình lớn mới nhất từ OpenAI

Nếu bạn là người dùng quen thuộc của công nghệ AI, bạn có thể đã nghe về những thông báo mới nhất từ OpenAI về các mô hình lớn mới nhất. Gần đây, OpenAI đã thông báo rằng GPT-3.5-turbo, GPT-4 và GPT-4-turbo-preview đều hướng đến phiên bản mô hình mới nhất. Người dùng có thể gửi yêu cầu và xem đối tượng phản hồi để xác định mình đang sử dụng mô hình nào. Kết quả phản hồi bao gồm phiên bản cụ thể của mô hình được sử dụng (ví dụ: GPT-3.5-turbo-0613).

Bên cạnh đó, OpenAI còn cung cấp các phiên bản mô hình tĩnh, cho phép các nhà phát triển tiếp tục sử dụng mô hình cũ trong vòng ba tháng kể từ khi mô hình mới được phát hành. Điều này giúp giải quyết vấn đề khi tốc độ cập nhật mô hình ngày càng nhanh chóng, OpenAI cũng đã mở một kênh đánh giá góp ý, nơi người dùng có thể cùng nhau cải thiện mô hình cho các trường hợp sử dụng khác nhau.

Nếu bạn quan tâm, bạn có thể tham khảo OpenAI Evals repo:

 

Về thông tin chi tiết hơn về việc loại bỏ mô hình cũ, bạn có thể truy cập trang web chính thức của OpenAI:

 

GPT-4 là một bộ mô hình đa phương thức lớn, có khả năng nhận dạng văn bản hoặc hình ảnh và tạo ra kết quả văn bản. Hiện tại, GPT-4 đã được mở rộng thông qua API của OpenAI dành cho khách hàng trả phí.

Tương tự như GPT-3.5-turbo, GPT-4 được tối ưu hóa cho cuộc trò chuyện, vì vậy nó có thể thực hiện các tác vụ trước đây cần sử dụng API Hoàn thành Trò chuyện. OpenAI cũng đã cung cấp hướng dẫn chi tiết về cách sử dụng GPT-4 trong hướng dẫn tạo văn bản:

 

Đối với hầu hết các tác vụ cơ bản, sự khác biệt giữa GPT-4 và GPT-3.5 không quá rõ rệt. Tuy nhiên, trong các tác vụ đòi hỏi khả năng suy luận phức tạp hơn, GPT-4 vượt trội so với các mô hình trước đây của OpenAI.

Mô hình GPT-3.5 Turbo có khả năng hiểu và tạo ra ngôn ngữ tự nhiên hoặc mã, được tối ưu hóa cho API Hoàn thành Trò chuyện, nhưng cũng phù hợp với các tác vụ không phải trò chuyện.

DALL-E là một hệ thống AI có khả năng tạo ra hình ảnh chân thực dựa trên mô tả bằng ngôn ngữ tự nhiên. DALL-E 3 hiện hỗ trợ tạo ra hình ảnh mới theo các từ khóa cụ thể. DALL-E 2 còn hỗ trợ chỉnh sửa hình ảnh hiện có hoặc tạo ra biến thể của hình ảnh mà người dùng tải lên.

DALL-E 3 có thể được sử dụng cùng với API Hình ảnh của OpenAI. Người dùng có thể trải nghiệm DALL-E 3 thông qua dịch vụ ChatGPT Plus.

TTS là một mô hình AI có khả năng chuyển đổi văn bản thành giọng nói tự nhiên. OpenAI cung cấp hai biến thể mô hình khác nhau, trong đó tts-1 được tối ưu hóa cho các tác vụ chuyển đổi văn bản thành giọng nói thời gian thực, còn tts-1-hd thì được tối ưu hóa cho chất lượng đầu ra. Các mô hình này có thể được sử dụng thông qua điểm cuối Speech trong API Âm thanh.

Whisper là một mô hình nhận dạng giọng nói phổ quát, được huấn luyện trên một bộ dữ liệu lớn chứa nhiều loại âm thanh. Nó cũng là một mô hình đa tác vụ, có thể thực hiện các tác vụ nhận dạng giọng nói đa ngôn ngữ, dịch âm thanh và hiểu âm thanh. Mô hình Whisper v2-large hiện có thể được gọi thông qua API với tên gọi là Whisper-1.

Hiện tại, phiên bản nguồn mở của Whisper và phiên bản do OpenAI cung cấp thông qua API hoàn toàn giống nhau. Tuy nhiên, quy trình suy luận của phiên bản API đã được tối ưu hóa, do đó Whisper chạy nhanh hơn nhiều khi sử dụng API.

Để biết thêm thông tin kỹ thuật chi tiết về Whisper, bạn có thể tham khảo bài báo sau:

 

Embeddings là biểu diễn số học của văn bản, có thể được sử dụng để đo lường mức độ liên quan giữa hai đoạn văn bản. Embeddings thường có hiệu suất tốt trong các tác vụ tìm kiếm, phân cụm, đề xuất, phát hiện bất thường và phân loại.

Nếu bạn quan tâm, bạn có thể tìm hiểu thêm về mô hình Embedding mới nhất từ OpenAI trong thông báo blog của họ:

 

Mô hình kiểm duyệt (Moderation) đảm nhiệm việc kiểm tra nội dung xem có tuân thủ chính sách sử dụng của OpenAI hay không. Những mô hình này cung cấp chức năng phân loại, nhằm tìm kiếm nội dung thuộc các danh mục sau: thù hận, đe dọa, tự sát, tình dục, tình dục với trẻ vị thành niên, bạo lực và bạo lực hình ảnh.

Để biết thêm thông tin chi tiết, bạn có thể tham khảo hướng dẫn kiểm duyệt của OpenAI:

 

Mô hình cơ sở GPT có khả năng hiểu và tạo ra ngôn ngữ tự nhiên hoặc mã, nhưng chưa được huấn luyện để tuân theo hướng dẫn. Mô hình này nhằm thay thế mô hình cơ sở GPT-3 cũ của OpenAI và được sử dụng với API Hoàn thành cũ. OpenAI khuyến nghị hầu hết người dùng nên trực tiếp sử dụng GPT-3.5 hoặc GPT-4.

Nói về xử lý dữ liệu người dùng, OpenAI nhấn mạnh rằng dữ liệu người dùng luôn thuộc về người dùng.

Từ ngày 1 tháng 3 năm 2023, dữ liệu gửi đến API của OpenAI sẽ không được sử dụng để huấn luyện hoặc cải tiến mô hình của OpenAI (trừ khi người dùng đồng ý). Tuy nhiên, nếu bạn chọn tham gia vào quá trình cải tiến, mô hình có thể trở nên phù hợp hơn với các trường hợp sử dụng theo thời gian.

Để giúp nhận diện hành vi lạm dụng, dữ liệu API có thể được giữ lại trong tối đa 30 ngày trước khi bị xóa (ngoại trừ các yêu cầu pháp luật khác). Đối với các khách hàng đáng tin cậy có nhu cầu xử lý dữ liệu nhạy cảm, OpenAI cũng cung cấp tùy chọn không lưu trữ dữ liệu. Trong trường hợp không lưu trữ dữ liệu, yêu cầu và nội dung phản hồi sẽ không được lưu trữ lâu dài trong bất kỳ nhật ký nào, mà chỉ được đặt trong bộ nhớ để hỗ trợ yêu cầu dịch vụ. Lưu ý rằng chính sách dữ liệu này không áp dụng cho các dịch vụ tiêu dùng do OpenAI cung cấp không thông qua API, ví dụ như ChatGPT hoặc DALl-E Labs.

Nhập hình ảnh thông qua mô hình GPT-4-vision-preview không đáp ứng điều kiện không lưu trữ.

Đối với API Trợ lý, OpenAI vẫn đang đánh giá chu kỳ lưu trữ mặc định trong giai đoạn beta. Dự kiến sau khi giai đoạn beta kết thúc, chu kỳ lưu trữ mặc định sẽ được xác định.

Liên kết có liên quan:

  • Công nghệ hàng đầu cũng từng rơi vào khủng hoảng! Cựu nhân viên 17 năm của Microsoft tiết lộ cách Satya Nadella dẫn dắt Microsoft vượt qua thập kỷ mất mát
  • Bước nhảy lớn nhất trong công nghệ AI sinh sản! OpenAI công bố mô hình video sinh sản đầu tiên, Odell được “quỳ gối”: Đừng để tôi mất việc
  • Tôi đã dùng ChatGPT để gian lận trong cuộc phỏng vấn kỹ thuật, và không ai phát hiện ra

Từ khóa

  • OpenAI
  • GPT-4
  • AI
  • API
  • Whisper
© Thông báo bản quyền

Những bài viết liên quan:

Chưa có đánh giá nào

none
Không có đánh giá...