Claude 3 cuối cùng cũng đã đến, mô hình mạnh nhất đã đổi chủ? Không, người dùng mạng phải thử nghiệm mới có giá trị!

## Anthropic Ra mắt Bộ Dữ Liệu Mới: Claude 3

Ngày 5 tháng 3, đối thủ lớn nhất của OpenAI – Anthropic đã chính thức ra mắt bộ dữ liệu mới mang tên Claude 3. Bộ dữ liệu này bao gồm ba mô hình với khả năng từ thấp đến cao, được đặt tên là Claude 3 Haiku, Claude 3 Sonnet và Claude 3 Opus.

Anthropic cho biết, Claude 3 Haiku là mô hình nhanh nhất, phù hợp cho các ứng dụng cần phản hồi tức thì. Nó có thể đọc và xử lý dữ liệu nghiên cứu chứa đồ thị và biểu đồ trong vòng chưa đầy 3 giây (khoảng 10k tokens).

Claude 3 Sonnet cung cấp sự cân bằng giữa trí tuệ và tốc độ, thích hợp cho các công việc doanh nghiệp như tìm kiếm thông tin hoặc tự động hóa bán hàng.

Claude 3 Opus, mặt khác, là mô hình mạnh mẽ nhất, đạt gần như mức hiểu biết con người, thích hợp cho các tác vụ phức tạp. Trên nhiều bài kiểm tra chuẩn, nó đã vượt qua cả GPT-4 và Gemini 1.0 Ultra, thiết lập các chuẩn mới trong nhiều lĩnh vực như toán học, lập trình, đa ngôn ngữ và thị giác.

## Hiệu Quả Và Giá Cả

Bảng giá của các mô hình Claude 3 cũng được công bố:
– Claude 3 Opus: 15 đô la / triệu tokens cho đầu vào, 75 đô la / triệu tokens cho đầu ra.
– Claude 3 Sonnet: 3 đô la / triệu tokens cho đầu vào, 15 đô la / triệu tokens cho đầu ra.
– Claude 3 Haiku: 0,25 đô la / triệu tokens cho đầu vào, 1,25 đô la / triệu tokens cho đầu ra.

Anthropic cũng đã công bố báo cáo kỹ thuật 42 trang về Claude 3, bao gồm thông tin chi tiết về dữ liệu huấn luyện, tiêu chuẩn đánh giá và kết quả thí nghiệm cụ thể.

## Đánh Giá Từ Người Dùng

Một số người dùng đã thực hiện các bài kiểm tra riêng để xác minh hiệu suất của Claude 3. Một người dùng cho biết, cảm nhận ban đầu của anh ta là Claude 3 tốt hơn GPT-4 và vượt trội so với Mistral. Điều thú vị là, câu trả lời của Claude 3 dường như mang tính con người hơn so với các mô hình LLM khác.

Ví dụ, câu “I know it may not feel like it right now, but you ARE going to get through this.” (Tôi biết bạn có thể không cảm thấy vậy ngay bây giờ, nhưng bạn SẼ vượt qua được.) sử dụng chữ viết hoa “ARE”, điều mà GPT-4 không làm.

Ngoài ra, một người dùng khác đã thử thách Claude 3 bằng cách đưa ra một câu hỏi sử dụng mã ASCII, và Claude 3 đã trả lời bằng mã ASCII tương tự, cho thấy khả năng linh hoạt đáng kinh ngạc.

## Thử Thách Và Phản Hồi

Một số thử nghiệm khác cũng đã được thực hiện để so sánh khả năng lập trình của Claude 3 và GPT-4. Một người dùng yêu cầu Claude 3 tạo một hình ảnh 3D và chuyển đổi nó thành mã, kết quả thu được rất ấn tượng.

Tuy nhiên, khi một người dùng tên là Ruben yêu cầu cả Claude 3 và ChatGPT chuyển đổi một giao diện web thành mã, Claude 3 đã từ chối thực hiện, trong khi ChatGPT hoàn thành nhiệm vụ. Điều này cho thấy rằng, mặc dù Claude 3 có khả năng mạnh mẽ, nhưng nó cũng tuân thủ các nguyên tắc đạo đức nghiêm ngặt hơn.

## Kết Luận

Nhìn chung, Claude 3 được đánh giá là một bước tiến đáng kể trong lĩnh vực AI, với khả năng vượt trội trong nhiều khía cạnh. Tuy nhiên, việc đánh giá chính xác hiệu suất của nó vẫn còn phụ thuộc vào nhiều yếu tố, bao gồm cả tiêu chuẩn đánh giá và thử nghiệm thực tế.

## Từ Khóa
– AI
– Claude 3
– Anthropic
– GPT-4
– Benchmark