OpenAI ra mắt GPT-4 Turbo với Vision, liệu có phải là sự thụt lùi trong mã hóa?

Mới đây, OpenAI đã thông báo về việc ra mắt mô hình GPT-4 Turbo with Vision, được mở rộng cho các nhà phát triển thông qua API của OpenAI. Mô hình này kế thừa từ chuỗi GPT-4 Turbo với kích thước cửa sổ là 128,000 token và cơ sở dữ liệu cập nhật đến tháng 12 năm 2023. Điểm đột phá chính là khả năng hiểu và xử lý hình ảnh, giúp đơn giản hóa quy trình làm việc của các nhà phát triển và tạo ra ứng dụng hiệu quả hơn.
Hiện nay, người dùng có thể yêu cầu sử dụng chức năng nhận dạng và phân tích hình ảnh thông qua định dạng JSON và các cuộc gọi hàm. Các cuộc gọi hàm sẽ tạo ra một đoạn mã JSON mà các nhà phát triển có thể sử dụng để tự động thực hiện các hành động trong ứng dụng của họ như gửi email, đăng tải nội dung trực tuyến, hoặc thực hiện mua sắm.
OpenAI khuyến nghị nên có quy trình xác nhận của người dùng trước khi thực hiện bất kỳ tác vụ nào có thể ảnh hưởng đến thế giới thực. Đội ngũ phát triển của OpenAI cũng đã chia sẻ một số trường hợp sử dụng thú vị của mô hình này, đặc biệt là trong việc tương tác màn hình thời gian thực.
Một công ty khởi nghiệp nổi tiếng, Cognition, đã sử dụng GPT-4 Turbo with Vision cho “Devin”, nhà phát triển phần mềm AI đầu tiên trên thế giới. Devin đã sử dụng khả năng nhận diện hình ảnh của mô hình này để thực hiện nhiều nhiệm vụ lập trình khác nhau.
Trong lĩnh vực kinh doanh thực tế, Healthify đã chia sẻ trải nghiệm của họ về GPT-4 Vision, nhấn mạnh về độ chính xác cao hơn so với các công cụ hiện tại trong việc nhận dạng nhiều loại thức ăn. Họ cũng đánh giá cao tính đơn giản trong việc tích hợp và sử dụng, chỉ cần thêm API của OpenAI vào pipeline hiện có.
Một số nhà phát triển Twitter đã thử nghiệm và chia sẻ kết quả của họ. Một nhà phát triển đã chia sẻ rằng anh ta có thể trích xuất dữ liệu từ hình ảnh một cách đáng tin cậy hơn mà không cần gọi các thư viện khác. Một nhà lập trình chuyên về ứng dụng AI khác đã thử tạo lại trang web Hacker News bằng cách sử dụng GPT-4 Vision, và anh ta mô tả đây là “phương pháp nhanh nhất để chuyển đổi ảnh chụp màn hình thành ứng dụng”.
Tuy nhiên, có những ý kiến trái chiều về khả năng lập trình của GPT-4 Vision. Công ty Aider, chuyên về công cụ lập trình song song AI, đã đánh giá mô hình này trong một bộ kiểm tra mã chuẩn và thấy rằng nó hoạt động kém hơn so với các phiên bản trước đó của GPT-4. Điều này gây ra một số lo ngại về khả năng lập trình của mô hình mới này.
Mặc dù GPT-4 Vision đã chứng minh được khả năng cải thiện quy trình phát triển ứng dụng, nhưng nó vẫn chưa thể thay thế hoàn toàn các nhà phát triển phần mềm. Việc phát triển phần mềm đòi hỏi nhiều kỹ năng khác ngoài việc viết mã, bao gồm cả sự sáng tạo và kỹ năng giao tiếp với khách hàng.

**Từ khóa:**
– GPT-4 Turbo with Vision
– Phát triển ứng dụng
– Nhận dạng hình ảnh
– Trí tuệ nhân tạo
– Lập trình
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...