Sau khi video trình diễn Gemini gặp sự cố, Google liên tiếp tung ra những đòn mạnh: Cung cấp miễn phí Gemini Pro cho khách hàng đám mây, phát hành công cụ hỗ trợ mã AI, tích hợp dữ liệu từ 25 công ty.
Giới thiệu về mô hình AI mới của Google – Gemini

Tuần trước, Google đã công bố mô hình AI lớn nhất và mạnh mẽ nhất từ trước đến nay – Gemini. Đây cũng là bước quan trọng trong quá trình đưa AI vào thực tế của Google. Gemini bao gồm ba phiên bản: Ultra, Pro và Nano. Hiện tại, Google đang bắt đầu tích hợp Gemini vào các sản phẩm của mình, bắt đầu từ Pixel 8 Pro với phiên bản Nano trên hệ điều hành Android. Phiên bản được tinh chỉnh đặc biệt của Gemini Pro sẽ xuất hiện trên Google Bard.
Vào ngày 13 tháng 12, Google đã ra mắt một loạt các mô hình AI trên nền tảng đám mây của mình để người dùng có thể trải nghiệm và áp dụng thực tế: bao gồm Gemini Pro dành cho các nhà phát triển và doanh nghiệp, Duet AI dành cho nhà phát triển và an ninh vận hành, Imagen 2 cho việc tạo ra hình ảnh và MedLM cho các tình huống y tế.
Gemini thuộc họ các mô hình tạo nội dung hoàn chỉnh. Trước đó, Microsoft và nhiều công ty khác như Google đã tích hợp các tính năng học máy tăng cường vào sản phẩm của mình. Xu hướng này dự kiến sẽ tiếp tục trong năm 2023 và kéo dài đến năm 2024 và 2025.
Các phiên bản của Gemini bao gồm Nano, Pro và Ultra, mỗi phiên bản đều được thiết kế để xử lý các tác vụ khác nhau, từ tải công việc thiết bị đến tải công việc mạnh mẽ trên máy chủ.
Ngày 13 tháng 12, Google đã bắt đầu mở cửa Gemini Pro cho các nhà phát triển và doanh nghiệp, cho phép họ xây dựng theo nhu cầu riêng của mình. Theo kế hoạch, Google sẽ thu thập phản hồi từ người dùng trong vài tuần tới và điều chỉnh mô hình cho phù hợp. Đầu năm sau, sau khi được tinh chỉnh, kiểm tra an toàn và thu thập phản hồi từ đối tác, Google sẽ chính thức ra mắt Gemini Ultra – mô hình mạnh mẽ nhất và có khả năng thực hiện các tác vụ phức tạp nhất.
Giới thiệu thêm về Gemini Pro:
- Hiệu suất của Gemini Pro vượt trội hơn so với các mô hình ngôn ngữ lớn tương đương khác trong các thử nghiệm nghiên cứu.
- Phiên bản hiện tại cung cấp cửa sổ ngữ cảnh văn bản 32K, và phiên bản sau này sẽ mở rộng thêm.
- Giá sử dụng miễn phí trong một thời gian và giá cuối cùng sẽ cạnh tranh.
- Nó cung cấp nhiều chức năng như gọi hàm, nhúng, tìm kiếm ngữ nghĩa, nền tảng tri thức tùy chỉnh và chức năng trò chuyện.
- Nó hỗ trợ hơn 180 quốc gia và 38 ngôn ngữ trên toàn thế giới.
Hiện tại, phiên bản đầu tiên của Gemini Pro có thể truy cập thông qua API Gemini: Nhà phát triển có thể sử dụng giao diện từ xa này để xây dựng ứng dụng chatbot của riêng mình, thiết kế các gợi ý và cung cấp dữ liệu của riêng mình để tinh chỉnh mô hình. Nếu bạn muốn thêm giao diện ngôn ngữ tự nhiên vào ứng dụng của mình, Gemini Pro là lựa chọn tốt, với trải nghiệm sử dụng tương tự như các sản phẩm khác như ChatGPT của OpenAI.
Google cũng đã phát hành một công cụ phát triển dựa trên web miễn phí – Google AI Studio, giúp người dùng thiết kế gợi ý nhanh chóng và sau đó nhận mã API để phát triển ứng dụng. Người dùng có thể đăng nhập bằng tài khoản Google và tận hưởng hạn mức miễn phí, với mỗi phút có thể nhận 60 yêu cầu, gấp 20 lần so với các sản phẩm miễn phí khác. Khi sẵn sàng, chỉ cần nhấp vào “Lấy mã” để chuyển kết quả sang IDE đã chọn hoặc sử dụng các mẫu khởi chạy nhanh trong Android Studio, Colab hoặc Project IDX.
Để giúp Google cải thiện chất lượng sản phẩm, trong khi người dùng sử dụng hạn mức miễn phí, các chuyên gia đã được đào tạo có thể truy cập API và đầu vào, đầu ra trên Google AI Studio. Google cho biết, thông tin trong tài khoản Google và mã API đã được xử lý ẩn danh.
Nếu cần nền tảng AI toàn bộ, nhà phát triển cũng có thể dễ dàng chuyển từ Google AI Studio sang Vertex AI. Vertex AI cho phép tùy chỉnh Gemini với sự kiểm soát dữ liệu đầy đủ và tận hưởng các bảo mật, quyền riêng tư, quản lý dữ liệu và tuân thủ của Google Cloud.
Với Vertex AI, bạn cũng có thể truy cập mô hình Gemini và thực hiện:
- Tinh chỉnh và chưng cất Gemini bằng dữ liệu doanh nghiệp của riêng bạn để tăng cường mô hình.
- Xây dựng các đại diện tìm kiếm và trò chuyện được hỗ trợ bởi Gemini trong môi trường không mã / ít mã, bao gồm hỗ trợ RAG, tìm kiếm lai, nhúng và kịch bản trò chuyện.
- Bảo mật khi triển khai ứng dụng. Google sẽ không sử dụng dữ liệu đầu vào hoặc đầu ra của khách hàng trên Google Cloud để huấn luyện mô hình Gemini, dữ liệu và IP luôn thuộc về khách hàng.
Hiện tại, nhà phát triển có thể truy cập miễn phí Gemini Pro và Gemini Pro Vision thông qua Google AI Studio, với mỗi phút tối đa 60 yêu cầu, đủ để đáp ứng hầu hết nhu cầu phát triển ứng dụng. Vertex AI dự kiến sẽ ra mắt phiên bản chính thức vào năm tới, trong thời gian này, nhà phát triển cũng có thể truy cập mô hình cơ bản của Gemini với 60 yêu cầu mỗi phút. Trong tương lai, Google AI Studio và Vertex AI sẽ tính phí theo mỗi 1000 ký tự hoặc mỗi hình ảnh.
Google cũng đã chính thức công bố Duet AI for Developers. Đây là dịch vụ chatbot nhằm nâng cao hiệu quả làm việc của lập trình viên. Theo lời giải thích của Google, nó có thể hoạt động với nhiều IDE khác nhau và tự động hoàn thành mã nguồn, trả lời câu hỏi về mã, hỗ trợ khắc phục sự cố và hướng dẫn cách sử dụng phần mềm bên thứ ba như MongoDB, Crowdstrike.
Hiện tại, hơn 25 nhà cung cấp đã hợp tác với Google để đảm bảo sản phẩm của họ có thể tương thích với Duet AI for Developers. Trong vài tuần tới, mô hình ngôn ngữ lớn hỗ trợ Duet AI sẽ được nâng cấp lên Gemini. Dịch vụ này sẽ miễn phí cho đến ngày 12 tháng 1 năm 2024. Ngoài ra, Duet AI in Security Operations cũng đã chính thức ra mắt, hỗ trợ chatbot này sẽ giúp giải quyết các nhiệm vụ liên quan đến bảo vệ hạ tầng và phân tích nhật ký mạng.
Google cũng đã cập nhật Vertex AI để giới thiệu mô hình Imagen 2. Được phát triển bởi các kỹ sư của Google DeepMind, phiên bản mới nhất của công cụ chuyển đổi văn bản thành hình ảnh này có khả năng tạo ra hình ảnh cực kỳ chân thực và đáp ứng chính xác yêu cầu văn bản, giảm đáng kể rào cản quảng cáo thương hiệu. Ngoài ra, Imagen 2 còn có thể tạo chú thích và trả lời các câu hỏi liên quan đến nội dung hình ảnh.
Một số ứng dụng đang sử dụng Imagen bao gồm Snapchat, nền tảng thiết kế đồ họa Canva và trang web thư viện hình ảnh Shutterstock. Tất cả hình ảnh được tạo ra bởi mô hình Imagen 2 đều chứa dấu vân tay số SynthID không thể nhìn thấy bằng mắt thường, có thể được kiểm tra bằng máy tính để xác định xem hình ảnh đó có phải là kết quả của AI hay không.
Ngoài ra, Google đã giới thiệu MedLM, một họ mô hình ngôn ngữ lớn hướng đến các trường hợp sử dụng y tế. Hai mô hình này đều dựa trên chuỗi Med-PaLM 2 của Google. Mô hình lớn hơn và mạnh mẽ hơn được thiết kế cho các tác vụ phức tạp hơn, ví dụ như sàng lọc các bài báo học thuật và tài liệu kỹ thuật để tìm manh mối về nghiên cứu dược phẩm tiềm năng; mô hình nhỏ hơn được thiết kế để xử lý các công việc đơn giản hơn, như tóm tắt cuộc trò chuyện giữa bác sĩ và bệnh nhân và trả lời các câu hỏi y tế phổ biến.
Các người dùng sớm của MedLM bao gồm phòng khám HCA Healthcare, công ty thiết kế dược phẩm BenchSci, và các công ty tư vấn như Accenture và Deloitte.
Google cho biết, trong vài tuần tới, mô hình MedLM sẽ chính thức ra mắt trong vườn mô hình mở của Google, và sau đó sẽ có thêm nhiều mô hình dựa trên Gemini được bổ sung vào gia đình MedLM để cung cấp thêm chức năng.
Trong tương lai, Google sẽ tiếp tục phát triển và mở rộng phạm vi sử dụng của các mô hình AI này, góp phần vào sự tiến bộ của công nghệ AI trên toàn cầu.
Từ khóa:
- Mô hình AI
- Google Gemini
- Duet AI
- Vertex AI
- Imagen 2
© Thông báo bản quyền
Bản quyền bài viết thuộc về tác giả, vui lòng không sao chép khi chưa được phép.
Những bài viết liên quan:
Không có đánh giá...