OpenAI luôn thực hiện những điều chỉnh đối với mô hình và giá cả của mình cho hợp lý hơn và cạnh tranh với các đối thủ. Hôm nay chính là dịp như vậy. OpenAI đã phát hành một số mô hình mới và giảm giá cho GPT-3.5 Turbo điều này chủ yếu được các nhà phát triển quan tâm nhưng cũng đóng vai trò là tiền đề cho các lựa chọn của người tiêu dùng trong tương lai.
GPT-3.5 Turbo hiện là mô hình được các nhà phát triển ứng dụng dùng nhiều nhất. Đây cũng là một API phổ biến, có chi phí thấp hơn và tốc độ xử lý nhanh hơn GPT-4 trong nhiều tác vụ. Vì vậy, người dùng trả tiền sẽ hài lòng khi biết rằng giá đầu vào giảm 50% và giá đầu ra giảm 25%, xuống còn 0,0005 USD 1K Tokens đầu vào và 0,0015 USD 1K Tokens đầu ra.
Khi mọi người thử sử dụng API này cho các ứng dụng sử dụng nhiều văn bản, như phân tích toàn bộ giấy tờ hoặc sách, thì nhu cầu sử dụng sẽ bắt đầu tăng lên. Và khi các mô hình nguồn mở AI khác hoặc do người dùng tự phát triển và quản lý bắt kịp hiệu suất của OpenAI, thì công ty cần đảm bảo rằng khách hàng của mình không bỏ đi. Do đó, giá cả liên tục giảm thời gian vừa qua. Đây cũng là kết quả tự nhiên của việc hợp lý hóa các mô hình và cải thiện cơ sở hạ tầng của OpenAI.
Phát hành các mẫu phiên bản mới và giá cũng thấp hơn
OpenAI đang giới thiệu hai mô hình nhúng mới: text-embedding-3-small – mô hình nhỏ hiệu quả cao hơn và text-embedding-3-large mô hình lớn hơn và mạnh mẽ hơn.
Phần nhúng là một chuỗi số đại diện cho các khái niệm trong nội dung như ngôn ngữ tự nhiên hoặc mã. Việc nhúng giúp các mô hình học máy và các thuật toán khác dễ dàng hiểu được mối quan hệ giữa nội dung và thực hiện các tác vụ như phân cụm hoặc truy xuất. Chúng hỗ trợ các ứng dụng như truy xuất kiến thức trong cả ChatGPT và API Assistants cũng như nhiều công cụ dành cho nhà phát triển thế hệ tăng cường truy xuất (RAG – retrieval augmented generation).
Text-embedding-3-small: là mô hình nhúng mới hiệu quả cao của OpenAI và cung cấp bản nâng cấp đáng kể so với phiên bản tiền nhiệm, mô text-embedding-ada-002 được phát hành vào tháng 12 năm 2022 .
Hiệu suất mạnh mẽ hơn. So text-embedding-ada-002 với text-embedding-3-small, điểm trung bình trên điểm chuẩn thường được sử dụng cho truy xuất đa ngôn ngữ ( MIRACL ) đã tăng từ 31,4% lên 44,0%, trong khi điểm trung bình trên điểm chuẩn thường được sử dụng cho các nhiệm vụ tiếng Anh ( MTEB ) đã tăng từ 61,0% lên 62,3 %.
Text-embedding-3-small giá thấp và cũng hiệu quả hơn đáng kể so với text-embedding-ada-002 thế hệ trước của OpenAI. Do đó, giá text-embedding-3-small đã giảm 5 lần so với text-embedding-ada-002, từ giá mỗi 1 nghìn mã thông báo là 0,0001 USD xuống 0,00002 USD.
OpenAI không dừng text-embedding-ada-002, vì vậy trong khi OpenAI đề xuất mẫu mới hơn, khách hàng vẫn có thể tiếp tục sử dụng mẫu thế hệ trước.
Text-embedding-3-large: là mô hình nhúng lớn hơn thế hệ tiếp theo của OpenAI và tạo ra các phần nhúng có kích thước lên tới 3072.
Hiệu suất mạnh mẽ hơn. text-embedding-3-large là mô hình hoạt động tốt nhất mới của OpenAI. So với text-embedding-ada-002 thì text-embedding-3-large: trên MIRACL, điểm trung bình đã tăng từ 31,4% lên 54,9%, trong khi trên MTEB, điểm trung bình đã tăng từ 61,0% lên 64,6%.
Text-embedding-3-large sẽ có giá $0,00013 / 1k token.
Bạn có thể tìm hiểu thêm về cách sử dụng các mô hình nhúng mới trong hướng dẫn Nhúng của OpenAI.
Bản GPT-4 Turbo preview được cập nhật
Hơn 70% khách hàng sử dụng API phiên bản GPT-4 đã chuyển sang GPT-4 Turbo kể từ khi phát hành, bởi ưu điểm giới hạn kiến thức cập nhật của nó cũng như ngữ cảnh lớn hơn với 128k và giá thấp hơn.
Và hôm nay, OpenAI cũng phát hành GPT-4 Turbo preview phiên bản được cập nhật, GPT-4-0125-preview. Mô hình này hoàn thành các nhiệm vụ như tạo mã chất lượng hơn so với mô hình trước đó và nhằm giảm các trường hợp “lười biếng” của GPT-4 khi mô hình không hoàn thành nhiệm vụ theo phản ánh gần đây của người dùng. Mô hình mới cũng bao gồm bản sửa lỗi ảnh hưởng đến hiển thị font chữ mã UTF-8 không phải tiếng Anh.
Và OpenAI dự định ra mắt GPT-4 Turbo vision mạnh hơn trong những tháng tới.
Mô hình kiểm duyệt được cập nhật
API kiểm duyệt miễn phí cho phép nhà phát triển xác định các nội dung văn bản có khả năng gây hại. Là một phần trong công việc đảm bảo kiểm soát sự an toàn, OpenAI đang phát hành text-moderation-007 – mô hình kiểm duyệt mạnh mẽ nhất của họ cho đến nay. Các mô hình text-moderation-latestvà text-moderation-stable đã được cập nhật để trỏ đến nó. Bạn có thể tìm hiểu thêm về cách xây dựng hệ thống AI an toàn thông qua hướng dẫn thực hành tốt nhất về an toàn của OpenAI tại đây.
Trung Kiên