21/2/2024 (TinAI.vn) – Gemma được xây dựng để phát triển AI có trách nhiệm từ cùng nghiên cứu và công nghệ được sử dụng để tạo ra các mô hình Gemini.
Hôm nay trên Blog tin tức của Google ra thông báo về việc làm cho AI trở nên hữu ích hơn đối với mọi người bằng việc ra một sản phẩm mới với tên gọi Gemma. Google khẳng định với lịch sử lâu dài trong việc đóng góp những đổi mới cho cộng đồng mở, chẳng hạn như với Transformers , TensorFlow , BERT , T5 , JAX , AlphaFold và AlphaCode . Google rất vui mừng được giới thiệu thế hệ mô hình mở AI mới để hỗ trợ các nhà phát triển và nhà nghiên cứu xây dựng AI một cách có trách nhiệm.
Mô hình mở Gemma
Gemma là dòng gồm các mẫu mở nhẹ, hiện đại, được xây dựng từ cùng nghiên cứu và công nghệ được sử dụng để tạo ra các mẫu Gemini . Được phát triển bởi Google DeepMind và các nhóm khác trên Google, Gemma được lấy cảm hứng từ Gemini và cái tên này phản ánh gemma trong tiếng Latin , có nghĩa là “đá quý”. Cùng với trọng số mô hình của mình, Google cũng phát hành các công cụ hỗ trợ sự đổi mới của nhà phát triển, thúc đẩy sự cộng tác và hướng dẫn việc sử dụng có trách nhiệm các mô hình Gemma.
Gemma có sẵn trên toàn thế giới, bắt đầu từ hôm nay với các thông tin chính sau:
- Gemma có hai loại: Gemma 2B và Gemma 7B . Mỗi kích thước được phát hành với các biến thể được đào tạo trước và điều chỉnh theo hướng dẫn.
- Bộ công cụ AI sáng tạo có trách nhiệm cung cấp hướng dẫn và các công cụ cần thiết để tạo các ứng dụng AI an toàn hơn với Gemma.
- Google đang cung cấp chuỗi công cụ để suy luận và tinh chỉnh có giám sát (SFT) trên tất cả các khung chính: JAX, PyTorch và TensorFlow thông qua Keras 3.0 gốc .
- Sổ ghi chép Colab và Kaggle sẵn sàng sử dụng , cùng với việc tích hợp với các công cụ phổ biến như Hugging Face , MaxText , NVIDIA NeMo và TensorRT-LLM , giúp bạn dễ dàng bắt đầu với Gemma.
- Các mô hình Gemma được đào tạo trước và được điều chỉnh theo hướng dẫn có thể chạy trên máy tính xách tay, máy trạm hoặc Google Cloud của bạn với khả năng triển khai dễ dàng trên Vertex AI và Google Kubernetes Engine (GKE).
- Tối ưu hóa trên nhiều nền tảng phần cứng AI đảm bảo hiệu suất dẫn đầu ngành, bao gồm GPU NVIDIA và Google Cloud TPU .
- Điều khoản sử dụng cho phép sử dụng và phân phối thương mại có trách nhiệm đối với tất cả các tổ chức, bất kể quy mô.
Hiệu suất hiện đại ở kích thước
Các mô hình Gemma chia sẻ các thành phần kỹ thuật và cơ sở hạ tầng với Gemini , mô hình AI lớn nhất và có khả năng nhất của Google được cung cấp rộng rãi hiện nay. Điều này cho phép Gemma 2B và 7B đạt được hiệu suất tốt nhất trong phân khúc đối với kích thước của chúng so với các mẫu mở khác. Và các mẫu Gemma có khả năng chạy trực tiếp trên máy tính xách tay hoặc máy tính để bàn của nhà phát triển. Đáng chú ý, Gemma vượt qua các mô hình lớn hơn đáng kể về các điểm chuẩn chính trong khi vẫn tuân thủ các tiêu chuẩn khắt khe về kết quả đầu ra an toàn và có trách nhiệm. Xem báo cáo kỹ thuật để biết chi tiết về hiệu suất, thành phần tập dữ liệu và phương pháp lập mô hình.
Chịu trách nhiệm về thiết kế
Gemma được thiết kế với Nguyên tắc AI của Google. Là một phần trong việc làm cho các mô hình được đào tạo trước của Gemma trở nên an toàn và đáng tin cậy, Google đã sử dụng các kỹ thuật tự động để lọc ra một số thông tin cá nhân nhất định và dữ liệu nhạy cảm khác khỏi các tập huấn luyện. Ngoài ra, Gemma đã được sử dụng phương pháp học tập tăng cường và tinh chỉnh sâu rộng từ phản hồi của con người (RLHF) để điều chỉnh các mô hình được điều chỉnh theo hướng dẫn của với các hành vi có trách nhiệm. Để hiểu và giảm thiểu hồ sơ rủi ro cho các mô hình Gemma, Google đã tiến hành đánh giá mạnh mẽ bao gồm việc lập nhóm thử nghiệm thủ công, thử nghiệm tự động và đánh giá khả năng của mô hình đối với các hoạt động nguy hiểm. Những đánh giá này được nêu trong Thẻ mẫu của Google.
Google cũng sẽ phát hành Bộ công cụ AI sáng tạo có trách nhiệm mới cùng với Gemma để giúp các nhà phát triển và nhà nghiên cứu ưu tiên xây dựng các ứng dụng AI an toàn và có trách nhiệm. Bộ công cụ bao gồm:
- Phân loại an toàn: cung cấp một phương pháp mới để xây dựng các bộ phân loại an toàn mạnh mẽ với số lượng mẫu tối thiểu.
- Gỡ lỗi: công cụ gỡ lỗi mô hình giúp bạn điều tra hành vi của Gemma và giải quyết các vấn đề tiềm ẩn.
- Hướng dẫn: bạn có thể tiếp cận các phương pháp hay nhất dành cho người xây dựng mô hình dựa trên kinh nghiệm của Google trong việc phát triển và triển khai các mô hình ngôn ngữ lớn.
Tối ưu hóa trên các framework, công cụ và phần cứng
Bạn có thể tinh chỉnh các mô hình Gemma trên dữ liệu của riêng mình để thích ứng với các nhu cầu ứng dụng cụ thể, chẳng hạn như tóm tắt hoặc tạo tăng cường truy xuất (RAG). Gemma hỗ trợ nhiều công cụ và hệ thống khác nhau:
- Các công cụ đa khung: Mang đến khung yêu thích của bạn, với các triển khai tham chiếu để suy luận và tinh chỉnh trên Keras 3.0 đa khung, PyTorch, JAX gốc và Hugging Face Transformers.
- Khả năng tương thích trên nhiều thiết bị: Các mô hình Gemma chạy trên các loại thiết bị phổ biến, bao gồm máy tính xách tay, máy tính để bàn, IoT, thiết bị di động và đám mây, cho phép các khả năng AI có thể truy cập rộng rãi.
- Nền tảng phần cứng tiên tiến: Google đã hợp tác với NVIDIA để tối ưu hóa Gemma cho GPU NVIDIA , từ trung tâm dữ liệu đến đám mây cho đến PC RTX AI cục bộ, đảm bảo hiệu suất dẫn đầu ngành và khả năng tích hợp với công nghệ tiên tiến.
- Được tối ưu hóa cho Google Cloud: Vertex AI cung cấp bộ công cụ MLOps rộng rãi với nhiều tùy chọn điều chỉnh và triển khai chỉ bằng một cú nhấp chuột bằng cách sử dụng tối ưu hóa suy luận tích hợp. Tùy chỉnh nâng cao có sẵn với các công cụ Vertex AI được quản lý hoàn toàn hoặc với GKE tự quản lý, bao gồm việc triển khai cơ sở hạ tầng tiết kiệm chi phí trên GPU, TPU và CPU từ một trong hai nền tảng.
Tín dụng miễn phí cho nghiên cứu và phát triển
Gemma được xây dựng dành cho cộng đồng mở gồm các nhà phát triển và nhà nghiên cứu hỗ trợ đổi mới AI. Bạn có thể bắt đầu làm việc với Gemma ngay hôm nay bằng cách sử dụng quyền truy cập miễn phí vào Kaggle, một cấp độ miễn phí dành cho sổ tay Colab và khoản tín dụng trị giá 300 USD cho người dùng Google Cloud lần đầu. Các nhà nghiên cứu cũng có thể đăng ký khoản tín dụng Google Cloud lên tới 500.000 USD để đẩy nhanh dự án của họ.
Bắt đầu
Bạn có thể khám phá thêm về Gemma và truy cập hướng dẫn bắt đầu nhanh trên ai.google.dev/gemma .
Khi Google tiếp tục mở rộng dòng mô hình Gemma, họ sẽ hướng tới mục tiêu giới thiệu các biến thể mới cho các ứng dụng đa dạng. Hãy theo dõi các tin tức mới nhất từ TinAI.vn trong những tuần tới để kết nối, học hỏi và xây dựng cùng Gemma.
Trung Hòa