Google vừa giới thiệu mô hình AI mã nguồn mở đầu tiên của mình, Gemma, với hai phiên bản Gemma 2B và 7B. Mô hình này khá tốt cho các tác vụ sáng tạo bằng tiếng Anh như tạo văn bản, tóm tắt, lập luận cơ bản, v.v. Nhờ kích thước nhỏ gọn, Gemma có thể được tải xuống và sử dụng cục bộ trên máy tính có cấu hình thấp mà không cần kết nối internet. Bài viết này sẽ hướng dẫn bạn cách tải xuống và chạy mô hình AI Google Gemma trên Windows, macOS và Linux.
Contents
Tải xuống Mô hình Google Gemma 2B
Để bắt đầu, bạn cần tải xuống và cài đặt LM Studio (miễn phí) trên máy tính của mình. LM Studio. Sau khi cài đặt, hãy khởi chạy chương trình.
Trên trang chủ, bạn sẽ tìm thấy mô hình “Google’s Gemma 2B Instruct“. Bạn cũng có thể tìm kiếm thủ công “Gemma”. Sau đó, mở nó.
Tiếp theo, chỉ cần nhấp vào “Download”. Đây là một tệp có dung lượng 1.5GB vì mô hình Gemma 2B đã được lượng tử hóa 4-bit để nén kích thước mô hình và giảm mức sử dụng bộ nhớ. Nếu bạn có RAM 8GB trở lên, bạn có thể tải xuống mô hình lượng tử hóa 8-bit (2.67GB) để có hiệu suất tốt hơn.
Tải xuống mô hình Google Gemma
Chạy Google Gemma Ngoại Tuyến Sử dụng LM Studio
Sau khi tải xuống, hãy làm theo các bước sau để chạy mô hình Gemma:
- Trong LM Studio, di chuyển đến cửa sổ “Chat” ở phía bên trái.
- Sau đó, nhấp vào “Select a model to load” và chọn “gemma”. Nó sẽ tiêu thụ khoảng 1.4GB RAM.
Chọn mô hình Gemma trong LM Studio
- Bây giờ, bạn có thể đặt câu hỏi. Theo kinh nghiệm, mô hình Gemma 2B nhỏ gọn rất phù hợp cho các tác vụ sáng tạo bằng tiếng Anh. Nó sẽ từ chối trả lời bất cứ điều gì có giá trị khi được yêu cầu đưa ra ý kiến về bất kỳ chủ đề nào (ví dụ: C tốt hơn Rust?).
Demo mô hình Google Gemma
- Bạn cũng có thể đặt system prompt ở bên phải để tùy chỉnh hành vi của mô hình AI.
Thiết lập System Prompt trong LM Studio
Các Khía Cạnh Khác của Google Gemma
Ưu điểm:
- Kích thước nhỏ gọn: Cho phép tải xuống và chạy trên máy tính có cấu hình thấp.
- Mã nguồn mở: Cộng đồng có thể đóng góp và phát triển mô hình.
- Hoạt động ngoại tuyến: Không cần kết nối internet sau khi tải xuống.
Hạn chế:
- Hiệu suất: Có thể không mạnh mẽ như các mô hình AI lớn hơn.
- Hỗ trợ ngôn ngữ: Chủ yếu tập trung vào tiếng Anh.
- Khả năng xử lý tác vụ phức tạp: Hạn chế trong việc xử lý các yêu cầu đòi hỏi lập luận phức tạp.
-
Gemma là gì? Gemma là mô hình AI mã nguồn mở được phát triển bởi Google, cho phép thực hiện các tác vụ như tạo văn bản, tóm tắt và lập luận cơ bản.
-
Tôi có cần kết nối internet để sử dụng Gemma không? Không, sau khi tải xuống mô hình và LM Studio, bạn có thể sử dụng Gemma ngoại tuyến.
-
Gemma có hỗ trợ ngôn ngữ nào? Hiện tại, Gemma chủ yếu hỗ trợ tiếng Anh.
-
LM Studio là gì? LM Studio là một ứng dụng cho phép bạn tải xuống, quản lý và chạy các mô hình AI ngôn ngữ lớn, bao gồm cả Gemma.
-
Gemma có miễn phí không? Có, cả Gemma và LM Studio đều miễn phí sử dụng.
-
Tôi cần cấu hình máy tính như thế nào để chạy Gemma? Gemma 2B yêu cầu khoảng 1.4GB RAM. Máy tính có cấu hình thấp vẫn có thể chạy Gemma, nhưng hiệu suất có thể bị ảnh hưởng.
-
Gemma có thể làm những gì? Gemma có thể tạo văn bản, tóm tắt văn bản, dịch ngôn ngữ (ở mức độ cơ bản), trả lời câu hỏi và thực hiện một số tác vụ lập luận đơn giản.
Kết Luận
Trên đây là hướng dẫn chi tiết về cách tải xuống và chạy mô hình Google Gemma trên máy tính cá nhân. Mặc dù Gemma có thể chưa phải là mô hình AI mạnh mẽ nhất, nhưng nó là một lựa chọn tuyệt vời cho những ai muốn trải nghiệm và tìm hiểu về AI một cách đơn giản và dễ dàng. Nếu bạn đang tìm kiếm một trợ lý AI cục bộ thực sự, hãy xem xét Open Interpreter, hoạt động tương tự như Code Interpreter của ChatGPT và thực hiện các tác vụ thực tế trên máy tính của bạn. Open Interpreter. Về Afropolitan Group: Afropolitan Group.