SitePoint00 bình luận17 phút đọc3 giờ trước

Untitled

Tóm tắt bởi AI

Google giới thiệu mô hình Gemma QAT (quantization-aware training) có thể chạy cục bộ chỉ với dưới 7GB VRAM, phù hợp cho phần cứng tiêu dùng như RTX 3060. Hướng dẫn bao gồm cài đặt Ollama, tải mô hình Gemma QAT int4, xây dựng dịch vụ Node.js với retry logic, Express proxy, và tích hợp React chat component qua Vite. QAT cải thiện chất lượng 4-bit so với BF16 trên các benchmark như MMLU và HumanEval. Yêu cầu tối thiểu là 6GB VRAM rời hoặc 16GB RAM thống nhất trên Apple Silicon, cùng các mẹo tối ưu hiệu suất.

Vì sao nên đọc: Lập trình viên muốn phát triển ứng dụng AI trên thiết bị cá nhân hiệu quả mà không cần cloud đắt tiền nên đọc để hiểu cách triển khai mô hình LLM nhẹ (Gemma QAT) với VRAM thấp và xây dựng stack hoàn chỉnh từ cài đặt đến giao diện người dùng.

Đọc bài gốc

#react #nodejs #ollama #local-ai

Nguồn: https://www.sitepoint.com/gemma-4-qat-running-local-llms-in-6gb-ram. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.

Đề xuất cho bạn

freeCodeCamp210 phút8 giờ trướcAI

How to Build a Personal AI Web Research Agent with Ollama and Qwen

Hướng dẫn từng bước xây dựng một agent nghiên cứu web AI cục bộ bằng Ollama, mô hình Qwen3.5:4b và Python. Agent này nhận lệnh nghiên cứu, tìm kiếm 5 kết quả web hàng đầu qua API tìm kiếm web của Ollama, trích xuất văn bản bằng BeautifulSoup, sau đó tóm tắt bằng mô hình Qwen chạy cục bộ. Kết quả được lưu dưới dạng file Markdown có dấu thời gian, hoạt động hoàn toàn trên thiết bị mà không tốn phí API hay xâm phạm quyền riêng tư.

Lập trình viên muốn tự động hóa công việc nghiên cứu web một cách hiệu quả, tiết kiệm chi phí và bảo mật dữ liệu cá nhân nên đọc bài này để xây dựng một hệ thống AI cá nhân hoạt động trên thiết bị riêng của mình.

#python

Untitled

Đề xuất cho bạn

How to Build a Personal AI Web Research Agent with Ollama and Qwen

Everything but the runtime

CQRS Without the Astronaut Architecture

You're Using React Compound Components Wrong

I tried PewDiePie's open-source AI workspace, and it's weirdly great

From Local LLM to Tool-Using Agent

This Week In React #287: Fragment ref, React Compiler, StyleX, React Router, cnfast, Base UI, Remotion, React Aria

Typed Polymorphic React Component