Snowflake Community0 Hot0 bình luận14 phút đọc1 giờ trước

Federated Learning on Snowflake: Training ML Models Across Accounts Without Sharing Data

Tóm tắt bởi AI

Triển khai Horizontal Federated Learning (HFL) hoàn toàn trên Snowflake bằng các tính năng gốc, không cần máy chủ hay S3 bên ngoài, với 3 tài khoản Snowflake trên AWS và Azure. Hệ thống huấn luyện 10 client trên dữ liệu y tế CDC phân tán địa lý, sử dụng FedAvg cho Logistic Regression và Federated Forest cho XGBoost, kết hợp Differential Privacy bằng nhiễu Gaussian. Kết quả cho thấy mô hình federated vượt trội so với local baselines, đặc biệt XGBoost hưởng lợi gấp 4.5 lần so với LogReg, với mọi client đều cải thiện trên dữ liệu riêng. Snowflake sử dụng Private Listings, Python Stored Procedures, VARIANT columns và Model Registry cho trao đổi tham số, huấn luyện, lưu trữ JSON linh hoạt và quản lý phiên bản.

Vì sao nên đọc: Nếu bạn đang phát triển hệ thống học máy phân phối trên cloud mà không muốn phụ thuộc vào hạ tầng bên ngoài, Snowflake là giải pháp tối ưu vì nó cho phép triển khai học tập liên hợp (federated learning) hoàn toàn trên nền tảng này, tiết kiệm chi phí và tăng tính bảo mật bằng cách không chia sẻ dữ liệu thực.

Bạn nhớ được gì?

Trả lời 3 câu hỏi ngắn để nhận điểm thưởng cho bài này. Chỉ làm khi bạn muốn lấy điểm.

tối đa +17 điểm

3 câu hỏi · dưới một phút · không bắt buộc

Đọc bài gốc

#machine-learning #deep-learning #snowflake #xgboost

Nguồn: https://medium.com/snowflake/federated-learning-on-snowflake-training-ml-models-across-accounts-without-sharing-data-a745e0a196d7. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.

Đề xuất cho bạn

Gusto Engineering1 Hot6 phút9 giờ trướcAI

From Prompt to Classifier: A Production Case Study

Đội kỹ thuật của Gusto xây dựng bộ phân loại chuyển tiếp AI-sang-người cho hệ thống hỗ trợ khách hàng bằng cách bắt đầu với prompt LLM, sử dụng dữ liệu sản xuất để tạo dataset 3.500 lượt hội thoại, sau đó tinh chỉnh mô hình BERT nhẹ đạt 94% precision và 93% recall. Phương pháp LLM-đầu-tiên-sau-chuyên-biệt phù hợp cho quyết định ổn định, khối lượng lớn như phân loại intent, nhưng không hiệu quả với sinh văn bản mở hoặc quy tắc thay đổi.

Lập trình viên nên đọc bài này để hiểu cách chuyển từ việc sử dụng mô hình LLM trực tiếp sang xây dựng hệ thống chuyên biệt hiệu quả, đặc biệt là trong trường hợp phân loại quyết định cụ thể như phân luồng hỗ trợ khách hàng, giúp tối ưu hóa chi phí và tốc độ triển khai.

#machine-learning

Federated Learning on Snowflake: Training ML Models Across Accounts Without Sharing Data

Bạn nhớ được gì?

Đề xuất cho bạn

From Prompt to Classifier: A Production Case Study

Unlocking the Power of the TPU Stack: Introducing our new Developer Hub

Scaling Laws, Carefully

Our Research on Membership Inference Attacks and Preventing Privacy Leaks

Hexora v0.3: New features and improvements

Ex-Tesla Optimus engineer settles trade secret lawsuit and raises $11M to build robot hands

How to Choose Between Small and Frontier Models

The New Age of Consulting: How We Reduced Data Model Refresh Time by 90 %