Lobsters00 bình luận26 phút đọc2 giờ trước

How VictoriaLogs Stores Your Logs in a Columnar Layout

Tóm tắt bởi AI

VictoriaLogs lưu trữ log theo cấu trúc cột (columnar) bằng cách chuẩn hóa thành identity stream, đệm trên shard CPU rồi ghi thành các phần (parts) bất biến theo ngày. Mỗi phần chia thành các cột riêng (values.binN) kèm bloom filter (bloom.binN) để lọc nhanh, cùng hệ thống index 2 cấp (metaindex.bin → index.bin) giúp truy vấn chỉ đọc đúng khối dữ liệu cần thiết, tối ưu hiệu suất ngay cả trên HDD chậm nhờ nén cao và seek trực tiếp.

Vì sao nên đọc: Lập trình viên muốn tối ưu hóa hiệu suất xử lý logs cần hiểu cách VictoriaLogs sử dụng cột (columnar) và bộ lọc Bloom để giảm thiểu đọc dữ liệu không cần thiết, giúp xử lý nhanh hơn trên các hệ thống có dung lượng ổ đĩa chậm.

Đọc bài gốc

#observability

Nguồn: https://victoriametrics.com/blog/victorialogs-internals-columnar-storage-on-disk. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.

Đề xuất cho bạn

Towards Data Science120 phút1 ngày trướcAI

We Built a Routing Layer to Cut Our AI Costs. It Broke the Product.

Đội ngũ xây dựng một lớp định tuyến dựa trên bộ phân loại (classifier) để tiết kiệm chi phí suy luận AI bằng cách chuyển truy vấn đơn giản sang các mô hình rẻ hơn, tiết kiệm ~60% chi phí hàng tháng. Tuy nhiên, sau ba tháng, sự hài lòng của khách hàng giảm và tỷ lệ rời bỏ tăng do chất lượng dịch vụ sụt giảm, khiến chi phí gấp 4-5 lần khoản tiết kiệm. Nguyên nhân gốc rễ là bộ phân loại không thể phát hiện đáng tin cậy độ phức tạp truy vấn "đuôi dài" (long-tail), các mô hình rẻ hơn thất bại mạnh mẽ trong các trường hợp biên, và hệ thống giám sát hiện tại không theo dõi chất lượng theo từng tầng, che giấu sự suy giảm riêng lẻ. Bài viết giải thích cơ chế thất bại, phương pháp phát hiện (giám sát chất lượng theo tầng, lấy mẫu thừa đuôi dài, theo dõi độ tin cậy bộ phân loại), và đề xuất kiến trúc thay thế — hệ thống phân tầng theo độ không chắc chắn (uncertainty-routed cascades), nơi mọi truy vấn bắt đầu từ mô hình rẻ nhất và chỉ leo thang lên mô hình mạnh hơn khi độ tin cậy thấp.

How VictoriaLogs Stores Your Logs in a Columnar Layout

Đề xuất cho bạn

We Built a Routing Layer to Cut Our AI Costs. It Broke the Product.

Tempo 3.0 release: a new architecture for scale and lower TCO, TraceQL metrics GA, and more

Monitor Laravel Queues, Commands, and Schedulers on Any Driver with Vigilance

Your Foundation Model is a Service. Operate it Like One

Grafana 13.1 release: observability as code updates, extending Grafana Assistant across more data sources, and more

Heron : Wireshark for AI Agents: passive eBPF observability

The inside scoop on alerting changes in Kubernetes Monitoring

A revamped way to create and manage alerts across all your telemetry