A deep dive into PostgreSQL's merge join algorithm and the enable_mergejoin GUC. Merge join works by walking two sorted input streams in parallel, making it extremely efficient when data is already ordered by an index, but costly when it must sort first. The post covers when to flip enable_mergejoin off as a diagnostic probe — specifically when a Sort node under a Merge Join spills to disk — and when to investigate why the planner skipped merge join in favor of a nested loop or hash join. It also highlights the many-to-many duplicate-key pathology where a Materialize node appears under Merge Join. The key takeaway: the sort feeding the merge join is usually the real problem to fix, not the join strategy itself, and the GUC is a diagnostic instrument rather than a permanent tuning knob.
Nguồn: https://postgr.es/p/9nZ. 8sync News chỉ tóm tắt và dẫn link; bản quyền nội dung thuộc tác giả và nguồn gốc.
Doltgres, cơ sở dữ liệu tương thích PostgreSQL với tính năng kiểm soát phiên bản kiểu Git, sẽ ra mắt phiên bản 1.0 vào ngày 6 tháng 8. Phiên bản này tập trung vào tính chính xác (99% tuân thủ SQL Logic Test), ổn định định dạng lưu trữ, hiệu năng (trong phạm vi 3x PostgreSQL), và tương thích rộng rãi với các ORM, thư viện và công cụ phổ biến. Các tính năng bổ sung như workflow remote push/pull, giao thức nhân bản riêng cho thiết lập HA, cùng garbage collection tự động cũng đang được hoàn thiện. Nhóm phát triển kêu gọi người dùng thử nghiệm Doltgres trên workload thực tế và báo cáo lỗi trước khi ra mắt.
Lập trình viên nên đọc bài này để khám phá cách Doltgres kết hợp cơ sở dữ liệu PostgreSQL với hệ thống quản lý phiên bản Git, giúp phát triển ứng dụng trở nên hiệu quả hơn với tính ổn định, tương thích ORM và khả năng mở rộng cho các dự án lớn.

postgres-lsp là một triển khai mới theo giao thức Language Server (LSP) dành cho SQL và PL/pgSQL của PostgreSQL, sử dụng tree-sitter-postgres. Nó cung cấp các tính năng IDE như chẩn đoán lỗi, gợi ý ngữ nghĩa, điều hướng định nghĩa, định vị tham chiếu, hoàn thành thông minh, hỗ trợ chữ ký, đổi tên, hành động mã hóa và định dạng SQL với nhiều kiểu cài đặt sẵn.
Lập trình viên PostgreSQL nên đọc bài này để khám phá cách postgres-lsp nâng cao hiệu suất IDE với các tính năng như hoàn thành ngữ cảnh, định nghĩa và tham chiếu nhanh, và định dạng SQL theo nhiều phong cách chuyên nghiệp, thay vì phụ thuộc vào các công cụ cũ dựa trên regex.
Các association đa hình (polymorphic associations) trong PostgreSQL gây ra suy giảm hiệu suất nghiêm trọng do O(M×N) phép join không cần thiết, nhưng ba bản vá đang được thảo luận (Result Filter, Sort Pushdown, SubLink relocation) sẽ giải quyết vấn đề này bằng cách tối ưu hóa bộ lọc, sắp xếp sớm và chuyển đổi EXISTS thành SEMI-JOIN. Ngoài ra, thống kê selectivity (CREATE STATISTICS) cũng đang trong giai đoạn thử nghiệm để cải thiện hiệu suất truy vấn.
Lập trình viên cần đọc bài này để hiểu cách tối ưu hóa các mối liên kết đa hình trong PostgreSQL, giúp tránh mất hiệu suất khi ORM tự động tạo các join không hiệu quả, từ đó cải thiện tốc độ xử lý các truy vấn lớn.
Bài viết hướng dẫn xây dựng pipeline dữ liệu thời tiết toàn diện bằng các công cụ mã nguồn mở: Airflow điều phối, PostgreSQL lưu trữ, Metabase tạo dashboard BI, tất cả chạy trên Docker. Dữ liệu được thu thập mỗi giờ từ WeatherAPI cho các thủ phủ bang Brazil, xử lý qua DAG nhiều tầng của Airflow, rồi hiển thị dưới dạng dashboard thời tiết hiện tại, lịch sử và dự báo trên Metabase.
Lập trình viên muốn tự động hóa và tích hợp các công cụ phân tích dữ liệu từ API đến báo cáo trực quan sẽ tìm hiểu cách xây dựng một pipeline hoàn chỉnh với Airflow, PostgreSQL và Metabase để tối ưu hóa quy trình xử lý và chia sẻ thông tin thời tiết hiệu quả.
Postgres 19 bổ sung hỗ trợ sao chép logic (logical replication) cho sequences, vốn bị loại trừ suốt gần một thập kỷ do tính phi giao dịch. Tính năng mới tự động đồng bộ sequences tại các thời điểm xác định như tạo/refresh subscription, cùng công cụ hỗ trợ như hàm pg_get_sequence_data() và cột sync_seq_error_count. Cách tiếp cận này tương tự pglogical nhưng được tích hợp sẵn vào Postgres.
Lập trình viên cần đọc bài này để hiểu cách PostgreSQL 19 tự động đồng bộ hóa các chuỗi (sequences) trong cơ sở dữ liệu replication, giúp tránh lỗi thủ công và bảo đảm tính nhất quán khi chuyển đổi từ máy chủ sang subscriber mà không cần script bổ sung.
Nhóm kỹ thuật GitGuardian đã giảm thời gian phản hồi p95 của dashboard từ 8 giây xuống 1 giây nhờ 5 tối ưu hóa PostgreSQL trên hệ thống Django, bao gồm: deferred JOINs bằng prefetch_related, đếm bất đồng bộ, replica đọc premium, cải tiến full-text search (pg_trgm), và denormalization để hỗ trợ composite indexes. Việc nâng cấp lên PostgreSQL 18 cũng mang lại lợi ích nhỏ. Họ sử dụng OpenTelemetry và EXPLAIN ANALYZE để theo dõi tiến trình.
Nếu bạn đang làm việc với ứng dụng backend sử dụng PostgreSQL và Django, bài viết này sẽ giúp bạn tìm hiểu cách tối ưu hóa hiệu suất dashboard hiệu quả bằng những kỹ thuật cụ thể, từ đó tiết kiệm thời gian và chi phí phát triển.

Phiên bản pgAdmin 4 v9.16 vừa ra mắt với 64 bản sửa lỗi và tính năng mới, trong đó có 7 lỗ hổng bảo mật nghiêm trọng (CVE-2026-12044 đến CVE-2026-12050) như SQL injection, bypass giao dịch read-only, XSS lưu trữ, và lỗ hổng chuyển hướng mở. Ngoài ra, phiên bản này bổ sung giao diện mã màu cho server, hỗ trợ đóng tab bằng click giữa, cấu hình bảo mật Helm chart, và hỗ trợ TOAST tuple trong Materialized View. pgAgent đã bị loại bỏ và sẽ bị gỡ bỏ trong vòng 6 tháng tới.
Lập trình viên phát triển ứng dụng sử dụng PostgreSQL nên đọc bài này để cập nhật về các lỗ hổng bảo mật mới trong pgAdmin 4 (v9.16), đặc biệt là các vấn đề như SQL injection, XSS và RCE có thể ảnh hưởng đến tính bảo mật của hệ thống quản lý cơ sở dữ liệu mà họ sử dụng.

Phiên bản pgfmt 2.1 bổ sung hai tính năng chính: định dạng tại chỗ (--inplace/-i) cho phép ghi SQL đã format trở lại file gốc mà vẫn giữ nguyên quyền hạn, và chế độ --style pg_dump mô phỏng cách định dạng của PostgreSQL's ruleutils.c. Bản phát hành cũng cải thiện khả năng tương thích SQL/PLpgSQL, sửa lỗi mất ký tự trong string literals (như INTERVAL '2 days') và hỗ trợ cài đặt qua Homebrew.
Lập trình viên phát triển ứng dụng PostgreSQL nên đọc để tối ưu hóa việc định dạng và bảo trì mã SQL, đặc biệt là khi cần tái tạo cấu trúc chính xác của dữ liệu từ PostgreSQL bằng cách sử dụng pg_dump và khắc phục lỗi định dạng trong các script PL/pgSQL.