Các kỹ thuật tăng sức chịu lỗi cho chương trình

Nội dung

Các kỹ thuật tăng sức chịu lỗi cho chương trình:

  • Tận dụng asynchronous communication: Hãy sử dụng asynchronous communication bất cứ khi nào có thể, đặc biệt là giao tiếp giữa các dịch vụ nội bộ, ví dụ như giữa các microservice. Bạn có thể sử dụng một message broker, hoặc áp dụng event-driven architecture. Sử dụng giao tiếp asynchronous giúp tránh lan tỏa các kết nối hay dịch vụ chậm, giả sử bạn có dịch vụ A phụ thuộc vào B, rồi B phụ thuộc C, nếu C chậm sẽ làm cả A và B chậm theo, và khi mạng lưới dịch vụ của bạn càng lớn, mức độ ảnh hưởng sẽ càng cao. Khi áp dụng asynchronous communication, bạn sẽ cần sử dụng mô hình eventual consistency, hay còn gọi là optimistic replication, vốn rất phổ biến khi làm việc với các mô hình phân tán, hoặc có lẽ bạn cũng đã nghe qua nó khi học về CQRS.
  • Sử dụng timeout: đừng bao giờ chờ một dịch vụ khác mà không có timeout, có thể một lúc nào đó cả ứng dụng của bạn bị treo chỉ bởi một dịch vụ trong đó bị treo.
  • Cung cấp một phương án dự phòng: nếu không thể gọi đến một dịch vụ nào đó thì bạn sẽ làm gì? Trả về một mã lỗi? Tất nhiên là vậy rồi, nhưng hãy cân nhắc một phương án dự phòng nếu có thể, ví dụ như trả lại dữ liệu có trong cache, hay trả về một giá trị mặc nhiên, nếu logic chương trình chấp nhận điều này, các phương án dự phòng sẽ giúp tỷ lệ lỗi giảm xuống đáng kể.
  • ‘Retry: Khi gặp lỗi gọi một dịch vụ, đôi khi lỗi đó có thể chỉ là tạm thời, một microservice có thể không thể truy cập chỉ vì nghẽn mạng, hoặc đang bị chuyển từ node này sang node khác, vậy nên hãy thử lại một vài lần trước khi coi nó là không thể truy cập. Tuy nhiên có một lưu ý là bạn nên tăng thời gian chờ mỗi khi thử lại, ví dụ các lần thử lại có thể là sau 0.5-1-2-4-8, hoặc 0.5-2-8 giây, thay vì cứ sau mỗi 1 giây, vì xác xuất một dịch vụ “sống lại” sẽ giảm dần theo thời gian. Con số cụ thể là do bạn quyết định dựa trên mỗi dịch vụ, ví dụ các dịch vụ xử lý file, hay gửi email, đôi khi người ta có thể đặt thời gian thử lại lên đến đơn vị giờ, điều này giúp tránh việc bạn tự DOS chính các dịch vụ của bạn.
  • Giới hạn số lời gọi dịch vụ ngay từ phía client: Nếu bạn đang thực hiện một vài lời gọi đến một dịch vụ và nó vẫn chưa thể hoàn thành, vậy việc thực hiện thêm lời gọi nữa có lẽ chỉ làm hệ thống trở nên quá tải hơn, vậy nên hãy kiểm soát ngay từ client với số lời gọi đồng thời được giới hạn phù hợp. Mẹo: Bạn có thể dùng Semaphore để kiểm soát điều này.
  • Áp dụng rate limiting, kể cả cho các dịch vụ nội bộ: Rate limiting cho phép giới hạn số lời gọi đến, có thể dựa trên tổng số request đang xử lý, hoặc trên đơn vị thời gian như Slide Window hoặc Fixed Window.
  • Sử dụng Circuit Breaker pattern: Circuit Breaker là một design pattern cho phép bạn trả về các lỗi ngay lập tức khi số lỗi đạt đến một giới hạn, hay nói cách khác là “ngắt” mạch. Sau một thời gian ta có thể thử lại và nếu không còn lỗi, “mạch” sẽ được đóng lại và có thể sử dụng như bình thường.

Happy coding!

Anthony Nguyễn

Cây bút chính tại VietnamTutor

Bài viết cùng chuyên mục

Git reset revert restore: chọn lệnh đúng

Bài viết so sánh git reset, git revert và git restore theo mục đích sử dụng: sửa staging area, khôi phục file, undo commit chưa push

Git commit vào nhánh sai: cách chuyển an toàn

Bài viết hướng dẫn xử lý git commit vào nhánh sai theo từng tình huống: commit chưa push, đã push, nhiều commit liên tiếp hoặc branch

TypeScript cho website doanh nghiệp: API, form và lỗi

TypeScript cho website doanh nghiệp đáng dùng khi bạn cần kiểm soát API contract, form schema, CMS payload và cấu hình môi trường. Bài này giúp

React Server Components performance: khi nào nên dùng?

React Server Components performance không phải phép màu. Bài này giúp bạn biết khi nào RSC giảm JavaScript thật, khi nào làm kiến trúc phức tạp

Git commit nhầm file: bỏ file khỏi commit an toàn

Bài viết hướng dẫn xử lý git commit nhầm file theo từng tình huống: chưa commit, đã commit chưa push, đã push lên remote, hoặc lỡ

Git reflog: khôi phục commit đã mất an toàn

Bài viết hướng dẫn dùng git reflog để khôi phục commit đã mất sau reset, rebase, amend hoặc xóa nhánh. Bạn sẽ biết cách đọc reflog,

Git pull bị conflict: cách sửa không mất code

Bài viết hướng dẫn cách xử lý git pull bị conflict theo từng bước: kiểm tra trạng thái, sửa file xung đột, test lại và hoàn

Next.js production performance: chọn SSR, SSG, ISR hay Edge

Bài viết giúp developer và tech lead chọn cách render phù hợp để tối ưu Next.js production performance mà không làm kiến trúc phức tạp quá

Nâng cấp Laravel 13: Checklist 10 bước cần kiểm tra

Hướng dẫn nâng cấp Laravel 13 chi tiết với checklist 10 bước. Từ kiểm tra PHP 8.3, cập nhật dependencies, đến xử lý lỗi thường gặp

Hardening Laravel production: Checklist bảo mật cần làm

Checklist hardening Laravel production toàn diện. Từ cấu hình server, database, SSL đến security headers, rate limiting và monitoring.

Authentication và authorization trong Laravel: Cách phân biệt

Hướng dẫn chi tiết cách xây dựng hệ thống Authentication (xác thực) và Authorization (phân quyền) trong Laravel với Breeze, Fortify, Sanctum, Policies và Gates.

Bảo mật Laravel: 10 lỗi phổ biến và cách phòng tránh

Hướng dẫn 10 lỗi bảo mật phổ biến nhất trong Laravel và cách phòng tránh hiệu quả. Từ XSS, SQL injection đến authentication vulnerabilities.