3.7. Thiết lập monitoring & cảnh báo cơ bản
Bài 7 – Thiết lập monitoring & cảnh báo cơ bản cho website
Chạy website mà không theo dõi uptime và không có cảnh báo khi sập là một cách “đợi catastrophe”. Bài này sẽ giúp bạn thiết lập hệ thống giám sát cơ bản (monitoring) và nhận thông báo khi site down, băng thông vượt ngưỡng, hoặc có lỗi nghiêm trọng.
Nội dung chính:
- Dùng 1 service uptime monitor miễn phí (ví dụ: UptimeRobot, UptimeRadar…).
- Hiểu log lỗi cơ bản (error_log, plugin log).
- Thiết lập cảnh báo khi site down hoặc băng thông vượt ngưỡng (nếu hosting hỗ trợ).
- Checklist “bảo trì định kỳ hàng tháng” (backup, update, test form…).
1. Dùng 1 service uptime monitor miễn phí
Service uptime monitor sẽ “nhìn” website của bạn định kỳ (ví dụ 5 phút/lần) và báo cho bạn nếu site không trả về 200 OK.
Nhiều dịch vụ miễn phí đủ dùng cho blog, landing page, site nhỏ, ví dụ:
- UptimeRobot – giám sát HTTP/HTTPS, ping, port, cho nhiều website trong gói miễn phí.
- UptimeRadar – hỗ trợ theo dõi 10–50 URL miễn phí, gửi cảnh báo qua email, Slack, v.v.
- Một số dịch vụ khác: Monitor.us, BasicState, SiteUptime, Port Monitor… (tùy nhu cầu, nhưng UptimeRobot là phổ biến nhất với người mới).
1.1. Hướng dẫn nhanh với UptimeRobot
- Truy cập https://uptimerobot.com và đăng ký tài khoản miễn phí.
- Sau khi đăng nhập, nhấn Add New Monitor.
- Chọn kiểu HTTP(s), dán URL website của bạn (ví dụ: https://hostforge.vn).
- Chọn khoảng kiểm tra (ví dụ 5 phút), có thể thêm keyword (nếu site trả 200 nhưng nội dung sai).
- Thêm kênh thông báo (email, Telegram, Slack, v.v. tùy dịch vụ hỗ trợ).
- Lưu lại, ư robot bắt đầu kiểm tra định kỳ.
Ưu điểm: không cần cài ứng dụng trên máy, chỉ cần một tài khoản, và bạn sẽ nhận email/Telegram khi site không truy cập được.
2. Log error cơ bản (error_log, plugin log)
Log lỗi là “tiếng khai mạc” khi site có vấn đề, dù không sập hẳn.
2.1. Xem error_log trên hosting
Trên hosting có control panel (cPanel, v.v.), thường có mục:
- Error Log hoặc Metrics → Errors.
- Xem các dòng lỗi 404, 500, 502, 504, PHP fatal error, maximum execution time exceeded, v.v.
- Giữa những lỗi ngẫu nhiên, nếu xuất hiện nhiều lỗi giống nhau trong cùng thời gian, có thể là do 1 plugin mới, 1 action nào đó, hoặc bị spam/bị tấn công.
2.2. Dùng plugin để ghi & đọc log dễ hơn
Nếu cPanel log quá rối, bạn có thể dùng plugin hỗ trợ log trên WordPress như:
- Plugin chuyên về log lỗi (ví dụ: “WP File Manager”, plugin debug).
- Plugin bảo mật có màn hình log (ví dụ: Wordfence, Sucuri, All in One WP Security, v.v.)
Người mới chỉ cần biết:
- Tại sao có lỗi, có bug ở đâu, plugin nào gây ra, có phải bị tấn công hay không.
- Nếu thấy nhiều lỗi liên tục nhưng không có dấu hiệu rõ rệt, hãy chụp log và gửi cho nhà cung cấp hosting hoặc developer để debug.
3. Thiết lập cảnh báo khi site down / băng thông vượt ngưỡng
3.1. Cảnh báo khi site down qua UptimeRobot & plugin
UptimeRobot (hoặc bất kỳ service nào bạn dùng) có thể gửi email, Telegram, Slack, v.v. khi:
- Trang trả 5xx, 4xx, hoặc không trả về 200 OK.
- Trang không trả về keyword bạn chỉ định (ví dụ chỉ báo động nếu không thấy một dòng text nào trong source).
Cách tốt: dùng 1–2 kênh chính (email + Telegram/Slack) để không bị “báo rác” nhưng vẫn đủ cảnh báo.
3.2. Nếu hosting cho phép: cảnh báo băng thông vượt ngưỡng
Một số hosting cung cấp report và thông báo khi:
- Băng thông vượt quá giới hạn.
- Disk space sắp đầy.
Việc bạn cần làm:
- Đăng nhập vào panel hosting.
- Xem phần Resource Usage hoặc Bandwidth hoặc Notifications.
- Bật cảnh báo khi băng thông vượt 70–90% giới hạn.
Lợi ích: bạn có thể tối ưu hình ảnh, tài nguyên, hoặc nâng gói trước khi site bị tạm dừng vì hết băng thông.
4. Checklist “bảo trì định kỳ hàng tháng”
Để giữ website ổn định lâu dài, bạn nên có một checklist “bảo trì định kỳ” mỗi tháng (hoặc 2–3 tháng/lần nếu nguồn lực hạn chế).
Checklist gợi ý:
- Backup: kiểm tra backup tự động (hosting, plugin) có còn hoạt động, thử khôi phục nhẹ trên staging nếu có.
- Update: cập nhật WordPress core, theme, plugin, plugin bảo mật, cache.
- Security: kiểm tra plugin bảo mật, log, lỗi, số lần login thất bại, có plugin cũ không dùng.
- Monitoring: kiểm tra uptime monitor (UptimeRobot, v.v.) có cảnh báo nào không, log lỗi, error 500/502.
- Uptime & bảo vệ: đảm bảo HTTPS, SSL, cache, CDN, plugin nén ảnh, cache, và tối ưu đang chạy ổn định.
- Test chức năng chính: test form liên hệ, đăng ký, checkout (nếu có), xem có lỗi 404, 500, hay không.
- Performance: chạy PageSpeed Insights hoặc GTmetrix, kiểm tra nếu có vấn đề nghiêm trọng.
Chỉ cần 30–60 phút mỗi tháng cho checklist này, bạn có thể giữ website ổn định, giảm rủi ro downtime, và luôn sẵn sàng cho traffic tăng.