Chuỗi: hitl-agentic-systems · Phần 1
AI / Hệ thống agentic
Agentic systems là gì
Bài mở đầu chuỗi HITL: agentic system khác chatbot thế nào, tại sao cần điểm dừng khi agent thao tác hệ thống.
2026-03-099 phút đọcVI
English title: What Are Agentic Systems?
Bài 1 trong chuỗi HITL trong hệ thống Agentic — dành cho ai muốn hiểu từ nền tảng: agent khác chatbot thế nào, tại sao khi agent “đụng” hệ thống thật (gửi mail, đổi dữ liệu, deploy) ta cần “điểm dừng”, và Human-in-the-Loop (HITL) là gì trong bức tranh đó.
Mở đầu: Từ trợ lý chỉ trả lời đến agent có thể “làm”
Hồi mới dùng trợ lý AI, đa số chúng ta quen với kiểu: hỏi một câu, nhận một câu trả lời. Có thể follow-up vài vòng, nhưng về bản chất vẫn là hỏi–đáp: bot không tự gửi email, không tự sửa database, không tự deploy code. Rủi ro nếu trả lời sai thường giới hạn ở thông tin sai lệch — ta có thể sửa bằng câu hỏi tiếp theo.
Khi hệ thống tiến thêm một bước — agent không chỉ trả lời mà còn gọi tool, thực hiện nhiều bước và tự đặt mục tiêu phụ — mọi thứ thay đổi. Một agent có thể đọc calendar, gửi mail mời họp, tạo task trong Jira, hoặc (trong môi trường dev) chạy script deploy. Lần đầu agent tự deploy mà không hỏi lại, nhiều team giật mình: tốc độ thì cao, nhưng ai chịu trách nhiệm khi sai? Câu chuyện đó dẫn tới chủ đề chuỗi này: Human-in-the-Loop (HITL) — con người tham gia vào đúng chỗ để vừa tận dụng sức mạnh agent, vừa kiểm soát rủi ro.
Bài đầu tiên làm rõ nền tảng: agentic system là gì, khác chatbot thế nào, và tại sao khi agent thao tác hệ thống thật ta cần điểm dừng (approval gate). Các bài sau sẽ đi sâu vào định nghĩa HITL, state machine, queue, audit và best practice.
1. Chatbot và agent — ranh giới ở đâu?
Giá trị (value): Nếu bạn đang chuyển từ non-tech sang tech hoặc là sinh viên muốn vào ngành AI/agent, việc đầu tiên cần phân biệt là: chatbot và agent không phải cùng một thứ chỉ “thông minh hơn”. Chatbot thường phản hồi từng turn: user gửi tin, hệ thống trả lời; có thể có vài tool đơn giản (tra thời tiết, tìm kiếm) nhưng luồng chính vẫn là “hỏi → trả lời”. Agent trong nghĩa “agentic system” thì tự chủ hơn: nó có thể tự đặt mục tiêu phụ (sub-goals), chọn tool phù hợp, và chạy nhiều bước với ít sự can thiệp từng bước của con người. Đọc xong phần này bạn sẽ hiểu tại sao “có tool” chưa đủ để gọi là agentic, và tại sao khi agent thao tác hệ thống thật ta cần nghĩ tới điểm dừng.
Thách thức (challenges): Ranh giới giữa “có tool” và “tự chủ” đôi khi bị nhầm lẫn. Một chatbot gắn API gửi email vẫn có thể chỉ “làm đúng một việc user yêu cầu” — không tự quyết “bước tiếp theo là gì”. Agentic system thường có đặc trưng: autonomy (tự quyết trong phạm vi mục tiêu), goal-directed (hướng tới mục tiêu cao cấp, tự sinh mục tiêu phụ), perception (đọc trạng thái môi trường), action (gọi tool, thay đổi thế giới), và learning/feedback (cải thiện từ kết quả). Định nghĩa rõ giúp tránh gọi nhầm mọi thứ “có AI” là agent.
Thiết kế (design): Một cách ngắn gọn:
- Chatbot: Luồng chủ đạo là turn-by-turn; có thể gọi tool nhưng theo “lệnh” rõ ràng từ user mỗi bước.
- Agent (agentic): Nhận mục tiêu cao cấp (vd. “chuẩn bị báo cáo tuần cho sếp”), tự đặt mục tiêu phụ (lấy data, tổng hợp, soạn draft), tự chọn tool và thứ tự bước, thực hiện nhiều bước với ít giám sát từng bước.
Bảng so sánh giúp nhớ nhanh:
| Chatbot | Agent (agentic) | |
|---|---|---|
| Mục tiêu phụ | Thường do user chỉ rõ từng bước | Tự sinh từ mục tiêu cao cấp |
| Số bước | Thường 1–2 bước mỗi turn | Nhiều bước, có thể loop |
| Tool | Có thể có, dùng theo yêu cầu rõ | Chọn tool theo kế hoạch nội bộ |
| Giám sát | User điều khiển từng bước | Ít can thiệp; có thể chỉ kiểm tra kết quả cuối |
Giải pháp (solution): Nêu rõ đặc trưng agentic: tự đặt mục tiêu phụ, chọn tool, thực hiện nhiều bước với ít giám sát. Khi đó, bước tự nhiên tiếp theo là: nếu agent thao tác lên hệ thống thật (gửi mail, đổi DB, deploy), thì khi nào ta cần “dừng lại” để con người xác nhận? — đó chính là HITL.
Triển khai (implementation): Ở bài này ta không đi sâu code hay state machine; chỉ cần bạn nắm ý: agentic ≠ chatbot, và khi agent hành động có ảnh hưởng thật, ta cần thiết kế điểm dừng (approval gate). Bài 2 sẽ nói “tại sao cần con người trong vòng lặp”; bài 3 trở đi sẽ đi định nghĩa HITL, state, queue, audit.
2. Agent thao tác hệ thống — ví dụ đời thường và rủi ro
Giá trị (value): Để cảm nhận rõ tại sao “điểm dừng” quan trọng, hãy hình dung agent không chỉ đọc mà còn ghi: gửi email hàng loạt, cập nhật database, chạy deploy lên production. Lần đầu agent tự deploy mà không hỏi lại, hoặc tự gửi mail cho cả list khách hàng, nhiều team nhận ra: chi phí khi sai (rollback, sửa data, xin lỗi khách) có thể rất lớn — lớn hơn chi phí để con người review trước khi hành động đó được thực thi. Phần này giúp bạn có trực giác: đâu là “hành động có ảnh hưởng”, và khi nào ta nên chèn một gate “dừng lại, cho người duyệt”.
Thách thức (challenges): Độ tin cậy của model và tool không phải 100%; edge case (hiểu nhầm ý user, bug trong tool, dữ liệu lỗi) có thể dẫn tới hành động sai. Ai chịu trách nhiệm khi agent gửi nhầm mail hay xóa nhầm bản ghi? Trách nhiệm đó thường vẫn thuộc về tổ chức và người vận hành — do đó cần cơ chế con người kiểm tra tại những điểm then chốt.
Thiết kế (design): Phân biệt nhanh phạm vi hành động:
- Read-only: Đọc data, đọc calendar, search — rủi ro sai thường thấp hơn (có thể hiển thị sai thông tin nhưng không thay đổi thế giới).
- Write / side-effect: Gửi mail, tạo task, cập nhật DB, deploy — mỗi hành động có thể gây hậu quả khó sửa. Đây là nơi ta thường đặt approval gate: agent đề xuất hành động, hệ thống dừng lại, người duyệt approve/reject/modify rồi mới thực thi.
Môi trường production vs sandbox cũng khác: trong sandbox có thể cho agent “tự do” hơn để thử nghiệm; lên production thì gate thường chặt hơn.
Giải pháp (solution): Cần điểm dừng (approval gate) khi chi phí hành động sai lớn hơn chi phí để con người review. Cách tính “cost” có thể là thời gian, tiền bạc, uy tín, hoặc rủi ro pháp lý — tùy ngữ cảnh. Nguyên tắc chung: Human-in-the-Loop = con người tham gia tại các điểm dừng, không phải can thiệp từng bước nhỏ mà đúng chỗ quyết định lớn.
Triển khai (implementation): Bài 2 sẽ đi chi tiết “tại sao cần con người trong vòng lặp” (khi nào autonomous đủ, khi nào cần human). Ở đây chỉ cần bạn ghi nhớ: agent thao tác hệ thống thật → cần thiết kế gate; bài sau sẽ định nghĩa rõ HITL và approval flow.
3. Tại sao cần “điểm dừng” — dẫn nhập HITL
Giá trị (value): Chuẩn bị tâm thế cho cả chuỗi: HITL không phải “làm chậm” hay “chống lại AI”, mà là đặt con người đúng chỗ, đúng lúc — tại những bước mà sai lầm có giá cao. Bạn sẽ hiểu ý niệm approval gate: luồng chạy đến một bước → pending review → người duyệt approve / reject / modify → tiếp tục hoặc sửa. Chi tiết state machine (pending, approved, rejected, timeout) và queue sẽ ở bài 4, 5; bài 1 chỉ cần nắm ý.
Thách thức (challenges): Cân bằng giữa tốc độ (agent chạy nhanh, không muốn nghẽn) và an toàn (không để hành động nguy hiểm chạy qua mà không ai kiểm tra). Khi nào để agent tự quyết hoàn toàn, khi nào bắt buộc phải có người? Câu trả lời phụ thuộc vào từng loại hành động và chính sách rủi ro — chuỗi này sẽ đưa ra pattern và best practice.
Thiết kế (design): Ý niệm approval gate:
- Agent (hoặc workflow) chuẩn bị thực hiện một hành động “có ảnh hưởng”.
- Hệ thống dừng tại gate, đánh dấu trạng thái pending_review.
- Người được chỉ định nhận thông báo (Slack, email, dashboard), xem nội dung cần duyệt.
- Người chọn Approve (cho chạy), Reject (hủy), hoặc Modify (sửa rồi approve).
- Hệ thống tiếp tục theo quyết định: thực thi bước tiếp theo hoặc dừng / sửa.
Không đi sâu state machine hay queue ở bài 1 — chỉ cần hình dung: agent → gate → human → tiếp tục.
Giải pháp (solution): Human-in-the-Loop (HITL) = con người tham gia vào vòng quyết định hoặc hành động tại các điểm dừng (approval gates). Các bài sau sẽ đi: định nghĩa HITL chi tiết, trạng thái và state machine, queue và kênh phê duyệt, identity và audit trail, rồi đến feedback và continuous improvement.
Triển khai (implementation): Kết bài với một hình ảnh đơn giản để nhớ:
[ User mục tiêu ] → [ Agent lên kế hoạch + gọi tool ] → [ Điểm dừng: pending review ]
↓
[ Người duyệt: Approve / Reject / Modify ] → [ Tiếp tục hoặc dừng / sửa ]
Chuỗi tiếp theo sẽ làm rõ khi nào cần gate, đặt ở đâu (trước tool hay sau bước workflow), và triển khai thế nào (state, queue, audit). Bài 2: Tại sao cần con người trong vòng lặp — cost of wrong action vs cost of review, và khi nào autonomous đủ.
Tóm tắt (Summary — English)
What are agentic systems? They are systems that can set sub-goals, choose tools, and run multiple steps with little per-step human supervision — unlike turn-by-turn chatbots. When such agents act on real systems (send email, update DB, deploy), the cost of a wrong action can be high, so we need approval gates: the flow pauses, a human reviews and approves/rejects/modifies, then execution continues. That is Human-in-the-Loop (HITL). This first post lays the foundation; the next posts will cover when to use HITL, state machines, queues, audit, and best practices.
Chuỗi: HITL trong hệ thống Agentic · Bài 1/11. Pillar: AI/Agentic. Engine: ACE-LDK-claire-personal-branding-engine.
