Giới Thiệu ReAct Framework
ReAct (Reasoning and Acting) là kiến trúc cognitive nền tảng cho hầu hết các agentic systems hiện đại. Paper gốc từ Princeton & Google Brain (2022).
1. Ba Thành Phần Của ReAct Loop
Thought → Action → Observation → Thought (repeat)
Thought (Suy Nghĩ)
LLM phân tích tình huống hiện tại và đưa ra kế hoạch.
Action (Hành Động)
Thực thi một tool hoặc API call cụ thể.
Observation (Quan Sát)
Kết quả trả về từ action, được đưa lại vào context.
2. Chain-of-Thought vs ReAct
| Aspect | CoT | ReAct |
|---|---|---|
| Grounding | ❌ Hallucinate | ✅ Tool outputs |
| Traceability | ⚠️ Khó debug | ✅ Có log |
| Flexibility | ❌ Fixed | ✅ Adaptive |
3. Challenges in Production
- Token Consumption: Mỗi iteration tiêu tốn nhiều tokens
- Latency Compounding: 5 iterations = 5x latency tối thiểu
- Error Propagation: Một observation sai có thể derail cả reasoning chain
🔥 Luôn set max_iterations và implement early stopping dựa trên confidence score.
