Các bộ phận lõi của các hệ thống agent (phần 3)

Chọn Model (tiếp tục)

Tương phản lại, các models nhỏ hơn – như distilled ModernBERT variants hay Phi-4 – thường phù hợp hơn
cho các agents thực hiện các nhiệm vụ lặp lại, định nghĩa tốt. Các models này chạy hiệu quả trên phần
cứng địa phương, trả lời nhanh, và ít tốn kém hơn để triển khai và duy trì. Chúng làm việc tốt trong
các thiết lập có cấu trúc như hỗ trợ khách hàng, giành thông tin, hay gán nhãn dữ liệu, nơi chính xác
được cần nhưng sáng tạo và linh động là ít quan trọng hơn. Khi phản ứng thời gian thực hay hạn chế tài
nguyên là then chốt, các models nhỏ hơn là hiệu quả hơn các đối trọng lớn hơn của chúng đơn giản bởi
nó là thực tế hơn.
Một khía cạnh quan trọng ngày càng tăng trong chọn model là thể thức. Các agents ngày nay thường cần
xử lí không chỉ text, mà còn các ảnh, âm thanh hay dữ liệu có cấu trúc. Các models nhiều thể thức như
GPT-5 and Claude 4.1, làm các agents có thể biên dịch và kết hợp các dạng dữ liệu đa dạng – text, ảnh
, giọng nói và nhiều hơn. Cái này mở rộng tiện ích của agent trong lĩnh vực như y tế, robot và hỗ trợ
khách hàng, nơi các quyết định dựa trên tích hợp nhiều dạng của đầu vào. Tương phản lại, các models chỉ
text chỉ còn lí tưởng cho các trường hợp sử dụng điều hướng bởi ngôn ngữ, cung cấp độ phức tạp thấp hơn
và can thiệp nhanh hơn trong các kịch bản nơi các thể thức thêm cung cấp ít hơn giá trị gia tăng.

Chia sẻ