Các ứng dụng AI đa thể thức (phần 6)

Hiểu ảnh

Hiểu ảnh nhắc đến một khả năng của hệ thống AI biên dịch và phân tích thông tin ảnh nhìn theo các cách
tương tự như nhận thức nhìn của con người. Không giống tầm nhìn máy tính truyền thống (cái tập trung
vào các nhiệm vụ cụ thể như phát hiện đối tượng hay nhận dạng khuôn mặt), các models đa thể thức
hiện đại có thể thực hiện luận lí chung về ảnh, hiểu bối cảnh, các quan hệ, và thậm chí ý nghĩa
ngầm bên trong nội dung ảnh nhìn.
Gemini 2.5 Pro và GPT-4 Vision, giữa các models khác, có thể phân tích ảnh và cung cấp các mô tả chi
tiết hay trả lời các câu hỏi về chúng.

Chia sẻ