Các ứng dụng AI đa thể thức (phần 7)

Hiểu ảnh (tiếp tục)

Sử dụng Gemini 1.5 Pro

LangChain sử dụng đầu vào đa thể thức qua cùng giao diện ChatModel. Nó chấp nhận Messages như một đầu
vào, và một Message object có một trường content. IA content có thể bao gồm nhiều phần, và mỗi phần
có thể trình bày một thể thức khác nhau (cái cho phép bạn pha trộn các thể thức khác nhau trong prompt
của bạn).
Bạn có thể gửi đầu vào đa thể thức theo giá trị hay theo tham chiếu. Để gửi nó theo giá trị, bạn nên
mã hóa các bytes như một string và xây dựng một một biến image_url định dạng như trong ví dụ dưới đây
sử dụng ảnh bạn khởi tạo sử dụng Stable Diffusion:
code 1
code 2

Chia sẻ