Tạo một hệ thống RAG với tập dữ liệu News
Trong phần này, chúng ta sẽ xây dựng một hệ thống RAG có khả năng trả lời tới các câu hỏi sử dụng thông tin từ một
tập dữ liệu của tin tức công nghệ.
Tại phần trung tâm của ảnh trên là CSDL vector, chịu trách nhiệm cho lưu giữ các tài liệu trong dạng embeddings. Khi
một truy vấn người dùng, nó tìm kiếm cho thông tin cái có thể là phù hợp câu hỏi đó giữa tất cả thông tin chứa trong
CSDL. Số các tài liệu trả về sẽ phụ thuộc vào CSDL truy vấn như thế nào được cấu hình, nhưng những tài liệu đó
sẽ được thêm vào câu hỏi người dùng để tạo một prompt được augmented hay làm phong phú chứa yêu cầu và thông tin
phù hợp, đủ để giải quyết nó. Cuối cùng, prompt được truyền tới mô hình ngôn ngữ lớn, cái xử lí nó và tạo sinh một
trả lời.
Trong notebook tiếp theo, tất cả các bước của giải pháp sẽ được đề cập: Bạn sẽ cần giành tập dữ liệu, lưu giữ thông
tin trong CSDL vector hóa, tạo prompt được augmented, và cuối cùng, gọi model để giành một trả lời đúng đắn.

