Cơ sở dữ liệu Vector và LLMs (phần 10)

RAG và các CSDL vector (tiếp tục)

Như bạn có thể đã biết, một model có thể nhận dữ liệu theo 2 cách, và nếu không qua huấn luyện, tùy chọn duy nhất
là prompt. Tuy nhiên, vấn đề khác dấy lên ở đây: lượng thông tin chúng ta có thể truyền qua prompt là không phải
không giới hạn. Model không thể nhận tất cả thông tin cái chúng ta muốn người dùng của chúng ta có lối truy cập vào.
Nhưng ở đây đi đến giải pháp: model có thể nhận thông tin cần thiết cho câu hỏi cụ thể cái người dùng cung cấp.
Bây giờ rằng nền tảng của nhu cầu, vấn đề và giải pháp được định nghĩa. Tôi sẽ thử liệt kê theo một phong cách rất
đơn giản các bước một hệ thống RAG đi theo:
+ Nơi lưu giữ kiến thức: Bước đầu tiên là lưu giữ thông tin cái model có thể rút trên. Cơ sở kiến thức này có thể
bao gồm dữ liệu có cấu trúc (như các CSDL), dữ liệu không cấu trúc (như các tài liệu text), hay thậm chí code. Chúng
ta sẽ sử dụng một CSDL vector để lưu giữ thông tin này.
+ Tiếp nhận câu hỏi: hệ thống RAG nhận câu hỏi hay yêu cầu người dùng. Cái này có thể trong ngôn ngữ tự nhiên, chính
như một câu hỏi bạn hỏi một người.
+ Truy xuất thông tin: Đây là nơi “Retrieval” trong RAG đi vào vai trò. Hệ thống chọn thông tin phù hợp đối với câu
hỏi người dùng từ dữ liệu được lưu trữ. Trong một CSDL vector, cái này đòi hỏi so sánh vector để giành thông tin liên
quan từ CSDL.

Chia sẻ