RAG và các CSDL vector
RAG, một viết tắt cho Retrieval Augmented Generation, bao gói một khái niệm khá theo đường thẳng: cố ảnh hưởng lên
trả lời của model qua tích hợp dữ liệu của bản thân chúng ta.
Một cách có thể để ảnh hưởng model với dữ liệu của bản thân chúng ta là qua tinh chỉnh và hợp nhất nó vào quá trình
huấn luyện model. Cách tiếp cận này làm model có thể xây dựng các câu trả lời, xem xét dữ liệu cung cấp. Tuy nhiên,
thường thì, cái này có thể không phải là giải pháp tối ưu vì các lí do khác nhau.
Xem xét đầu tiên cái có thể đi vào tâm trí là chi phí và nỗ lực đòi hỏi trong tinh chỉnh hay huấn luyện một model,
đặc biệt khi làm việc với một lượng lớn thông tin cái chúng ta nhằm tích hợp.
Có thể thì, nhân tố then chốt nhất là rằng thông tin là không nhất thiết có hiệu lực mãi mãi. Nó có thể tùy thuộc
vào các thay đổi. Trong các trường hợp như vậy, không ai muốn tinh chỉnh model mọi lần thông tin được điều chỉnh.
Ngoài ra, không có cơ chế để làm model quên cái gì đó nó vừa học.
Chúng ta cũng có thể chạm trán một kịch bản trong đó thông tin gia tăng định kì. Trong trường hợp như vậy, thực hiện
tinh chỉnh trên model định kì cũng không là cách tiếp cận tối ưu nhất.
Ngày nay, nhiều công ty đối mặt một kịch bản tương tự với cái này và đang tìm kiếm cho một giải pháp. Họ có một
lượng lớn dữ liệu cái họ muốn làm có sẵn với người dùng của họ, và các đặc điểm của dữ liệu này không khuyến nghị
bao gồm nó như phần của kiến thức bên trong của model.
