Cơ sở dữ liệu Vector và LLMs
Trong các học phần trước, bạn đã học làm cách nào sử dụng OpenAI API và giành các kết quả đầu tiên của bạn từ một
mô hình ngôn ngữ lớn.
Bạn cũng quan sát làm cách nào xây dựng một prompt và áp dụng nó để tạo một chatbot và một cái khởi tạo SQL. Trong
khi nó có thể không có vẻ như quan trọng đáng kể, tôi có thể đảm bảo bạn rằng với 2 dự án nhỏ này, bạn đã giành
những tập kĩ thuật đáng kể cái bạn sẽ sử dụng thường xuyên trong tương lai.
Trong học phần này, bạn sẽ bước đi một bước phía trước thực sự ấn tượng. Bạn sẽ hạ xuống lên việc tạo một trong những
dự án được theo đuổi nhất bởi các công ty ngày nay: nâng cao trả lời của mô hình ngôn ngữ lớn với thông tin tùy chỉnh.
Nói cách khác, bạn sẽ xây dựng một hệ thống Retrieval Augmented Generation (RAG) sử dụng một mô hình ngôn ngữ lớn
mã nguồn mở từ Hugging Face và một CSDL vector.
Nhưng cái đó không phải tất cả, chúng ta cũng sẽ sử dụng một tập dữ liệu từ Kaggle, nền tảng khác mọi chuyên gia
trí tuệ nhân tạo nên quen thuộc.
Trước khi bắt đầu với dự án, tôi nghĩ rằng nó được khuyên để cung cấp một khái quát ngắn về các khái niệm mới liên
quan.
