Cơ sở dữ liệu Vector và LLMs (phần 20)

Công nghệ gì sẽ dùng? (tiếp tục)

ChromaDB là theo đường thẳng để sử dụng trong khi là một trong những giải pháp mạnh mẽ nhất cùng lúc. Nó xử lí
hầu hết công việc cho chúng ta. Nó là một giải pháp mã nguồn mở cái có thể tích hợp mượt mà với LangChain hay
LlamaIndex, cái là quan trọng vì, trong các học phần sau, bạn sẽ sử dụng langChain để xây dựng các giải pháp
phức tạp gia tăng.
Mô hình ngôn ngữ sử dụng trong dự án này là một cái mã nguồn mở, từ Hugging Face. Cụ thể, tôi chọn TinyLlama.
Một mô hình ngôn ngữ lớn thực sự nhỏ thông minh, dựa trên Llama.
Tip Sử dụng các phiên bản nhỏ hơn của các models bất cứ khi nào có thể.
Cá nhân thì, tôi tận hưởng trải nghiệm với các models khác nhau bất cứ khi nào tôi có cơ hội, và Hugging Face
cung cấp một lựa chọn rộng các models để chọn từ đó. Dự án này là không khác, và tôi đã test các models khác nhau.
Tôi khuyến nghị bạn trải nghiệm với các models mới hơn từ Hugging Face, thử lặp lại thực hành.
Nếu bạn quyết định đi theo lời khuyên của tôi và thử một model khác, bạn có thể tìm kiếm cho nó trên Hugging Face,
như đã thấy tại phần bắt đầu của học phần, và đảm bảo nó được huấn luyện cho tạo sinh text. Xem ảnh trên.

Chia sẻ