Làm việc với Chroma
import chromadb
chroma_client = chromadb.PersistentClient(path=”/content/drive/MyDrive/chromadb”)
ChromaDB được tổ chức thành các bộ, nơi mỗi bộ là giống như một CSDL riêng rẽ bên trong toàn bộ cấu trúc ChromaDB,
nhưng cái đó nằm trong cùng thư mục lâu dài. Bạn có thể tổ chức dữ liệu của bạn thành các bộ riêng biệt hay giữ tất
cả dữ liệu trong một bộ đơn. Cái này là một quyết định thiết kế; khuyến nghị của tôi là nhóm thông tin theo khu
vực và tạo một bộ khác cho mỗi khu vực độc lập. Theo cách này, bạn có thể đảm bảo rằng chỉ thông tin phù hợp sẽ
được sử dụng với model.
Mỗi bộ phải có một tên riêng, nên nếu chúng ta thử tạo một bộ sử dụng một tên hiện có, nó sẽ ném ra một lỗi.
Trước khi tạo một bộ mới, bạn sẽ kiểm tra liệu một bộ với cùng tên tồn tại trong danh sách các bộ ChromaDB. Nếu
nó có, nó là cần thiết để xóa nó trước khi tạo bộ mới, hay chính sử dụng tên khác cho bộ mới.
Tôi đã đề cập rằng notebook này được thiết kế để làm việc với các tập dữ liệu khác nhau. Bạn có thể tạo 3 bộ khác
nhau, mỗi cái chứa nội dung của một trong tập dữ lệu đó. Vì lợi ích của đơn giản hóa code tới tối đa, tôi đã chuẩn
bị nó với chỉ một bộ, nhưng tôi tự tin rằng một khi bạn hoàn thành ví dụ, bạn sẽ có thể thực hiện điều chỉnh này
dễ dàng.
