Kaggle
Kaggle là một trong những nền tảng nổi tiếng nhất trên thế giới cho các nhà khoa học dữ liệu hay kĩ sư AI. Trong
nhiều năm, nó đã là trục chủ yếu cho cuộc thi trí tuệ nhân tạo và khoa học dữ liệu. Các công ty đã host cuộc
thi, và các cá nhân và đội khác nhau sẽ cạnh tranh để giành kết quả tốt nhất trong giải quyết vấn đề trình bày.
Ngoài thi, Kaggle có các phần khác: các tập dữ liệu, Notebooks, và gần đây là các Models thêm vào.
Người dùng không chỉ tham gia các cuộc thi mà còn upload các tập dữ liệu và notebooks, cái nhận các phiếu bầu từ
những người dùng khác, cho phép họ kiếm các hạng mục chuyên môn mới.
Trong các học phần, các tập dữ liệu khác nhau có sẵn trên Kaggle sẽ được sử dụng. Nhiều tập dữ liệu Kaggle
đã trở thành các tiêu chuẩn miễn bàn trong nghành và được sử dụng trong nhiều góc cạnh các ví dụ. Tôi đã không
sử dụng bất cứ những cái biết đến nhiều nhất vì 2 lí do: trước tiên, không có nhiều tập dữ liệu gắn với các dự án
LLMs, đa số là các tập dữ liệu bảng sử dụng trong các vấn đề học máy cổ điển (xem ảnh trên). Thứ hai, tôi tin
nó luôn là tốt hơn để khám phá các thứ khác nhau.

