Tạo một ngôn ngữ tự nhiên đơn giản đối với CSDL dạng SQL của bạn sử dụng OpenAI
NL2SQL là một trong những phần khám phá chủ động nhất trong lĩnh vực các mô hình ngôn ngữ lớn. Nhiều công ty đã
khởi sự các dự án, khác nhau theo quy mô và thành công, đê giành dữ liệu từ CSDL của họ dựa trên các truy vấn
người dùng thể hiện bằng ngôn ngữ tự nhiên. Bản thân tôi đã làm việc trên một vài dự án NL2SQL, trải từ cái đơn
giản nhất, với chỉ một bảng và một vài yêu cầu mỗi ngày, tới một cái cấu trúc CSDL của nó không khớp trong prompt
của bất cứ mô hình nào và phải xử lí hàng ngàn yêu cầu hàng ngày.
Các mô hình ngôn ngữ lớn phù hợp tốt cho các giải pháp như vậy vì chúng có thể hiểu sâu ngôn ngữ người dùng trong
khi đồng thời sinh ra SQL code chất lượng cao.
Trong cách tiếp cận ban đầu này, bạn sẽ điều chỉnh code từ ví dụ trước, ice cream seller, để chuyển dạng nó thành
một giải pháp NL2SQL.
Dự án này sẽ đi kèm bạn xuyên suốt các học phần, và khi bạn tiến lên, bạn sẽ thấy làm cách nào kiến trúc các giải
pháp phức tạp và tránh các thách thức cái dấy lên trong các dự án NL2SQL.
Nhưng hãy không nhảy lên và xem làm cách nào tạo một giải pháp đơn giản trong một trong các lĩnh vực cái đang được
nghiên cứu sâu rộng và sử dụng trong các công ty, khởi sinh SQL code từ ngôn ngữ tự nhiên.
Code hỗ trợ, cái có thể được thực thi và điều chỉnh, là có sẵn trên Github, tại
https://github.com/Apress/Large-Language-Models-Projects.
Phần cho ví dụ này được gọi là 1_2-Easy_NL2SQL.ipynb.
