Làm việc với XML trong Python
Python bao gồm hỗ trợ bản địa cho tìm kiếm và tạo các tài liệu XML trong thư viện tiêu chuẩn của nó dưới xml module.
Các thư viện bên thứ ba phổ biến, như lxml, cung cấp một API tương tự nhưng thực thi bên dưới khác. Vì lợi ích của
đơn giản hóa, chúng ta gắn với cái có sẵn bản địa trong Python cho các ví dụ này.
XML là trật tự có thứ bậc kế thừa, cái làm nó là phù hợp tốt cho một cấu trúc tree (cây). Cái này được làm một chút
rõ ràng hơn trong ảnh dưới, cái cung cấp một trình bày hình ảnh của tài liệu XML cơ bản trong phần code dưới.
Ảnh hóa giống những cái này có thể là hữu dụng khi điều hướng các tài liệu XML bằng cách sử dụng một ngôn ngữ lập
trình như Python.
Có một vài cách thức để tìm kiếm trên một tree cho một đoạn thông tin cụ thể, mỗi cái với các pros và cons của bản
thân nó. Trong phần này, chúng ta gắn với những cái thực tiễn và theo đường thẳng nhất để hiểu cho một ví dụ đã cho.
Phần này là một giải thích cực kì đậm đặc về các cấu trúc cây và làm cách nào lặp qua chúng. Học và tài nguyên học
khác tập trung vào các cấu trúc dữ liệu và thuật toán sẽ cung cấp cho bạn một sự hiểu biết sâu hơn về các loại cấu
trúc cây khác nhau và chúng được sử dụng cho cái gì.
API cho làm việc với XML trong Python dựa trên khái niệm về một cây phần tử: theo nghĩa đen một cây các phần tử XML.
Cái này khá tương phản với cách thức bạn làm việc với dữ liệu từ YAML hay JSON, cái chập trực tiếp vào các cấu trúc
dữ liệu như các dictionaries và lists, cái có thể dễ dàng hơn để hiểu tại cái nhìn đầu tiên. Tuy nhiên, nếu bạn có
thể hiểu cơ bản của các cấu trúc cây, ElementTree API khá theo đường thẳng.