Mã hóa dữ liệu
Ở phần này, chúng ta sẽ học về các dạng khác nhau của mã hóa dữ liệu (data encoding).
Chúng ta sẽ xem làm cách nào nhận dạng, mã hóa và giải mã một vài hình thức khác nhau cũng như thảo luận
các lọc (filters) và chúng làm việc như thế nào.
Mặc dù các ứng dụng web có mục đích và công nghệ khác nhau.., việc sử dụng mã hóa dữ liệu là thứ gì đó không
thể bị bỏ qua.
Từ quan điểm kiểm định thâm nhập, hiểu loại gì của mã hóa dữ liệu đang được sử dụng và nó làm việc như thế
nào là vấn đề cơ bản trong đảm bảo rằng các kiểm định được thực hiện như ý định.
Hãy phân tích ngắn gọn các dạng chính của mã hóa dữ liệu được sử dụng trong các ứng dụng hướng web:
+ URL encoding
+ HTML encoding
+ Base (32|64) encoding
+ Unicode encoding
URL encoding là gì?
Như được phát biểu trong RFC 3986, các URLs được gửi qua internet phải chứa các kí tự trong dải tập hợp kí tự
US – ASCII code. Nếu các kí tự không an toàn có mặt trong một URL. mã hóa chúng được yêu cầu.
URL encoding hay percent encoding, thay thế các kí tự bên ngoài tập hợp cho phép với một % được theo sau
bởi hai số hex, trình bày giá trị số của octet.
Bảng được thể hiện dưới đây là một hình họa mã hóa kí tự đơn giản cái là hữu dụng trong giải thích các kí
tự nào là an toàn và kí tự nào nên được mã hóa trong URLs.
Một vài các kí tự được mã hóa phổ biến là: