Sitemap XML là gì?
Đệ trình sitemap không phải là cái thay thế link tới site của bạn, nhưng nó có thể, trong một
vài trường hợp cải thiện tình trạng chỉ mục site của bạn.
Sitemap XML là một file đặc biệt đặt trên site của bạn, cái chứa một chỉ mục giúp bộ máy tìm
kiếm tìm đường đến trang web của bạn. Bạn tạo và đặt file này và sau đó cho bộ máy tìm kiếm
biết nó ở đâu. Đó là file ẩn (khách ghé thăm không bao giờ thấy nó) trong hình thức được thiết
kế đặc biệt cho bộ máy tìm kiếm.
Trong phát biểu của Google” Sử dụng sitemap để thông báo và hướng dẫn crawler của chúng tôi,
chúng tôi hi vọng mở rộng tầm bao phủ của chúng tôi lên web của bạn và đẩy nhanh tốc độ khám
phá và thêm các trang web vào chỉ mục của chúng tôi.”
Những sitemap này có tên sitemap.xml và đặt ở thư mục gốc của website cùng thư mục với trang
chủ.
Tạo sitemap của bạn
Có rất nhiều công cụ tạo sitemap miễn phí hoặc chi phí thấp có sẵn.
Trước tiên, nhiều hệ thống CMS có thể tự động tạo sitemap XML. Nếu bạn sử dụng wordpress để
tạo website của bạn, bạn có thể tìm thấy một số plugin, ngoài các chức năng Seo khác, tạo
sitemap cho bạn. Bạn có thể tìm thấy các extensions và modules, cái tạo sitemap cho hệ thống
joomla và drupal và nhiều hệ thống CMS khác. Thậm chí, các công cụ xây dựng site đơn giản như
của Godaddy cũng có chức năng tự động tạo sitemap XML.
Bạn cũng có thể tìm thấy các đoạn script hay công cụ cái tạo sitemap cho bạn, chỉ cần tìm kiếm
“create XML sitemaps” trên Google.Chú ý là nhiều công cụ có tên gọi là Google sitemap creators
vì Google là bộ máy tìm kiếm đầu tiên sử dụng sitemap. Tất cả cái bạn cần là một hình thức
sitemap XML của Google sẽ làm việc với tất cả các bộ máy tìm kiếm khác, vì vậy, nếu tạo một
Google sitemap, nó sẽ làm việc tốt.
Một file sitemap có thể nặng tới 10 MB và có thể chứa 50000 URLs. Nếu bạn vượt quá giới hạn
này, bạn phải tạo nhiều file sitemap và một filemap chỉ mục điều hướng tới các file sitemap
này. File sitemap XML có thể nén trong file .gz để có thể chuyển nhanh hơn tới bộ máy tìm
kiếm.
Đệ trình sitemap lên Google
Sau khi liên kết và xác thực website của bạn với Google search console tại:
https://search.google.com/search-console/about
Làm như ảnh minh họa để đệ trình sitemap XML lên Google:
Chú thích:
(1) Click lên Sitemaps tab
(2) Điền sitemap URL vào ô
(3) Nếu đệ trình thành công sẽ có thông điệp “success”
File robots.txt là gì?
File robots.txt là một loại người giữ cổng, kiểm soát ai và cái gì có thể đi qua tới các trang
web của bạn. Chúng thiết lập các quy tắc cho site của bạn, ví dụ như ngăn các con bọ của bộ
máy tìm kiếm khỏi crawl các trang cụ thể, ngăn chặn chúng xuất hiện trong SERPs.
Một file robots.txt nằm trong thư mục gốc của site của bạn và về cơ bản chứa các lệnh cho
phép (allow) hay không cho phép (disallow), thông báo ho con bọ tìm kiếm những trang nào
không thể truy cập. Ví dụ, các dòng sau trong file robots.txt:
User-agent:*
Disallow: /example-subfolder/
sẽ ngăn chặn tất cả trình thu thập dữ liệu không thu thập bất kì trang nào có chứa chuỗi URL
www.example.com/example-subfolder/
File robots.txt và sitemap
Dòng sau trong file robots.txt:
sitemap:http://www.yourdomain.com/sitemap.xml
Là URL trỏ tới sitemap của bạn.URL thông báo cho những bộ máy tìm kiếm cái không cung cấp tài
khoản webmaster như ask.com sitemap của bạn ở đâu. Vì vậy, bạn nên tạo dòng này ngay cả khi
bạn đã đệ trình sitemap của bạn lên Google hay Bing.
Tạo khu vực link ra ngoài (external links)
Nên tạo một khu vực link ra ngoài (widgets chẳng hạn), link cố định tới các site authority
như các site hiệp hội hay site uy tín khác. Cái này sẽ giúp tăng authority site của bạn. Google
đánh giá cao các nhóm site authority liên kết với nhau. Đây là yếu tố cấu trúc website cần
chú ý.