Trang chủ / Glossary / Canonical URL

Canonical URL

Trở về trang danh sách thuật ngữ

Canonical URL (tiếng Việt: URL chính tắc) là URL của trang mà Google cho là trang đại diện phù hợp nhất trong số các trang trùng lặp trên trang web của bạn.

Nếu bạn có một trang có thể truy cập bằng nhiều URL hoặc các trang khác nhau có nội dung tương tự thì Google sẽ xem các trang này là phiên bản trùng lặp của cùng một trang.

Trang chính và trang trùng lặp không nhất thiết phải giống nhau hoàn toàn, chúng cũng có thể nằm trên các miền khác nhau.

Google sẽ chọn một URL làm phiên bản chính và thu thập dữ liệu trang đó. Google sẽ xem tất cả URL khác là URL trùng lặp và thu thập dữ liệu các trang này ít hơn.

Tại sao bạn có các trang tương tự hoặc trùng lặp?

Có nhiều lý do xác đáng cho việc trang web của bạn có thể có nhiều URL trỏ đến cùng một trang hoặc có các trang trùng lặp/rất giống nhau tại nhiều URL. Sau đây là những lý do phổ biến nhất:

  • Website của bạn tự động lưu nhiều URL khi bạn đặt cùng một bài đăng vào nhiều chuyên mục. Ví dụ:
  1. https://bettergrowth.org/marketing/cach-hoc-marketing/
  2. https://bettergrowth.org/digital-marketing/cach-hoc-marketing/
  • Website của bạn hỗ trợ trên nhiều thiết bị. Ví dụ:
  1. Máy tính: https://bettergrowth.org/digital-marketing/
  2. Di động: https://m.bettergrowth.org/digital-marketing/
  3. AMP cho di động: https://amp.bettergrowth.org/digital-marketing/
  • Các biến thể URL động cho thông số tìm kiếm, ID phiên hoạt động hoặc mã phân tích. Ví dụ:
  1. https://bettergrowth.org/glossary/title-tag/?fbclid=IwAR1Q6V9 (trong đó ?fbclid=IwAR1Q6V9 là mã phân tích của Facebook)
  2. https://bettergrowth.org/glossary/title-tag/
  • Máy chủ phân phối cùng một nội dung cho cả biến thể HTTP so với HTTPS hoặc www so với các trang không www. Ví dụ:
  1. HTTPS, www: https://www.bettergrowth.org
  2. HTTPS, không phải www: https://bettergrowth.org
  3. HTTP, www: http://www.bettergrowth.org
  4. HTTP, không phải www: http://bettergrowth.org
  • Nội dung được sao chép một phần hoặc toàn bộ để phân phối trên nhiều tên miền khác nhau. Ví dụ:
  1. Bài đăng gốc: https://bettergrowth.org/ke-hoach-marketing/
  2. Bài đăng được phân phối chứa nội dung sao chép: https://blog.example.com/cach-lap-ke-hoach-marketing/1425/

Tại sao bạn nên chọn canonical URL?

Mặc dù ngay cả khi bạn chỉ định rõ trang chính, Google vẫn có thể chọn một trang khác làm trang chính vì nhiều lý do khác nhau như hiệu suất hoặc nội dung.

Tuy nhiên, bạn vẫn nên chủ động chọn canonical URL trong một tập hợp các trang trùng lặp hoặc tương tự để:

  • Chỉ định URL mà bạn muốn mọi người nhìn thấy trong kết quả tìm kiếm.
  • Hợp nhất tín hiệu liên kết cho các trang tương tự hoặc trùng lặp.
  • Đơn giản hóa việc theo dõi chỉ số cho một nội dung cụ thể.
  • Tránh Googlebot dành thời gian lâu hơn cho việc thu thập dữ liệu các trang trùng lặp.

Đối với trường hợp trang web của bạn bị sao chép?

Trong rất ít trường hợp, thuật toán của Google có thể chọn một URL từ trang web bên ngoài đang lưu trữ nội dung của bạn mà không được bạn cho phép.

Nếu bạn tin rằng một trang web khác đang sao chép nội dung của bạn theo cách vi phạm luật bản quyền, bạn có thể liên hệ với nhà cung cấp dịch vụ lưu trữ của trang web đó để yêu cầu xóa nội dung.

Ngoài ra, bạn có thể yêu cầu Google xóa trang vi phạm khỏi kết quả tìm kiếm bằng cách gửi yêu cầu.

Làm thế nào để chọn canonical URL?

Có năm cách để chỉ định canonical URL:

  • Thẻ HTML (Thẻ rel=canonical)
  • Tiêu đề HTTP rel=canonical
  • Sơ đồ trang web
  • Lệnh chuyển hướng 301
  • Liên kết nội bộ

Các quy tắc khi thực hiện thẻ canonical để chỉ định URL chính tắc

  • Sử dụng URL tuyệt đối

Bạn nên sử dụng cấu trúc:

<link rel=“canonical” href=“https://example.com/sample-page/” />

Thay vì:

<link rel=“canonical” href=“/sample-page/” />
  • Sử dụng URL chữ thường

Vì Google có thể coi URL chữ hoa và chữ thường là hai URL khác nhau. Vì vậy, tốt hơn hết bạn nên sử dụng URL chữ thường cho các thẻ canonical của bạn.

  • Sử dụng phiên bản miền chính xác (HTTPS/HTTP)

Nếu bạn đang sử dụng chứng chỉ SSL, hãy đảm bảo rằng tất cả các URL được khai báo trong thẻ canonical đều phải là HTTPS. Ví dụ:

<link rel=“canonical” href=“https://bettergrowth.org/sample-page/” />

Nếu bạn không sử dụng chứng chỉ SSL, bạn sẽ cần làm điều ngược lại (tức URL được khai báo trong thẻ canonical đều phải là HTTP).

  • Chỉ sử dụng một thẻ canonical cho mỗi trang

Trong trường hợp có nhiều khai báo rel=canonical trên một trang, Google có thể sẽ bỏ qua tất cả các gợi ý rel=canonical.

Điều đó đồng nghĩa với việc, bất kỳ lợi ích nào mà một rel=canonical hợp pháp có thể đã được cung cấp trước đây sẽ bị mất.

Trở về trang danh sách thuật ngữ