Canonical URL là gì? Có lẽ đây là thuật ngữ khá lạ với newbie nhưng lại rất quen thuộc với dân SEO chuyên nghiệp. Vì vậy hôm nay Nghề Content giúp những người mới vào nghề tìm hiểu về cách tối ưu hóa trang web của bạn tốt nhất cho công cụ tìm kiếm.
TƯ VẤN KHOÁ HỌC CONTENT
Thẻ Canonical URL là gì?
Thẻ Canonical là một cách để khai báo với công cụ tìm kiếm về việc định danh cho nội dung thuộc một thủ thể đường dẫn (URL duy nhất), trong trường hợp bài đăng của các bạn phát sinh nhiều URL thì dựa vào thẻ canonical Google sẽ biết đượcnội dungđó thuộc trang nào và sẽ không nhận xét là trùng lặp thông tin trên một trang website.
Thuật ngữ Canonical có thể phức tạp với người mới nhưng khi tìm hiểu sẽ rất đơn giản. Giả sử có hai URL của một trang web:
http://www.seonamnguyen.com
https://www.seonamnguyen.com
Cả hai trang đó đều hiển thị thông tin và không có Redirect đến một trang duy nhất. Điều này có thể dẫn đến nỗi lo trùng lặp thông tin và bạn có thể bị Google phạt.
Hãy xem một ví dụ khác. Có hai URL trên một website cùng giao hiển thị giống nhau.
http://www.seonamnguyen.com
http://www.seonamnguyen.com/index.php Nếu cả hai trang website này đều có cùng kết quả, thì việc này cũng có thể gây ra vấn đề! Trường hợp này là lỗi thường xuyên nhất của các cơ quan thiết kế website.
Bạn có thể không lưu ý nhiều đến vấn đề này, nhưng việc tồn tại nhiều version khác nhau trên cùng 1 website gây ra hiện trạng duplicate content. Và công cụ tìm kiếm sẽ tiến hành lập chỉ mục với nhiều version khác nhau, sau đấy thuật toán Panda sẽ phạt site vì hiện trạng duplicate content.
Vì vậy việc sử dụng thẻ rel = “canonical” nhằm mục tiêu thông báo cho công cụ tìm kiếm biết đó là bản chính và cái nào là bản copy của nó. Điều nàysẽ giúp bạn tránh khỏi bị phạt do nội dung trùng lặp.
Tác dụng của thẻ Canonical trong SEO website?
Bạn có biết: Duplicate content là điều Google cực kỳ “ghét” không? Google đưa rõ ramột vàinguyên nhân vì sao bạn nên chọn trang chuẩn bài bản trong một tập hợp các trang trùng lặp/tương tự:
Để chỉ định URL mà bạn mong muốn mọi người nhìn thấy trong kết quả của tìm kiếm. Bạn muốn mọi người truy cập trang hàng hóa váy màu xanh lá của mình thông qua https://www.example.com/dresses/green/greendress.html chứ không phải https://example.com/dresses/cocktail?gclid=ABCD.
Để hợp nhất tín hiệu liên kết cho các trang tương tự hoặc trùng lặp. Điều này giúp công cụ tìm kiếm hợp nhấtthông tinđạt được cho từng URL riêng lẻ (chẳng hạn như liên kết đến các URL này) thành một URL độc nhất ưa thích. Việc nàycó nghĩa là liên kết từ các trang website khác đến http://example.com/dresses/cocktail?gclid=ABCDđược phù hợp nhất với liên kết đến https://www.example.com/dresses/green/greendress.html.
Để dễ dàng hóa việc theo dõi chỉ số cho một sản phẩm/chủ đề. Với nhiều URL không giống nhau, việc hợp nhấtchỉ số cho một thông tinnhất định trở nên chông gai hơn.
Để quản lý nội dung được cung cấp. Nếu như bạncung cấpnội dung để xuất bản trên các miền khác, bạn mong muốnphù hợp nhấtthứ hạng trang cho URL ưa thích của bạn.
Để tránh dành ra thời gianlấy dữ liệu các trang trùng lặp. Bạn mong muốn Googlebot khai thác tối đa trang website của mình, vậy thì Googlebot nên dành ra thời gianthu thập dữ liệu các trang hoàn toàn mới (hoặc cập nhật) trên trang website thay vì thu thập dữ liệu các phiên bản dành cho máy tính để bàn và thiết bị di động của cùng một trang.
Một lý do khác để dùng là liên kết tự nhiên chất lượng. Một trong những cách Google nắm rõ ràng chất lượng của một liên kết là thông qua số lượng lượng truy cập và phần trăm nhấp. Vì lẽ đó, nếu nhưtrang web của bạn không có canonical link, lượng kết nốicó thể được phân chia giữa các URL riêng biệt cho dù về mặt kỹ thuật thì chúng cùng một trang web.
Trong trường hợp không tự mình xác định được link gốc. Google sẽ thay bạn coi xét và quyết định loại hoặc chọn đường linktuyệt vời nhất. Tất nhiên, dựa vào Google như thế không phải là một ý tưởng hay. Vì họ có thể chọn ngẫu nhiên 1 URL mà bạn không thật sự mong muốn nó sẽ trở thànhđường link gốc.
Nhiều ngườithắc mắc là Canonical URL có dễ thực hiện không? Sau đây 5 quy tắc vàng khi sử dụngCanonical link
Quy tắc 1: Dùng URL tuyệt đối
John Mueller của Google nói rằng cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=“canonical” . Thay vì vậy, bạn nên dùng cấu trúc sau:
. Trái ngược với cấu trúc này:
Quy tắc 2: Sử dụng chữ viết thường trong URL
Google thường coi các URL viết hoa và viết thường là hai linkkhông giống nhau. Tuy vậy, bạn nên sử dụng chữ viết thường trong URL trên máy chủ của mình, sau đấydùnglink viết thường cho Canonical Tag.
Quy tắc 3: Dùng đúng phiên bản miền HTTPS hay HTTP
Nếu bạn đã chuyển sang SSL. Hãy cam kết bạn không khai báo bất kỳ URL không phải SSL (tức là HTTP) nào trong việc sử dụng thẻ Canonical Tag. Làm như vậy về mặt lý thuyết dẫn đến nhầm lẫn và kết quả không ước muốn. Đối với secure domain, hãy cam kết bạn sử dụng phiên bản URL sau:
. Còn nếu như bạn không dùng HTTPS thì hãy sử dụng dạng URL này:
Quy tắc 4: Sử dụng Canonical Tag tự tham chiếu
John Mueller cho rằng mặc dù không không thể khôngnhưng Canonical tự tham chiếu vẫn là sự lựa chọn đáng cân nhắc. Vì nó giúp Google hiểu rõ bạn muốn index trang nào hoặc đường link sẽ có cấu trúc như thế nào khi được index. Về căn bản, tự tham chiếu là Canonical trên một trang mà trỏ link đến chính nó.
Ví dụ, nếu như URL là https://example.com/sample-page, thì Canonical tự tham chiếu trên trang đó sẽ là:
. Hầu hết các CMS phổ biến hiện đại đều tự động thêm các URL tự tham chiếu. Còn với CMS tùy chỉnh, bạn nhờ đến các nhà phát triểnwebsite hardcode nó.
Quy tắc 5: Dùng 1 Canonical Tag cho mỗi trang
Nếu như 1 trang có nhiều hơn 1 Canonical Tag, Google sẽ bỏ qua cả thảy. Vì lẽ đó, mỗi trang chỉ nên sử dụng 1 thẻ thôi bạn nhé!
Cách triển khai: Có năm cách để chỉ định link gốc với các tín hiệu chuẩn hóa sau:
HTML tag
HTTP header
Sitemap
301 redirect*
liên kết nội bộ (Internal links)
Cách thiết lập thẻ Canonical
– Dùng thẻ HTML rel = “canonical”
Sử dụng thẻ rel = canonical là cách dễ dàng và rõ ràng nhất để chỉ định link gốc. Cách thực hiện vô cùng đơn giản: chỉ phải thêm mã sau vào phần
của bất kỳ trang trùng lặp nào:
Ví dụ: Giả sử bạn có hai phiên bản của cùng một trang, mỗi phiên bản có chính xác – 100% – cùng một thông tin. Sự khác biệtđộc nhất là chúng nằm trong các phần riêng biệt trên trang website của bạn và vì lẽ đó màu nền và mục menucông việc là không giống nhau – đó là nó. Cả hai phiên bản đã được liên kết được biết đến từ các trang web khác, do đó bản thân nội dungrõ ràng có thành quả. Vì thế, phiên bản nào công cụ tìm kiếm nên hiển thị trong kết quả?
Ví dụ: đây có thể là các URL của họ:
https://example.com/wordpress/seo-plugin/
https://example.com/wordpress/plugins/seo/
Đây chính là những gì rel=canonical được phát minh ra và thật không may, điều nàyxảy ra khá thường xuyên, nhất là trong rất nhiều hệ thốngthương mại và điện tử. Một hàng hóa có thể có một vài URL không giống nhautùy thuộc theo cách bạn đến đấy. Trong trường hợp này, bạn sẽ áp dụng rel=canonical như sau:
Chọn một trong hai trang của bạn làm phiên bản gốc tắc. Đây phải là phiên bản bạn tưởng tượng là quan trọng nhất. Nếu bạnmiễn nhiễm, hãy chọn liên kết hoặc người truy cập nhiều nhất và nếu nhưtất cả những thứ khác đều bằng nhau, hãy lật một đồng xu. Bạn chỉ phải chọn.
Thêm một liên kết rel = canonical từ trang không chính tắc vào trang chính tắc. Vì thế, nếu như chúng tôi chọn URL ngắn nhất làm URL chuẩn, URL khác sẽ kết nối đến URL ngắn nhất trong phần
– Thiết lập Canonical Tag trong WordPress
Trước hết, thiết lập Yoast seo để Canonical tự tham chiếu sẽ được thêm tự động vào trang. Để thêm các mục tùy chỉnh cho thẻ, nhấp chọn phần “Nâng cao” trên mỗi bài post hoặc trang.
Bạn đang tham khảo bài viết tại chuyên mục: KIẾN THỨC MARKETING. Click vào đây nếu muốn xem thêm nhiều bài viết tương tự nhé.
Những chú ý khi sử dụng Canonical URL
Không nêndùng Canonical URL bừa bãi, chỉ nên dùng khi 2 hoặc nhiều trang có chứa những thông tin trùng lặp. Nếunội dung trùng lặp ít bạn cũng không đượcThông báo vì sẽ làm phung phínguồn tiềm lực và không cóhiệu quả, công dụng đối với việc tổ chức hệ thốngtrang web của bạn.
Khi mà bạn thông báo URL chuẩn thì không có nghĩa là công cụ tìm kiếm sẽ dùng URL chuẩn đó. Các công cụ tìm kiếm vẫn sẽ sử dụng đến những thuật toán của mình để đưa rõ ra kết luận về một URL chuẩn cho web của bạn.
Một vài trường hợp quan trọng bạn nên sử dụngchuyển hướng Redirect thay vì sử dụng Canonical URL để mang đến hiệu quảthực hiện công việc cao cho web và không gây nhầm lẫn cho người dùng. Điều hướng 301 sẽ tự động chuyển người dùng từ một trang này sang trang còn lại và cùng lúc đóthông cáo cho trang đó rằng URL đã biến mất ở đây nữa, đã chuyển sang một URL mới. Lúc này công cụ tìm kiếm sẽ dừng việc URL cũ và chuyển phương hướng sang URL mới nhanh hơn.
Đúc Kết
Vậy là mình đã hướng dẫn xong cách dùng thẻ Canonical trong SEO website. Với những thông tin liên quan đến Canonical URL mà các SEOer cần biết cũng như các công dụng và lưu ý khi sử dụng nó. Hy vọng bài viết đã mang đến cho các bạn những thông tin hữu ích, giúp các bạn có cái nhìn cụ thể hơn về thuật ngữ Canonical URL và vận dụng nó vào website của mình hiệu quả nhất.
Và nếu bạn vẫn chưa biết nên tìm đến nơi nào có thểthêm thông tin về content,SEO, kiến thức kinh doanh… đầy đủ và nhất, hãy bắt đầu theo dõi Nghề content để biết thêm nhé.
ContentsThẻ Canonical URL là gì?Tác dụng của thẻ Canonical trong SEO website?Hướng dẫn nhanh cách dùng thẻ CanonicalQuy tắc khi sử dụng Canonical TagQuy tắc 1: Dùng URL tuyệt đốiQuy tắc 2: Sử dụng chữ viết thường trong
ContentsThẻ Canonical URL là gì?Tác dụng của thẻ Canonical trong SEO website?Hướng dẫn nhanh cách dùng thẻ CanonicalQuy tắc khi sử dụng Canonical TagQuy tắc 1: Dùng URL tuyệt đốiQuy tắc 2: Sử dụng chữ viết thường trong
ContentsThẻ Canonical URL là gì?Tác dụng của thẻ Canonical trong SEO website?Hướng dẫn nhanh cách dùng thẻ CanonicalQuy tắc khi sử dụng Canonical TagQuy tắc 1: Dùng URL tuyệt đốiQuy tắc 2: Sử dụng chữ viết thường trong
ContentsThẻ Canonical URL là gì?Tác dụng của thẻ Canonical trong SEO website?Hướng dẫn nhanh cách dùng thẻ CanonicalQuy tắc khi sử dụng Canonical TagQuy tắc 1: Dùng URL tuyệt đốiQuy tắc 2: Sử dụng chữ viết thường trong