Duplicate Content Là Gì

Tôi chắc rằng ngay lúc này, tại đây bạn có thắc mắc rất lớn so với cụm tự “Duplicate Content!?”. Nó thật sự là vấn đề không chỉ riêng người siêng về Content, Marketing, SEOer,… mới quan tâm. Mà lại nó là một trong những đề tài của phần nhiều người, mọi ngành nghề giả dụ đang sở hữu hoặc thao tác làm việc trên website.

Bạn đang xem: Duplicate content là gì

Bạn đang quá do dự khi nghe một ai đó đề cập về Duplicate content là gì chưa, như:

Nội dung bị Duplicate content sẽ 100% khiến hại cho website, rất có thể bị Google phạt.Hay, Duplicate nội dung thật sự không ảnh hưởng xấu cho website, không cần để ý quá nhiều.

Tuy nhiên, đây new thật sự là thắc mắc của người sử dụng về Duplicate Content:

Duplicate nội dung là gì?Duplicate nội dung thật sự là vấn đề gì về nội dung?Nếu Duplicate Content ảnh hưởng xấu mang lại website thì biện pháp xử lý như thế nào?Đặc biệt hơn, cách nào nhằm phát hiện nay trùng lặp văn bản và cách kiểm tra Duplicate nội dung trên website?

Tôi cũng từng như các bạn và hiểu bạn phải gì. Đó là lý do tôi giữ hộ đến chúng ta nội dung lí giải sau. Đây giải mã cho tất cả câu hỏi của bạn về Duplicate content và rộng thế.

Tìm phát âm ngày nào!


Duplicate nội dung là gì?

Hiểu theo nghĩa nhỏ bé thì Duplicate Content chính là những câu chữ trên một hoặc những website không giống nhau nhưng lại tựa như hoặc trọn vẹn giống nhau. Hiểu theo nghĩa rộng hơn vậy thì Duplicate content là gì? Nó là nội dung mang đến ít hoặc không tồn tại giá trị so với khách truy hỏi cập. Vì thế, các trang bao gồm ít hoặc không tồn tại nội dung bổ ích cũng được xem như là Duplicate Content.


*
Robot cơ chế tìm kiếm gặp khó khăn cùng với Duplicate Content

Tại sao Duplicate Content bất lợi cho SEO?

Duplicate Content rất có thể làm tác động xấu đến SEO vì hai nguyên nhân dưới đây:

Khi có không ít phiên bản nội dung thì rất cực nhọc để cơ chế tìm kiếm xác minh được bắt buộc index phiên bạn dạng nào. Cũng tương tự hiển thị phiên phiên bản nào vào trang kết quả. Điều này làm giảm năng suất của tất cả các phiên phiên bản nội dung vị chúng đang tuyên chiến đối đầu lẫn nhau.Các chế độ tìm kiếm sẽ chạm mặt khó khăn lúc hợp duy nhất số liệu liên kết. Ví dụ như mức độ liên quan, nút độ ảnh hưởng và nấc độ tin cẩn cho nội dung. Đặc biệt là khi các website khác liên kết với nhiều phiên bản nội dung đó.

Google tất cả phạt Duplicate nội dung không?

Duplicate Content sẽ gây tác động xấu đến công suất SEO của trang web của bạn. Nhưng nó đã không khiến cho website của người tiêu dùng bị Google phạt nếu khách hàng không cố gắng tình sao chép nội dung của các website khác.

Nếu bạn sử dụng một vài kỹ thuật trong website của bản thân mình nhưng không cố ý lừa Google thì ko cần băn khoăn lo lắng về bài toán bị Google phạt.

Nếu bạn đã xào luộc một lượng khủng nội dung website khác. Thì chắc hẳn rằng bạn vẫn đứng nghỉ ngơi ranh giới mỏng manh. Vì Google đã từng lên giờ đồng hồ về vấn đề Duplicate nội dung như sau:

“Duplicate nội dung trên một website không hẳn là đại lý để áp dụng hình phạt. Google chỉ phạt lúc website thực hiện Duplicate content để tiến công lừa cùng thao túng công dụng của công cụ tìm kiếm.

Nếu website của công ty đang chạm mặt vấn đề về Duplicate content và bạn không theo đúng các khuyến cáo của Google. Thì chúng tôi sẽ sàng lọc phiên phiên bản nội dung cực tốt để hiển thị trong hiệu quả tìm kiếm”

15 nguyên nhân phổ biến chuyển dẫn cho Duplicate content và phương pháp khắc phục

Có tương đối nhiều nguyên nhân dẫn mang đến lỗi Technical SEO – Duplicate Content. Tuy nhiên, tôi đã tổng hòa hợp lại 15 nguyên nhân thường chạm mặt dẫn đến vụ việc này và phương pháp để giải quyết chúng.

1. Faceted/Filtered Navigation

Faceted Navigation – Hay còn được gọi là điều hướng nhiều chiều. Là nơi mà bạn dùng có thể lọc và sắp tới xếp các mục bên trên trang. Những website dịch vụ thương mại điện tử thường thực hiện nó hết sức nhiều.

Loại điều phối này gắn các tham số vào thời điểm cuối URL. Ví dụ:


*
Điều hướng bao gồm tham số cuối URL

Bởi vì thường có nhiều sự phối kết hợp của những bộ lọc. Điều hướng nhiều chiều dẫn mang đến Duplicate content hoặc sát trùng lặp.

Cùng lưu ý 2 ví dụ dưới đây để nắm rõ hơn về nguyên nhân này nhé:

bbclothing.co.uk/en-gb/clothing/shirts.html?new_style=Checkedbbclothing.co.uk/en-gb/clothing/shirts.html?Size=S&new_style=Checked

Các URL này là duy nhất, nhưng văn bản lại ngay sát như tương đồng nhau.

Ngoài ra, thứ tự của các tham số hay không quan tiền trọng. Ví dụ: chúng ta có thể truy cập cùng một trang lúc sử dụng 1 trong các 2 URL sau:

bbclothing.co.uk/en-gb/clothing/shirts.html?new_style=Checked&Size=XLbbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&new_style=Checked

Cách sửa chữa:

Faceted navigation là một vấn đề rất phức tạp. Nếu khách hàng nghi ngờ đây đó là nguyên nhân dẫn đến Duplicate Content. Hãy quyết định xem bạn muốn Google index đông đảo trang nào. Sau đó, hãy tăng số lượng trang có ích được index và loại bỏ những trang không cần thiết.

2. Tracking Parameters

Các URL được tham số hóa cũng khá được sử dụng nhằm theo dõi. Ví dụ, ta có thể sử dụng thông số UMT để theo dõi lượng truy vấn trong phần chiến dịch bản tin của Google Analytics:

Ví dụ: example.com/page?utm_source=newsletter

Cách sửa chữa:

Chuẩn hóa những URL được thông số hóa của doanh nghiệp để gồm được các phiên bạn dạng thân thiện với SEO nhưng không cần có các thông số kỹ thuật theo dõi.

3. Session IDs

Session IDs lưu giữ trữ thông tin về khách truy cập vào website. Chúng thường nối một chuỗi nhiều năm vào URL như sau:

Ví dụ: example.com?sessionId=jow8082345hnfn9234

Cách khắc phục:

Chuẩn hóa những URL để có được các phiên bản thân thiện cùng với SEO.

4. HTTPS cùng với HTTP cùng non-www cùng với www

Bạn hoàn toàn có thể truy cập vào trang web bằng 1 trong 4 trở nên thể dưới đây:

https://www.example.com (HTTPS, www)https://example.com (HTTPS, non-www)http://www.example.com (HTTP, www)http://example.com (HTTP, non-www)

Phiên bản sử dụng HTTPS chính là hai URL đầu tiên. Mặc dù là dùng phiên bạn dạng có www hay là không có www thì chúng ta vẫn có thể truy cập website được.

Xem thêm: Xác Định Loại Tóc Thế Nào Là Mỏng, Mật Độ Tóc,, Phân Biệt Tóc Dày, Tóc Mỏng Mật Độ Tóc,

Tuy nhiên, nếu bạn không cấu hình chính xác sản phẩm công nghệ chủ. Thì website của bạn sẽ có thể được truy vấn bằng những đổi mới thể này. Điều này thực thụ không tốt và có thể dẫn đến sự việc Duplicate Content.

Cách sửa chữa:

Sử dụng chuyển làn đường để bảo đảm website của khách hàng chỉ rất có thể được truy cập bằng một phiên phiên bản duy nhất.

5. URL rõ ràng chữ hoa chữ thường

URL phân minh chữ hoa chữ hay nghĩa là 3 URL dưới đây đều không giống nhau:

example.com/pageexample.com/PAGEexample.com/pAgE

Cách sửa chữa:

Nhất quán với những liên kết nội cỗ (nghĩa là không liên kết nội bộ với rất nhiều phiên bản URL). Nếu biện pháp này không giải quyết và xử lý được vụ việc Duplicate nội dung là gì nữa, thì hoàn toàn có thể thử chuẩn chỉnh hóa hoặc đưa hướng.

6. Dấu gạch chéo cánh theo sau so với lốt gạch chéo cánh không theo sau

Google ko xem xét mang đến vấn đề các URL có hay không có dấu gạch chéo cánh theo sau. Điều đó tức là Google coi 2 URL tiếp sau đây như một:

example.com/page/example.com/page

Nếu câu chữ của bạn có thể được truy vấn bằng cả nhì URL thì đang dẫn mang lại lỗi Duplicate Content. Để kiểm tra Duplicate nội dung xem đây có phải sự gắng hay không, hãy thử sử dụng cả URL tất cả và không có dấu gạch chéo cánh theo sau.

Ví dụ: ví như bạn nỗ lực tải bài đăng của bản thân bằng URL không tồn tại dấu gạch ốp chéo, nó đang chuyển hướng đến URL có dấu gạch chéo.

Cách sửa chữa:

Chuyển phía phiên bản không mong mỏi muốn. Ví dụ: không tồn tại dấu gạch chéo theo sau, thanh lịch phiên phiên bản mong mong (ví dụ: gồm dấu gạch chéo cánh theo sau). Các bạn cũng nên bảo đảm an toàn luôn luôn đồng điệu các link nội bộ. Hãy chọn 1 phiên bản duy nhất cùng sử dụng xuyên suốt cho toàn bộ các URL.

7. URL gần gũi với bản in

URL thân thiết với bản in bao gồm nội dung như là như phiên bản gốc. Cùng nó đơn giản chỉ là 1 trong những URL khác nhưng mà thôi.

example.com/pageexample.com/print/page

Cách sửa chữa:

Chuẩn hóa các phiên bạn dạng thân thiện thành phiên bản bản gốc.

8. URL thân thiết với trang bị di động

Tương từ như các URL thân thiết với phiên bản in thì các URL thân mật với thiết bị di động cũng là trùng lặp.

Ví dụ:

example.com/pagem.example.com/page

Cách sửa chữa:

Chuẩn hóa phiên bản thân thiện cùng với thiết bị di động thành phiên phiên bản gốc. áp dụng rel=“alternate” để cảnh báo Google rằng URL thân thiết với thiết bị di động cầm tay là phiên phiên bản thay núm cho phiên phiên bản nội dung trên máy tính để bàn.

9. URL AMP

Các trang thiết bị di động cầm tay được tăng tốc độ (AMP) cũng là các phiên bản trùng lặp.

Ví dụ:

example.com/pageexample.com/amp/page

Cách tự khắc phục:

Chuẩn hóa phiên phiên bản AMP thành phiên bản không sử dụng AMP. áp dụng rel=”amphtml” để thông báo với Google rằng những URL AMP là phiên phiên bản thay thế cho những nội dung không cất AMP.

Nếu các bạn chỉ có nội dung AMP, hãy sử dụng thẻ canonical từ bỏ tham chiếu (self-referencing canonical tag).

Nếu chưa biết thẻ Canonical là gì, bạn có thể xem bài xích viết: Thẻ Canonical là gì? 7 sai lạc sử dụng thẻ Canonical Tag trong SEO

10. Tag cùng Category Pages

Hầu hết các CMS (Hệ quản ngại trị nội dung) phần nhiều tạo các trang có những thẻ chuyên dụng khi bạn áp dụng thẻ.

Ví dụ: nếu bạn có một nội dung bài viết về Whey Protein hữu cơ. Và ai đang sử dụng cả 2 cụm từ bỏ “bột protein” và “whey” làm thẻ thì các bạn sẽ kết thúc với hai trang thẻ như sau:

https://www.calton Nutrition.com/tag/whey/https://www.calton Nutrition.com/tag/protein-powder/

Điều này chưa hẳn lúc nào cũng dẫn đến Duplicate nội dung nhưng thỉnh thoảng nó cũng gây nên vấn đề này.

Trường hợp dưới đây, chỉ bao gồm một trang bên trên website bao gồm hai thẻ – vì vậy từng trang đều hệt nhau nhau.