Hướng dẫn cho người mới bắt đầu để ngăn chặn việc tạo nội dung blog trong WordPress

Nội dung bài viết

Bạn đang tìm kiếm một cách để ngăn những kẻ gửi thư rác và kẻ lừa đảo ăn cắp nội dung blog WordPress của bạn bằng cách sử dụng trình thu thập nội dung?

Chủ sở hữu trang web rất khó chịu khi thấy ai đó ăn cắp nội dung của bạn mà không được phép, kiếm tiền từ nội dung đó, nâng thứ hạng của bạn trên Google và đánh cắp khán giả của bạn.

Trong bài viết này, chúng tôi sẽ đề cập đến việc cạo nội dung blog là gì, cách bạn có thể giảm và ngăn chặn việc cắt nội dung và thậm chí cả cách tận dụng nội dung cóp nhặt vì lợi ích của riêng bạn.

How to Prevent Content Scraping in WordPress

Nội dung Blog Scraping là gì?

Nội dung blog cóp nhặt là khi nội dung được lấy từ nhiều nguồn và được đăng lại trên một trang khác. Thông thường, điều này được thực hiện tự động thông qua nguồn cấp dữ liệu RSS trên blog của bạn.

Giờ đây, việc thu thập nội dung trở nên dễ dàng đến mức bất kỳ ai cũng có thể bắt đầu một trang web WordPress , đặt một chủ đề thương mại hoặc miễn phí và cài đặt một vài plugin sẽ đi và trích xuất nội dung từ các blog đã chọn.

Tại sao Kẻ lừa đảo nội dung lại ăn cắp nội dung của tôi?

Một số người dùng của chúng tôi đã hỏi chúng tôi tại sao họ ăn cắp nội dung của tôi? Câu trả lời đơn giản là vì bạn TUYỆT VỜI. Sự thật là những người tìm kiếm nội dung này có động cơ thầm kín. Dưới đây chỉ là một số lý do tại sao ai đó lại loại bỏ nội dung của bạn:

  • Hoa hồng liên kết – Có một số nhà tiếp thị liên kết bẩn ngoài kia chỉ muốn khai thác hệ thống để kiếm thêm vài đô la. Họ sẽ sử dụng nội dung của bạn và nội dung của người khác để mang lại lưu lượng truy cập vào trang web của họ thông qua công cụ tìm kiếm. Các trang web này thường được nhắm mục tiêu đến một thị trường ngách cụ thể, vì vậy chúng có các sản phẩm liên quan mà chúng đang quảng cáo.
  • Tạo khách hàng tiềm năng – Chúng ta thường thấy các luật sư và nhà môi giới làm việc này. Họ muốn trở thành những người dẫn đầu ngành trong cộng đồng nhỏ của họ. Họ không có băng thông để sản xuất nội dung chất lượng, vì vậy họ đi tìm nội dung từ các nguồn khác. Đôi khi, họ thậm chí không nhận thức được điều này vì họ đang trả một số tiền 30 đô la / tháng để thêm nội dung và giúp họ SEO tốt hơn. Chúng tôi đã gặp khá nhiều trong số này trong quá khứ.
  • Doanh thu từ quảng cáo – Một số người chỉ muốn tạo ra một “trung tâm” kiến thức. Một cửa hàng tổng hợp cho người dùng trong một thị trường ngách cụ thể. Thông thường, chúng tôi nhận thấy rằng nội dung trang web của chúng tôi đang bị loại bỏ. Người quét luôn trả lời, tôi làm điều này vì lợi ích của cộng đồng. Ngoại trừ trang web được dán đầy quảng cáo.

Đây chỉ là một vài lý do tại sao ai đó sẽ lấy cắp nội dung của bạn.

Làm thế nào để nắm bắt nội dung Scrapers?

Bắt những người tìm kiếm nội dung là một công việc tẻ nhạt và có thể mất rất nhiều thời gian. Dưới đây là một số cách mà bạn có thể bắt được những kẻ phá hoại nội dung.

Tìm kiếm trên Google với Tiêu đề bài đăng của bạn

Yup, điều đó thật đau đớn. Phương pháp này có lẽ không có giá trị đặc biệt nếu bạn đang viết về một chủ đề rất phổ biến.

Theo dõi lại

Nếu bạn thêm các liên kết nội bộ trong bài viết của bạn, bạn sẽ thấy một trackback nếu một trang web đánh cắp nội dung của bạn. Bằng cách này, khá nhiều người cắt ghép cho bạn biết rằng họ đang cắt nội dung của bạn.

Nếu bạn đang sử dụng Akismet, thì rất nhiều trackbacks này sẽ hiển thị trong thư mục SPAM. Một lần nữa, điều này sẽ chỉ hoạt động nếu bạn có liên kết nội bộ trong bài đăng của mình.

Ahrefs

Nếu bạn có quyền truy cập vào một công cụ SEO như Ahrefs , bạn có thể theo dõi các liên kết ngược của mình và để ý nội dung bị đánh cắp.

Làm thế nào để đối phó với nội dung Scrapers

Có một vài cách tiếp cận mà mọi người áp dụng khi đối phó với những người sửa nội dung: cách tiếp cận Không làm gì, Cách tiếp cận Hạ gục hoặc Tận dụng lợi thế của chúng.

Chúng ta hãy xem xét từng cái.

Phương pháp tiếp cận không làm gì cả

Đây là cách tiếp cận dễ dàng nhất mà bạn có thể thực hiện. Thông thường, các blogger nổi tiếng nhất sẽ đề xuất điều này bởi vì phải mất RẤT NHIỀU thời gian để chống lại những kẻ phá hoại.

Bây giờ rõ ràng nếu đó là một blog nổi tiếng như Smashing Magazine, CSS-Tricks, Problogger hoặc những blog khác, thì họ không phải lo lắng về điều đó. Chúng là những trang có thẩm quyền trong mắt Google.

Tuy nhiên, chúng tôi biết một số trang web tốt đã bị gắn cờ là công cụ tìm kiếm vì Google cho rằng công cụ tìm kiếm của họ là nội dung gốc. Vì vậy, cách tiếp cận này không phải lúc nào cũng tốt nhất theo quan điểm của chúng tôi.

Giảm phương pháp tiếp cận

Điều này hoàn toàn ngược lại với phương pháp “Không làm gì cả”. Trong cách tiếp cận này, bạn chỉ cần liên hệ với người quét và yêu cầu họ gỡ nội dung xuống.

Nếu họ từ chối làm như vậy hoặc đơn giản là không trả lời yêu cầu của bạn, thì bạn phải nộp DMCA (Đạo luật bản quyền kỹ thuật số thiên niên kỷ) cho máy chủ của họ.

Theo kinh nghiệm của chúng tôi, hầu hết các trang web cạo không có sẵn một biểu mẫu liên hệ. Nếu họ có, thì hãy sử dụng nó. Nếu họ không có biểu mẫu liên hệ, thì bạn cần phải thực hiện Tra cứu Whois.

Whois Lookup

Bạn có thể xem thông tin liên hệ trên địa chỉ liên hệ quản trị. Thông thường liên hệ hành chính và kỹ thuật là như nhau.

Nó cũng sẽ hiển thị công ty đăng ký tên miền. Hầu hết các công ty lưu trữ web nổi tiếng và công ty đăng ký tên miền đều có email hoặc biểu mẫu DMCA. Bạn có thể thấy rằng người cụ thể này sử dụng HostGator vì máy chủ định danh của họ. HostGator có một biểu mẫu cho các khiếu nại DMCA .

Nếu máy chủ định danh giống như ns1.theirdomain.com, thì bạn phải tìm hiểu sâu hơn bằng cách thực hiện tra cứu IP ngược và tìm kiếm IP.

Bạn cũng có thể sử dụng dịch vụ của bên thứ ba cho DMCA.com để gỡ xuống.

Jeff Starr trong bài viết của mình gợi ý rằng bạn nên chặn IP của kẻ xấu. Truy cập nhật ký của bạn để biết địa chỉ IP của chúng, sau đó chặn nó bằng một thứ gì đó như thế này trong tệp .htaccess gốc của bạn:

Deny from 123.456.789

Bạn cũng có thể chuyển hướng chúng đến một nguồn cấp dữ liệu giả bằng cách làm như sau:

RewriteCond %{REMOTE_ADDR} 123.456.789.
RewriteRule .* http://dummyfeed.com/feed [R,L]

Bạn có thể thực sự sáng tạo ở đây như Jeff gợi ý. Gửi chúng đến các nguồn cấp dữ liệu văn bản thực sự lớn đầy đủ với Lorem Ipsum. Bạn có thể gửi cho họ một số hình ảnh kinh tởm về những điều tồi tệ. Bạn cũng có thể gửi chúng trở lại máy chủ của chính chúng, gây ra một vòng lặp vô hạn sẽ làm hỏng trang web của chúng.

Cách tiếp cận cuối cùng mà chúng tôi thực hiện là tận dụng chúng.

Cách tận dụng nội dung Scrapers

Đây là cách tiếp cận của chúng tôi để đối phó với những người sửa nội dung, và nó hóa ra khá tốt. Nó giúp ích cho SEO của chúng tôi cũng như giúp chúng tôi kiếm thêm tiền.

Phần lớn những kẻ lừa đảo sử dụng Nguồn cấp dữ liệu RSS của bạn để lấy cắp nội dung của bạn. Vì vậy, đây là một số điều bạn có thể làm:

  • Liên kết nội bộ – Bạn cần liên kết các bài đăng trên blog của mình rất nhiều. Khi bạn có liên kết nội bộ trong bài viết của mình, nó sẽ giúp bạn tăng số lần xem trang và giảm tỷ lệ thoát trên trang web của chính bạn . Thứ hai, nó giúp bạn có được các liên kết ngược từ những người đang ăn cắp nội dung của bạn. Cuối cùng, nó cho phép bạn đánh cắp khán giả của họ. Nếu bạn là một blogger tài năng, thì bạn hiểu nghệ thuật liên kết nội bộ. Bạn phải đặt các liên kết của mình trên các từ khóa thú vị. Làm cho nó hấp dẫn cho người dùng nhấp vào nó. Nếu bạn làm điều đó, thì khán giả của người quét cũng sẽ nhấp vào nó. Cứ như vậy, bạn đã lấy được một khách truy cập từ trang web của họ và đưa họ trở lại nơi đáng lẽ họ phải ở nơi đầu tiên.
  • Tự động liên kết từ khóa với liên kết liên kết – Có một số plugin như ThirstyAffiliates sẽ tự động thay thế các từ khóa được chỉ định bằng các liên kết liên kết,
  • Sáng tạo với RSS Footer – Bạn có thể sử dụng Plugin SEO tất cả trong một để thêm các mục tùy chỉnh vào RSS Footer của mình. Bạn có thể thêm bất cứ thứ gì bạn muốn ở đây. Chúng tôi biết một số người thích quảng bá sản phẩm của chính họ cho người đọc RSS của họ. Vì vậy, họ sẽ thêm các biểu ngữ. Đoán xem, bây giờ những biểu ngữ đó cũng sẽ xuất hiện trên trang web của người cạo này. Trong trường hợp của chúng tôi, chúng tôi luôn thêm một chút tuyên bố từ chối trách nhiệm ở cuối bài viết trong nguồn cấp dữ liệu RSS của chúng tôi. Bằng cách làm này, chúng tôi nhận được một liên kết ngược đến bài viết gốc từ trang web của người quét, cho phép Google và các công cụ tìm kiếm khác biết chúng tôi là người có thẩm quyền. Nó cũng cho người dùng của họ biết rằng trang web đang ăn cắp nội dung của chúng tôi ..

Xem hướng dẫn của chúng tôi về cách kiểm soát chân trang nguồn cấp dữ liệu RSS của bạn trong WordPress để biết thêm mẹo và ý tưởng.

Làm thế nào bạn có thể giảm thiểu và ngăn chặn việc tạo blog WordPress

Xem xét nếu bạn thực hiện phương pháp tiếp cận của chúng tôi với nhiều liên kết nội bộ, thêm liên kết liên kết, biểu ngữ RSS và những cơ hội như vậy là bạn sẽ giảm việc cắt nội dung xuống mức tốt. Nếu bạn thực hiện gợi ý của Jeff Starr về việc chuyển hướng các trình tìm kiếm nội dung, thì điều đó cũng sẽ ngăn chặn những trình thu thập nội dung đó. Ngoài những gì chúng tôi đã chia sẻ ở trên, có một số thủ thuật khác mà bạn có thể sử dụng.

Nguồn cấp dữ liệu RSS tóm tắt so với đầy đủ

Đã có một cuộc tranh luận trong cộng đồng blog về việc nên có nguồn cấp dữ liệu RSS đầy đủ hay nguồn cấp dữ liệu RSS tóm tắt. Chúng tôi sẽ không đi sâu vào chi tiết về cuộc tranh luận đó, tuy nhiên một trong những NGUYÊN NHÂN của việc có nguồn cấp dữ liệu RSS Chỉ Tóm tắt là bạn ngăn chặn việc cắt nội dung.

Bạn có thể thay đổi cài đặt bằng cách đi tới bảng quản trị WordPress của mình và đi tới Cài đặt »Đọc . Sau đó, thay đổi cài đặt Đối với mỗi bài viết trong một chương trình nguồn cấp dữ liệu: Tóm tắt.

Theo dõi lại SPAM

Trackbacks và Pingbacks chắc chắn có những công dụng tuyệt vời, tuy nhiên, chúng hiện đang liên tục bị lạm dụng.

Thông thường, các chủ đề hiển thị trackback và pingback bên dưới hoặc trong số các bình luận. Điều này tạo động lực cho kẻ gửi thư rác để loại bỏ trang web của bạn và gửi các bản theo dõi. Nếu bạn phê duyệt nhầm, thì họ sẽ nhận được một liên kết ngược và đề cập từ trang web của bạn. Đây là cách bạn có thể tắt Trackbacks trên tất cả các bài đăng trong tương lai .

Đây là một bài viết sẽ chỉ cho bạn cách vô hiệu hóa trackback và ping trên các bài đăng WordPress hiện có .

Nội dung có bao giờ tốt?

Nó có thể. Nếu bạn thấy rằng bạn đang kiếm tiền từ trang web của người quét, thì hãy chắc chắn rằng nó có thể được. Nếu bạn thấy nhiều lưu lượng truy cập từ trang web của người quét, thì có thể là như vậy.

Tuy nhiên, trong hầu hết các trường hợp, nó không phải như vậy. Bạn nên luôn cố gắng làm cho nội dung của bạn được phát huy. Nhưng bạn sẽ nhận ra khi blog của bạn ngày càng lớn hơn, hầu như không thể theo dõi tất cả các công cụ tìm kiếm nội dung. Chúng tôi vẫn gửi khiếu nại DMCA, tuy nhiên, chúng tôi biết rằng có rất nhiều trang web khác đang ăn cắp nội dung của chúng tôi mà chúng tôi không thể theo kịp.

Chúng tôi hy vọng bài viết này đã giúp bạn ngăn chặn việc cắt nội dung blog trong WordPress. Bạn cũng có thể muốn xem hướng dẫn của chúng tôi về cách chống trộm hình ảnh trong WordPress .

Nếu bạn thích bài viết này, vui lòng đăng ký Kênh YouTube của chúng tôi để xem các video hướng dẫn về WordPress. Bạn cũng có thể tìm thấy chúng tôi trên TwitterFacebook .

Chia sẻ để ủng hộ ad nhé
Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
0 0 Đánh giá
Xếp hạng bài viết
Đăng ký
Thông báo về
guest
0 Bình luận
Phản hồi nội tuyến
Xem tất cả bình luận
0
Để lại ý kiến của bạnx
()
x
error: Cảnh báo: Không có quyền !!