Cách ngăn các công cụ tìm kiếm thu thập thông tin trang web WordPress

Nội dung bài viết

Gần đây, một trong những người dùng của chúng tôi đã hỏi chúng tôi về cách họ có thể ngăn các công cụ tìm kiếm thu thập dữ liệu và lập chỉ mục trang web WordPress của họ? Có nhiều tình huống khi bạn muốn ngăn các công cụ tìm kiếm thu thập dữ liệu trang web của bạn hoặc liệt kê nó trong kết quả tìm kiếm. Trong bài viết này, chúng tôi sẽ hướng dẫn bạn cách ngăn các công cụ tìm kiếm thu thập dữ liệu trang web WordPress.

Stop search engines from crawling your WordPress site

Tại sao và Ai muốn Ngừng Công cụ Tìm kiếm

Đối với hầu hết các trang web, công cụ tìm kiếm là nguồn lưu lượng truy cập lớn nhất. Bạn có thể hỏi, tại sao mọi người lại muốn chặn các công cụ tìm kiếm?

Khi bắt đầu, rất nhiều người không biết làm thế nào để tạo ra một môi trường phát triển cục bộ hoặc một trang web dàn dựng . Nếu bạn đang phát triển trang web của mình trực tiếp trên một tên miền có thể truy cập công khai, thì bạn có thể không muốn Google lập chỉ mục trang chế độ đang xây dựng hoặc bảo trì của bạn.

Cũng có nhiều người sử dụng WordPress để tạo blog riêng tư và họ không muốn những blog đó được lập chỉ mục trong kết quả tìm kiếm vì chúng ở chế độ riêng tư.

Ngoài ra, một số người sử dụng WordPress để quản lý dự án hoặc mạng nội bộ và bạn sẽ không muốn các tài liệu nội bộ của mình có thể truy cập công khai.

Trong tất cả các tình huống trên, bạn có thể không muốn các công cụ tìm kiếm lập chỉ mục trang web của bạn.

Một quan niệm sai lầm phổ biến là nếu tôi không có các liên kết trỏ đến miền của mình, thì các công cụ tìm kiếm có thể sẽ không bao giờ tìm thấy trang web của tôi. Điều này không hoàn toàn đúng.

Có nhiều cách công cụ tìm kiếm có thể tìm thấy một trang web được liên kết ở nơi khác. Ví dụ:

  1. Tên miền của bạn trước đây có thể thuộc sở hữu của người khác và họ vẫn có một số liên kết trỏ đến trang web của bạn bây giờ.
  2. Một số kết quả của trang web tìm kiếm tên miền có thể được lập chỉ mục với liên kết của bạn trên đó.
  3. Có hàng nghìn trang chỉ với danh sách tên miền, trang web của bạn có thể xuất hiện trên một trong số đó.

Có rất nhiều thứ xảy ra trên web và hầu hết chúng không nằm trong tầm kiểm soát của bạn. Tuy nhiên, trang web của bạn vẫn nằm trong tầm kiểm soát của bạn và bạn có thể hướng dẫn các công cụ tìm kiếm không lập chỉ mục hoặc theo dõi trang web của bạn.

Video hướng dẫn

Đăng ký Thuthuatwordpress.net

Nếu bạn không thích video hoặc cần thêm hướng dẫn, thì hãy tiếp tục đọc.

Chặn các công cụ tìm kiếm thu thập thông tin và lập chỉ mục trang web WordPress của bạn

WordPress đi kèm với một tính năng tích hợp cho phép bạn hướng dẫn các công cụ tìm kiếm không lập chỉ mục trang web của bạn. Tất cả những gì bạn cần làm là truy cập Cài đặt »Đọc và chọn hộp bên cạnh tùy chọn Mức độ hiển thị của Công cụ Tìm kiếm.

Search engine visibility setting in WordPress

Khi hộp này được chọn, WordPress sẽ thêm dòng này vào tiêu đề trang web của bạn:

<meta name='robots' content='noindex,follow' />

WordPress cũng sửa đổi tệp robots.txt của trang web của bạn và thêm các dòng sau vào tệp đó:

User-agent: *
Disallow: /

Những dòng này yêu cầu rô bốt (trình thu thập dữ liệu web) không lập chỉ mục các trang của bạn. Tuy nhiên, việc chấp nhận yêu cầu này hay bỏ qua nó là hoàn toàn phụ thuộc vào các công cụ tìm kiếm. Mặc dù hầu hết các công cụ tìm kiếm tôn trọng điều này, một số trang hoặc hình ảnh ngẫu nhiên từ trang web của bạn có thể được lập chỉ mục.

Làm thế nào để đảm bảo trang web của bạn không xuất hiện trong kết quả tìm kiếm?

Cài đặt hiển thị mặc định của WordPress hướng dẫn các công cụ tìm kiếm không lập chỉ mục trang web của bạn. Tuy nhiên, các công cụ tìm kiếm vẫn có thể thu thập thông tin và lập chỉ mục một trang, tệp hoặc hình ảnh từ trang web của bạn.

Cách duy nhất để đảm bảo rằng các công cụ tìm kiếm không lập chỉ mục hoặc thu thập dữ liệu trang web của bạn là sử dụng mật khẩu bảo vệ toàn bộ trang web WordPress của bạn ở cấp độ máy chủ.

Điều này có nghĩa là khi bất kỳ ai cố gắng truy cập trang web của bạn, họ sẽ được yêu cầu cung cấp tên người dùng và mật khẩu ngay cả trước khi họ truy cập WordPress. Điều này bao gồm cả các công cụ tìm kiếm. Khi đăng nhập không thành công, chúng được hiển thị lỗi 401 và các bot sẽ bỏ đi. Đây là cách đặt mật khẩu bảo vệ toàn bộ trang WordPress.

Phương pháp 1: Bảo vệ bằng mật khẩu toàn bộ trang web bằng cPanel

Nếu nhà cung cấp dịch vụ lưu trữ WordPress của bạn cung cấp quyền truy cập cPanel để quản lý tài khoản lưu trữ của bạn, thì bạn có thể bảo vệ toàn bộ trang web của mình bằng cPanel. Tất cả những gì bạn phải làm là đăng nhập vào bảng điều khiển cPanel của mình và sau đó nhấp vào biểu tượng ‘Thư mục Bảo vệ Mật khẩu’ trong phần ‘Bảo mật’.

Password protect directories

Tiếp theo, bạn sẽ cần chọn thư mục mà bạn đã cài đặt WordPress. Thông thường, nó là thư mục public_html.

Select the root folder

Nếu bạn có nhiều trang web WordPress được cài đặt trong thư mục public_html, thì bạn cần nhấp vào biểu tượng thư mục để duyệt và chọn thư mục cho trang web bạn muốn bảo vệ bằng mật khẩu.

Trên màn hình tiếp theo, bạn cần nhập tên cho thư mục được bảo vệ và nhấp vào nút ‘Lưu’.

Enter a name for protected directory

Thông tin của bạn sẽ được lưu và cPanel sẽ tải lại trang. Sau đó, bạn cần thêm người dùng được ủy quyền bằng cách nhập tên người dùng và mật khẩu.

Add authorized user

Vậy là xong, bạn đã thêm thành công mật khẩu bảo vệ vào trang WordPress của mình.

Bây giờ, bất cứ khi nào người dùng hoặc công cụ tìm kiếm truy cập trang web của bạn, họ sẽ được nhắc nhập tên người dùng và mật khẩu bạn đã tạo trước đó để xem trang web.

Password protected website

Phương pháp 2: Bảo vệ mật khẩu WordPress bằng một plugin

Nếu bạn đang sử dụng giải pháp lưu trữ WordPress được quản lý , đôi khi bạn không có quyền truy cập vào cPanel.

Trong trường hợp đó, bạn có tùy chọn sử dụng các plugin WordPress khác nhau để bảo vệ bằng mật khẩu cho trang web của mình. Dưới đây là hai giải pháp phổ biến nhất:

  1. SeedProd – đây là plugin chế độ bảo trì và sắp ra mắt số 1 dành cho WordPress, được sử dụng trên hơn 800.000 trang web. Nó đi kèm với các tính năng kiểm soát truy cập và quyền hoàn chỉnh mà bạn có thể sử dụng để ẩn trang web của mình khỏi mọi người kể cả các công cụ tìm kiếm. Chúng tôi có hướng dẫn từng bước cho SeedProd.
  2. Mật khẩu được bảo vệ – đó là một cách rất đơn giản để bảo vệ bằng mật khẩu trang web WordPress của bạn bằng một mật khẩu duy nhất (không cần người dùng tạo). Xem hướng dẫn từng bước của chúng tôi về cách đặt mật khẩu bảo vệ trang web WordPress .

Chúng tôi hy vọng bài viết này đã giúp bạn ngăn các công cụ tìm kiếm thu thập dữ liệu hoặc lập chỉ mục trang web WordPress của bạn. Bạn cũng có thể muốn xem hướng dẫn bảo mật WordPress từng bước cuối cùng của chúng tôi dành cho người mới bắt đầu.

Nếu bạn thích bài viết này, vui lòng đăng ký Kênh YouTube của chúng tôi để xem các video hướng dẫn về WordPress. Bạn cũng có thể tìm thấy chúng tôi trên TwitterFacebook .

Chia sẻ để ủng hộ ad nhé
Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
0 0 Đánh giá
Xếp hạng bài viết
Đăng ký
Thông báo về
guest
0 Bình luận
Phản hồi nội tuyến
Xem tất cả bình luận
0
Để lại ý kiến của bạnx
()
x
error: Cảnh báo: Không có quyền !!