it-swarm-vi.com

Có cách nào để các công cụ tìm kiếm không lập chỉ mục một phần nhất định của trang không?

Tôi có thiết lập Blogger với bảng Lưu trữ Blog được hiển thị trên mỗi trang để người dùng có thể dễ dàng truy cập vào các bài đăng cũ. Vấn đề là nó liệt kê tiêu đề của từng trang trong bảng này, có nghĩa là trang hiện tại đang nhận các từ khóa không liên quan trực tiếp đến nó mà đến một trang khác.

Ví dụ, tôi có thể viết về cam, nhưng một tuần trước tôi đã viết về táo. Các trang về cam hiện đang được các công cụ tìm kiếm nhìn thấy cũng đang nói về táo vì có một liên kết trong bảng Lưu trữ đến bài đăng của tôi từ một tuần trước về táo. Điều ngược lại cũng đúng khi trang táo cũng đang lập chỉ mục các từ khóa màu cam.

Có cách nào để loại trừ một phần nhất định của trang khỏi bị lập chỉ mục không? (ví dụ như có toàn bộ <div> được gắn thẻ là noindex hoặc một cái gì đó tương tự.)

Tôi biết rằng Blogger có một tùy chọn để xóa tiêu đề của các trang trong Bảng điều khiển Lưu trữ, nhưng tôi sẽ thích hơn nếu họ ở đó để người dùng biết bài đăng nào có sẵn.

13
Senseful

Giả sử bạn có thể thêm lớp robots-nocontent vào các thành phần trên trang của mình, như thế này:

<div class="robots-nocontent">

    <p>Ignore this stuff.</p>

</div>

Yahoo tôn trọng điều này , mặc dù tôi không biết liệu các công cụ tìm kiếm khác có tôn trọng điều này không. Nó xuất hiện Google không hỗ trợ điều này tại thời điểm này. Tôi nghi ngờ nếu bạn tải nội dung của mình qua ajax, bạn sẽ nhận được hiệu ứng tương tự như nội dung không có trên trang.

7
artlung

Không có cách chung để làm điều đó và cá nhân tôi sẽ không bận tâm với nó. Các công cụ tìm kiếm khá giỏi trong việc nhận ra nội dung có liên quan trên một trang và mặc dù nội dung đó có thể hiển thị trong các từ khóa mà công cụ tìm kiếm đã tìm thấy, điều đó không có nghĩa là nó sẽ làm cho trang phù hợp với các từ khóa đó.

Nếu bạn có một trang về "Cá" và một trang về "Chó" (có liên kết đến trang về "Cá" ở đâu đó trong thanh bên), các công cụ tìm kiếm thường có thể nhận ra rằng trang về "Cá" là liên quan nhiều hơn đến "Cá" so với trang về "Chó" có đề cập đến "Cá" trong thanh bên. Có thể cả hai trang có thể được tìm thấy tại một số điểm, nhưng thường được cho rằng hầu hết một trang từ trang web được hiển thị trong kết quả tìm kiếm, đó không phải là điều đáng lo ngại.

Không cần phải thích điều đó và các công cụ tìm kiếm có thể sẽ bị lẫn lộn hơn nếu bạn thử (ví dụ: nếu bạn sử dụng JavaScript để ẩn nội dung, bạn sẽ không bao giờ biết khi nào công cụ tìm kiếm sẽ bắt đầu tìm thấy nội dung đó bất kể). Tương tự, việc sử dụng iframe với robot.txt không cho phép hoặc AJAX sẽ thường xuyên làm giảm chất lượng trang của bạn cho người dùng (làm chậm nó hoặc làm cho nó ít sử dụng hơn trên nhiều thiết bị), vì vậy trừ khi có, lý do rất mạnh mẽ và đã được chứng minh rằng bạn cần phải làm điều này, tôi thực sự khuyên bạn không nên bận tâm đến nó.

3
John Mueller

Tôi tin rằng bạn có thể sử dụng iFrame và mã bên trong sẽ chỉ được lập chỉ mục nếu bạn để Google lập chỉ mục trang đó. Vì vậy, nếu bạn đặt một nofollow trong tệp robots.txt của bạn cho tệp được tải từ trong iFrame, bạn sẽ ổn.

1
Ben Hoffman

Văn bản từ khóa trong một liên kết là chủ yế áp dụng cho trang mà liên kết trỏ đến, không phải trang mà liên kết đang bật. Cá nhân, tôi sẽ không lo lắng quá nhiều về nó. Bạn có thể sẽ tồi tệ hơn bằng cách loại bỏ/che giấu các tiêu đề hơn là để cho nó được.

0
Eric Petroelje

Google cung cấp cách riêng của mình để không bao gồm văn bản không mong muốn từ chỉ mục .

Trong ví dụ của bạn, bạn đã nói về mỏ neo, Google cung cấp ví dụ này:

<!--googleoff: anchor-->
  <A href=sharks_rugby.html>shark</A>
<!--googleon: anchor-->

Và có một vài chế độ khác.

0
lulalala