停止搜索引擎以索引页面的特定部分
我有一个页面,呈现一本书,比如说100页。每个页面都有一个特定的网址(例如,等)。php
/my-book/page-one
/my-book/page-two
翻转页面时,我使用历史记录API更改url,使用url.js
。
由于所有书籍内容都是从服务器端呈现的,因此问题在于内容被搜索引擎索引(特别是我指的是Google),但是URL是错误的(例如,它找到了一个片段,但网址是 )。page-two
page-one
如何阻止搜索引擎(至少是Google)将页面上的所有内容编入索引,但仅将可见的图书页面编入索引?
如果我以不同的方式呈现内容,它会起作用吗:例如,然后在JavaScript端以所需的格式进行更改?这将使页面变慢,事实上我不确定Google是否会通过JavaScript索引更改的内容。<div data-page-number="1" data-content="Lorem ipsum..."></div>
代码如下所示:
<div data-page="1">Page 1</div>
<div data-page="2">Page 2</div>
<div data-page="3" class="current-page">Page 3</div>
<div data-page="4">Page 4</div>
<div data-page="5">Page 5</div>
那么只有可见的 div 是那个。相同的内容在多个网址上提供,因为这是必需的,以便用户可以在页面之间翻转。.current-page
例如,在呈现相同内容时将呈现这段 HTML,唯一的区别是添加到第 4 个元素的类。/book/page/3
/book/page/4
current-page
Google确实索引了不同的网址,但它做错了:例如,呈现给用户的片段链接(不是)。Page 5
/book/page/2
Page 2
Page 5
如何告诉谷歌(和其他搜索引擎)我只对索引中的内容感兴趣?.current-page