站内搜索

概观

每个打开伯克利页面上,有一个搜索框,让访问者可以搜索你的网站的内容。

搜索使用索引,按之类的东西,不管是在网页标题或副标题,它解析页面内容为关键字和它们的权重。

搜索结果页面包括面,使搜索结果进行过滤通过 内容类型 并通过 整个站点的话题.

如果搜索多个关键字,搜索功能会将其视为一个和,这意味着只有与所有关键字的网页将被包含在结果中。

你也可以指定页面作为 顶部结果 针对特定的搜索字词。

什么是索引

网站上的所有出版,编辑项索引,不管类型如何。 (内容类型包括核心内容页面,登陆页面,新闻条目,和常见问题类型,以及通过测试功能提供的任何内容类型,如服务目录和投资组合)。所有可编辑内容编制索引:主体内容,所有其他的领域,并添加了任何小部件。横幅,菜单和页脚文本不被索引。

另外,图像的alt文本索引。如果您的网页包括传达信息的图像,添加适当的替代文字将提高网站的搜索能力。

网站搜索不未在网站上托管的内容编制索引。你不会对其他网站添加到您的网站搜索。嵌入部件诸如校园日历,Twitter或谷歌文档的内容不被索引。

当内容被索引

内容只要您保存页面重新索引。此外,搜索索引每小时运行一次并为可能没有被索引的变化检查。

如何单词和字符索引

标点符号不是索引;只有字母和数字进行索引。

“字母”包括在非拉丁字母如西里尔字符,附加符号例如重音和变音符号,以及诸如中国非字母字符集的字符。

用变音符号字符是完全无关,他们的基本字符。例如,单词“简历”是从字不同的“简历”,并寻找一个不会返回其他的实例。

对于字的最小长度是3个字符。也就是说少于3个字符被忽略,没有索引。

所有搜索不区分大小写。搜索“IST”或“IST”返回相同的结果,包括与网页“北京时间”,“北京时间”,“北京时间”,或任何变体的资本。

只有完整单词的索引。搜索“雨”,将不返回结果包含单词“沉淀”。

标点

连字符被忽略,仿佛连字符连接的部分都是一样的话,那么例如“长期”被收录为处理“长期”。

All other punctuation is treated the same as whitespace, which means that it is considered a word boundary. For example, "Rinse&Repeat" is indexed as two separate words, "Rinse" and "Repeat."

排名结果

搜索索引取决于他们出现在内容以及它们如何标记分配权重,以索引的话。例如,词是网页标题的一部分被评为比普通文本内容的8倍更重要。

创建涉及到他们描述将提高你的网站的可搜索内容标题和标题。

权重

  • 页面标题:8X
  • H1标题:5X
  • H2标题:3X
  • H3标题:2X
  • 粗体文字:2X
  • 斜体文字:1.5倍

所有其他标记使用标准重量1倍的。

搜索结果顺序

搜索结果的顺序取决于搜索关键字的网站上的密度和重量。一般来说,一个页面上的单词的多个实例将意味着在出现的页面中的结果这个词高。

对于网站的搜索优化内容

通过内部搜索优化可查找性类似于由外部搜索引擎如谷歌的可查找性优化。

  • 不渲染文本的图像。
  • 使用图像适当的替代文字。
  • 创建描述页面内容的网页标题。
  • 使用描述标题和组织您的网页内容。
  • 不要过度使用的标题来提高特定的单词。
  • 不要尝试用关键字塞满你的页面。

网站搜索和谷歌之间的差异

内部站点搜索不是像谷歌的蜘蛛;它不遵循从页面到页面的链接。相反,它的索引存储每个页面的文本内容。这意味着页面索引并在返回结果即使有对他们没有任何联系。

根据传入的链接,点击量或页面普及等措施站点搜索不计算网页的排名。

基于物像搜索者的位置,以前的搜索网站搜索不调整的结果,或者他们是否已登录。

网站搜索没有索引非HTML内容,例如PDF文档或视频字幕。