[置顶] 搜索引擎登录入口

[置顶] 网络推广术语全攻略:CPM/CPS/CPA/CPC

[置顶] 欢迎大家来交换友情链接

详解百度分词技术(三)

2008年11月13日 网站优化 0条评论

说明百度的同音词典是自动生成的,而且没有人工校对.还说明在自动生成同音词典的过程中,百度不是根据对一篇文章标注拼音然后在抽取词汇和对应的拼音信息获得的,而是完全按照某个词典的词条来标注音节的,

  所以对于多音字造成的错误无法识别出来,如果是对篇章进行拼音标注,可能就不会出现这种很容易发现的错误标注. 当然还有另外一种解释,就是"局长"是故意被百度提示出来可能的正确提示词汇,因为考虑到南方人"zh"和 "ch"等前后鼻音分不清么,那么是这样的么?我们继续测试到底是何种情况.是百度有错误还是这是百度的先进的算法?

...更多...

详解百度分词技术(二)

2008年11月13日 网站优化 0条评论

继续测验,提交查询“古巴比伦理”,如果是正向最大匹配,那么结果应该是,如果是反向最大匹配,那么结果应该是,事实上百度的分词结果是,从这个例子看,好像用了正向最大匹配算法;此外还有一些例子表明好像是使用正向最大匹配的;但是且慢,我们看这个查询“北京华烟云”,正向最大匹配期望的结果是,而反向最大匹配期望的结果是,事实上百度输出的是后者,这说明可能采用的反向最大匹配;从这点我们可以猜测百度采用的是双向最大匹配分词算法,如果正向和反向匹配分词结果一致当然好办,直接输出即可;但是如果两者不一致,正向匹配一种结果,反向匹配一种结果,此时该如何是好呢?

...更多...

详解百度分词技术(一)

2008年11月13日 网站优化 0条评论

本文通过搜索结果归纳分析+切词通用算法分析的方式对百度预处理阶段的查询处理和中文分词两项技术进行了阐述、总结,如果你对数据结构、算法有一定了解的话,理解起来会相对容易些;个人感觉,得出正向最大匹配算法不够准确,无论是专用词典还是普通词典里的词,都是有不同权重的,这根搜索频率应该有一定关系,基于这点,在出现多个专用词典里的词时,是需要采用双向最大匹配算法来检测到底哪一个专有词汇应该先被切出来,当然,这是个人猜想,有待考究。

  理解分词技术对SEO工作具有极大意义,可以从科学的角度来分析关键词,并构想关键词部署策略;如果正向最大匹配算法的结论是正确的,那基本上可以断定,切词后的分词的权重是按照正向排序的

...

更多...

巧用404错误页面

2008年11月13日 网站优化 0条评论

出现错误页面的情况,一般有两种,一种是用户输入了错误的链接;另外一种是链接先前存在但是由于站长在后台做了修改,比如删除了一篇文章等等,导致用户输入的链接不存在有与之相连的网页,这时就会出现404错误页面。总之就是链接不存在相应的网页。

  那么404错误页面对seo有什么影响吗?有什么好利用的呢?

  打个比方,如果你的某篇文章(与之相应的网页)被搜索引擎收录了,你之后把它删除了,但是蜘蛛或机器人还没有来得及更新。这时用户通过搜索引擎访问了你这篇不存在的文章,出现的当然就是“无法找到该页”。蜘蛛和机器人这个时候是会生气的:你不是耍我吗,都答应收录你了!好比一个人没有信用就无法获得别人的信任,蜘蛛和机器人会对这样的网站留下不好的印象,结果就是把网站往后面排了。

...更多...

标题优化(二)

2008年11月13日 网站优化 0条评论

第四、关键字组合技巧
标题优化的最后一个环节就是对标题中的主、辅关键字进行组合与分隔,通过对标题中的关键字进行分隔、组合,不但可以有效拓展标题的意义,而且还能增加页面被检索的机率。

(1)分隔符
接下来,向大家介绍标题中最常用的分隔符,分别是竖杠“|”、“空格” 、及逗号“,”。下面我们来看看这几种分隔符的表达形式:
1)竖杠“|” :关键字间用竖杠进行划分;
...

更多...

标题优化(一)

2008年11月13日 网站优化 0条评论

网页标题,即<title>标签。标题标签的内容是对网页主题的概括,相当于一篇文章的题目。大多数搜索引擎都是提取网页标题的全部或部分内容作为摘要信息中的标题。因此,我们在拟写标题内容时,要做到主题突出、内容简洁。

 标题标签的优化主要包括:“标题长度的控制”、“关键字分布”、“关键字词频”及“关键字组合技巧”。

第一、标题长度
...

更多...

《圣经》

2008年11月6日 丁丁点滴 0条评论

《圣经》是一部令人动容、令人思考的书。它的每一章、每一句都蕴涵着古老而永恒的智慧,它不愧为人类历史上最深刻、最具价值的著作之一,在思想性、文学性、历史性上都是不可多得的。然而群玉圃中必有最璀璨者,群芳国中必有最艳丽者。下面列出《圣经》的众多名言警句中最让我动容的十句,以资参考讨论。
  
  这里先解释“动容”一词的含义:既包括感性的“激动”,也包括理性的“思考”。最重要的是对内心深处的触动。
...

更多...

SEO标准模板

2008年10月20日 丁丁SEO 0条评论

SEO标准模板

基于一些站长、专业程序员对于重要而基本的网页知识非常不了解,编写的代码非常混乱。发布《SEO标准模板》,给不清楚什么是规范的网页代码的人以启示和启发。

下面的模板是创建规范网页的基础,是命根。这些极端重要的东西,你在一般的教程上是学不到的,但却影响着每一个站的搜索质量。

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
...

更多...
分页:[«]1[2][3][4][5][6][7][8][9][10][11][12][13][»]

Powered By Z-Blog 1.8 Spirit Build 80722

Copyright By 丁丁SEO Rights Reserved. 网站备案:沪ICP备08106214号