headermask image

header image

category archive listing Category Archives: SEO

以搜索引擎Spider的视角设计网页

  对网站进行优化的成败及最终效果取决于搜索引擎如何看待我们的工作。如果在优化过程中不遵循基本的SEO原则,那么,无论付出多大都不会取得意想中的效果:如果我们所做的一切并没有被搜索引擎“看”到,我们的网站在搜索页面中的排名怎么会靠前呢?
什么是Spider
  Spider是搜索引擎用来访问Internet上网页的自动程序(即通常意义上的Robots)。一般说来,不同搜索引擎的Spider的功能与手段大致相同,它们都用来在网站内“爬行”,读取Web页面,将其纳入搜索引擎的索引数据,在此基础上,搜索引擎才能依据各自的算法决定索引数据库中网页的相关性、排名等,当然,不同的搜索引擎采用不同的算法,索引网站的具体技术也各有特征,不过,我们今天要讨论的重点是Spider对什么感兴趣,哪些又是Spider所忽略的——毕竟spider决定别人是否能够发现我们的网页——了解了这些,我们才能更有针对性地设计、改进我们的网页。
  从根本上说,正因为搜索引擎的 spiders 只是“程序”,这就决定了其不可能象人那样去读相应的网页,比如说,象图片、Flash、JavaScript等可以对人视觉有很大冲击的设计对Spider来说则是“不可见的”,它们只认识特定的标识。这就需要我们针对Spider的“好恶”来调整网页的设计。
Flash、JavaScript、图片与框架
  对spider来说,Flash、JavaScript、与图片中的文本是不可见的,框架在很多时候对 SEO来说则更是一场灾难。也许上述的元素可以让我们的页面更漂亮更吸引人,但对搜索引擎来说则是另一回事。至于在某些图形设计者网站常见的使用Flash首页的情况更要命,在那些页面中,关键词与链接均被嵌入在flash中,这根本不能被搜索引擎解读嘛,搜索引擎在这样的页面上几乎看不到任何感兴趣的东西,这还谈什么搜索结果排名?
  事实上,Spider读取页面的方式类似于“古老”的文本浏览器,它们看不到文本之外的其他内容,所以,图片中的文字对Spider来说毫无意义。对于网页中必须使用的图片与Flash,可以采用在其的alt属性中加入对图片的描述,当然,在描述中要注意不要过度使用关键词,不然又走向了另一个极端即“关键词填充”。
链接
  很多网站在链接中使用javascript如mouse over事件来实现很华丽的效果,但这样的链接Spider往往不能有效地解读而被忽略,这就造成了Spider在网站内“爬行”的中止。对这类问题的解决办法是加上<noscript>标签,把相应的链接添加到 <noscript> 语句中。
动态页面
  动态生成的网页,尤其是使用类似于“?id=14”的页面,对 spiders 来说也是很难理解的,虽然大多数搜索引擎一直在着力解决这个问题,但在很多情况下仍不能象静态网页那样对spider更友善。如果条件允许的话,可以通过采用相应的url Rewrite技术来说spider认为那是一个静态网页,缩小其阅读的难度。
  为确保无误,在网页设计好后,可以使用spider模拟器来检查一下Spider眼中我们的网页是什么样子的,是不是与我们设计的初衷有所偏离。类似的spider模拟器网上很多,如这个。毕竟,只有在保证我们的网页能够被搜索引擎正常收录的条件下,谈搜索引擎排名的优化才有意义。

php开源网络爬虫

        1、PHPdig是国外非常流行的垂直搜索引擎产品(与其说是产品,不如说是一项区别于传统搜索引擎的搜索技术),采用PHP语言编写,利用了PHP程序运行的高效性,极大地提高了搜索反应速度,它可以像Google或者Baidu以及其它搜索引擎一样搜索互联网,搜索内容除了普通的网页外还包括txt, doc, xls, pdf等各式的文件,具有强大的内容搜索和文件解析功能。
       2、Sphider is a lightweight web spider and search engine written in PHP, using MySQL as its back end database. It is a great tool for adding search functionality to your web site or building your custom search engine. Sphider is small, easy to set up and modify, and is used […]

搜索引擎模拟器

http://www.webconfs.com/search-engine-spider-simulator.php
模拟真实的搜索引擎抓取网页!!

SEO(搜索引擎优化)书籍千遍一律

       接触SEO已经两个多星期了,也建立起相关的网站进行SEO学习(SEO实践性非常强),感觉起来还是蛮不错的。看着网站选择的关键字,排到了某一搜索引擎第一名时,真是太兴奋了!
      学SEO,相继看了不下15本书,其中包括中文、英文。刚看完第一本时,感觉还是蛮新鲜,蛮有意思。看完第三本时,一种厌恶情绪就出来了,怎么都是一个鬼样的。都是在meta元素,说域名,说主机,外部链接,内部链接,网页静态化……
      由于本人是学PHP,对HTML,CSS,JS,PHP有一定的了解,对SEO的书非常乏味。为什么就没有人去拿一个开源网络爬虫来研究呢?如今开源网络爬虫(JAVA,PHP)已经有很多个开源,其中JAVA开源网络爬虫居多,目前据本人所知,PHP开源网络爬虫有三个。

Google收录最勤快

质疑“百度收录最勤快?”。前不久,本人搭起个人博客 http://www.xsifili. com,曾对百度提交了两次网页抓取请求,至今百度数据库里面找不到相在页面,反而是Google,在提交后三天内就有收录,现在一发表文章,三分钟内被收录进去,百度还是不够专业,网站帮助系统有待于改进,毕竟产品做出来是以用为主,没有相关的教程、适当的引导,用户根据不知道如何使用(毕竟不是每个人都是IT专业人士,更不是百度工程师)。
Google帮助系统非常完善,对用户来说是福音,一有不会的,就去找帮助。关于Google图书,目前有《Google从入门到精通》《Google Hacks》(目前有第2版)。学完《Google从入门到精通》可以成为Google搜索高手,再学完《Google Hacks》可以成为Google Hacker。
建议百度出版一本《百度搜索从入门到精通》电子书 ,帮助用户系统化学习搜索技巧。

国外SEO高手详解Google排名(转)

国外37名优秀的搜索引擎优化界高手共同参与,以投票形式评论影响Google排名的重要因素,此次评选非常有价值,尽管没有将200多个Google排名因素全部列出,但Google排名算法中90%-95%的重要成分已经包含在其中了, Chris.dl也是最近才看到,非常有价值,现在将其翻译,并有利于Google排名的因素。
排名 得分 分类 详细说明
1 4.9 关键词 关键词在网站TITLE上的使用
2 4.4 外部链接 外部链接的锚文字
3 4.4 网站品质 网站的外部链接流行度、广泛度
4 4.1 网站品质 域名年龄(从被搜索引擎索引开始计算)
5 4 页面质量 网站内部链接结构
6 3.9 网站品质 网站的外部链接页面内容与关键词的相关性
7 3.9 网站品质 网站在主题相关的网站群中的链接流行度
8 3.7 关键词 关键词在网页内容上的应用
9 3.6 外部链接 外部链接页面本身的链接流行度
10 3.5 网站品质 网站新外部链接产生的速率
11 3.5 页面质量 导出链接的质量和相关性
12 3.5 外部链接 外部链接页面的主题性
13 3.5 外部链接 外部链接页面在相关主题的网站社区中的链接流行度
14 3.4 关键词 页面内容和关键词的相关性(语义分析)
15 3.4 页面质量 页面的年龄
16 3.3 关键词 关键词在H1标签中的使用
17 3.2 网站品质 […]