Archive for 十一月, 2007

Google的网站收录和排名

  Google采用新一代的先进技术,根据互联网本身的链接结构对相关网站用自动方法进行分类,为您的每一个查询迅速提供准确的结果。Google以其独树一帜的网页级别 (PageRankTM,已申请专利)技术,打破了传统网络分类概念,带来网络搜索的革命。Google搜索速度极快,而且准确率极高。   Google可贮存网页的快照,当网页服务器暂时中断时您仍可浏览到该网页的内容。若找不到服务器,则Google暂存的网页也可救急。从贮存网页快照中找寻资料要比常规链接快得多,尽管所获取的信息可能不是最新的。而且在很多情况下可免受”404 Not Found Error”(找不到网页的错误信息)之苦。   网站登陆   Google经常在网上漫游,搜寻新资料。Google也可以让您提供新的网站信息。但Google会分析网站内容,所用时间长短不一,用以决定网站信息是否使用。首先输入网址,包括前缀http://,如http://www.google.com/。还可以加上网站简介,但此项说明仅供Google内部参考,并不影响Google对网页的编排。   如果您的网页提供多种汉字代码的用户界面,请选择一个您认为最应该向大家介绍的那一个。   注意:登录网址时,只须提交最上层的网页,其他各页由Googlebot自行查找。Google会定时自动检索并更新所有网站;对于失效网页则将其删除。   网站收录   网站页面的数量,特别是静态页面的数量   一个朋友的电子商务网站,有一段时间google只收录了98页。后来应公司要求,在网站上添加了很多“外购产品”,结果收录数量增加到504页。(注:外购产品指的不是本公司生产的产品,是公司从其它生产厂家买进来再放到网站上卖的“产品”。)   要点1:可以理解为,增加网站网页得绝对数量有利于google收录。这还可以从另外一个方面理解,大家知道,任何一个搜索引擎在收录一个网站得时候,绝对不会把网站得所有页面都收进去,这里面有一个百分比,有些搜索引擎只收录网站首页,Google通常可以收录30~40%,(如果网站得pr值高一些,可能收录得更多),这30~40%应该是google 通过对网站链接等因素计算出来相对比较重要的页面,而这里面很有可能考虑到了整个网站的页面数量。所以增加网站的页面数量有利于被google收录更多的网页。   网站的google site map   这一点我觉的效果相当明显。4月份我接手1个新网站(就是上面那个),没有做sitemap前收录504页,做了一个sitemap传上去不久,发现被收录了8840个页面,后来便维持在10200个左右。这里有个问题要说一下:制作sitemap 的参数(如更新频率等)一定要设正确;制作sitemap前网站上的死链尽量清除掉,网站界面尽可能看起来专业一些,还有首页面不要超过50k.   网站的外部链接   如果前面两点你觉的参考价值不大,就留意一下这一点。这并不是要你去做大量的外部链接。而是要你有选择的做链接。大家知道,Google是根据链接来抓取网页和分析各网页之间的相对重要性的(重要的可能就被收录了,不重要的google就会丢再一边),怎样看出该网页的重要性呢,google通常参考的参数是:该页面被别的网页引用的次数。被引用的越多,说明实用价值更大,(由于网站上几乎所有的页面都有返回首页的链接,所以网站的首页在一个网站中具有不可动摇的中心地位,搜索引擎如果收录你网站,绝对不会忘了首页)由此给我们可以得到几个增加部分页面重要性的办法:A:外部链接链向二级或者三级页面(有的搜索引擎只会爬行网页的url前三级,链接到二级页面就可以让它多往下爬一级)B:外部链接链向你认为重要的页面(而不仅仅是首页)。   网站的内部链接   原理同上,网站的内部链接没有规律,或者不够多,google会给网站的整体质量打低分。   网站在外的“露脸”次数   这一点指的是你网站网页被别人引用的次数。如果你的网站被其它多个网站多次引用,即使是一个新网站,搜索引擎也会重新认识你网站的价值。   首页问题   这个问题是我昨天对比多个网站得出来的:要想让搜索引擎收录某一个页面,一是把这个页面放在比较“浅”的深度(如url 二级),二是要想办法“创造渠道”让搜索蜘蛛多爬行几次。从这一点看,我们要想让它收录很多个页面,就可以采用以下办法:A、首页上放置尽量多的链接 B首页上放置部分本站url最深的链接(举个例子:假设某个网站的url深度为5级,分别为1、2、3、4、5,其中首页为url第1级,如果某个搜索引擎的爬行深度为3级,即1,2,3级有可能被收录,第4级就不可能收录。如果我们在首页上放置第6级的链接,那么蜘蛛就会爬行1,6,5级,即第6,5级可能被收录,同样的道理如果我们要想第4级被收录,可以在首页上放置第3级或第5级的链接)   关于排名   作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页A链接到网页B时,Google就认为”网页A投了网页B一票”。Google根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外, Google还要分析为其投票的网页。”重要”网页所投之票自然份量较重,有助于增强其他网页的”重要性”。   重要的、高质量的网页可获得较高的网页级别,从而在搜索结果中可获较高的排位。这样,Google的重要性综合指标为网页级别,而不是根据某一个具体的查询。当然,这代表了该网页本身的特性,是由Google根据网络数据、采用评定链接结构的综合运算法则进行分析的结果。   当然,如果与查询项目不匹配,再重要的网页也毫无意义。因此,Google采用完善的正文匹配技术,为您查找既重要又准确的网页。例如,Google在分析一个网页时,还会同时参考指向此网页的链接描述。   与其他多数搜索引擎的区别在于:Google只显示相关的网页,其正文或指向它的链接包含您所输入的所有关键字,而无须再受其他无关结果的烦扰。   Google不仅搜索出包含所有关键字的结果,并且对网页关键字的接近度进行了分析。与其他多数搜索引擎的一大区别是:Google按照关键字的接近度区分搜索结果的优先次序,筛选与关键字较为接近的结果。

More »

解决论坛收录问题-百度BBS收录协议

顾名思义,该协议能直接帮助论坛型网站提高收录效率。 Kyw的百度BBS收录协议阅读笔记如下: 1. 百度BBS收录协议是一个XML文件,作用类似GOOGLE的SITEMAP.XML文件。 2. XML文件的大小控制在10M内。 3. 百度BBS收录只是对百度蜘蛛原有收录方式的一种协助和有益补充,而不是取代。 4. 采用了百度BBS收录协议后,就相当于论坛中的帖子被百度订阅。 5. 支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB2312和UTF-8。 6. 注意XML文件头部的encoding值必须与XML文件的实际编码类型一致。 7. XML标签内容中的一些特殊字符需要转换为XML定义的转义字符。 8. 请保持每个XML文件处于按更新周期持续自动更新的状态。 9. 一个站点不可以提交多个不同的XML,否则可能会被识别为利用《论坛开放协议》作弊。 BBS收录协议使用方法: 将XML文件上传到网站根目录,在首页加一个链接,等百度蜘蛛爬过来就行。百度蜘蛛会对提供的数据进行测试和评估,顺利的话将会在一周内正式收录。 百度BBS收录协议样本: <?xml version=”1.0″ encoding=”GB2312″ ?> <document xmlns:bbs=”http://www.baidu.com/search/bbs_sitemap.xsd”>   <webSite>【网站域名】</webSite>    <webMaster>【管理员EMAIL】</webMaster>    <updatePeri>【更新时间】</updatePeri>    <updatetime>【本xml文件最近更新时间】</updatetime>   <version>【论坛使用程序版本,例如DISCUZ6.0.0】</version> <item>   <link>【帖子第一页的绝对地址,尽量用静态URL】</link>   <title>【新闻标题】</title>    <pubDate>【帖子发布时间 例:2007-08-21 16:55:32】</pubDate>   <bbs:lastDate>【帖子最后一条回复的发布时间】</bbs:lastDate>   <bbs:reply>【帖子回复数,不包括主贴】</bbs:reply>   <bbs:hit>【帖子总的查看次数】</bbs:hit>   <bbs:mainLen>【帖子主贴的长度,单位字节】</bbs:mainLen>   <bbs:boardid>【帖子所在栏目,提供栏目的id】</bbs:boardid>   <bbs:pick>【是否设为精华,精华标为1反则为 0】</bbs:pick> </item> </document> 样本XML下载:http://www.seotest.cn/upload/BBS-shouou-xieyi.xml 一个好消息,据我所知目前国内的BBS系统都没有支持百度的BBS收录协议,有能力开发插件的朋友,做一个吧,可以给你带来不少链接哦 ^_^  作者:Kyw@SEO-搜索引擎优化实验室  原载:点石互动  版权所有,转载请以链接形式注明作者及原始出处。

More »

转载:如何做好社区?五个环节洞悉社区运营

在关注与实践中,发现大概核心5个点,有可能决定了一个网络社区发展的好坏,简述如下:      1. 资质   也可理解为定位,也些网站不具备社区的潜质,再怎么发展也无济于事,多是出于:需求没有市场或市场太小;定位相对狭隘,用户根据这个定位不会联想你是社区;不具备太大焦聚的可能。当然还有更多原因。另外定位不是说我是什么,而是你做了什么让别人认为你是什么。      2. 专业用户(意见领袖)   相对专注的社区都会有明确的用户群体,而用户群体中自然有意见领袖,让小范围的意见领袖/专业用户增多时,专业的社区逐渐开始形成,因为相对专业而吸引同类的大众用户。社区发展伊始一般都会通过一定的运营策略解决这个问题,或者这是专业社区发展的必然经过。如果形成就已经开始有了核心竞争力,如没有常被人说同质化严重。      3. 社区战略   经营社区和经营企业几乎是一个道理,社区的发展是一个战略工程,目标、愿景、资源、预期、发展阶段、运营策略都是必不可少的。有人经常把定位写出来,而社区不是靠书写表达,而是靠用户的感知,而用户的感知更多是靠经营者去引导。社区的形成依靠初创伊始的思考,步步为营的引导,战术策略的实施,最终有可能实现你的目标。很多社区发展起来存在很多的偶然,不过那是几年前的事情了,新一代的社区没那么简单,所以想清楚,用作企业的态度做社区,至少不会太茫然。      4. 套路(持续性策略)   任何公司的市场工作基本上是持续性和反复性,观察和实践中得出社区运营亦然。年度季度计划此处略过,但是我每月一般性有所指标,例如:1-3月1大型事件营销,1月1-2次小活动,1周1专题等等。这是个持续性工程,这个做完了下个月继续持续。也许有人怀疑这样的做法,为什么不做创意性事件颠覆市场。我赞同创意性,但市场工作是个积累,持续与重复是量变到质变的过程。      5. 外部传播   仅仅有事件策划能力还不够,往往很多公司忽视了外部传播通道,或者对这块理解的不够深刻。试想我们策划事件的目的是什么?最终我们不是在内部整合资源。对于初创性的社区80%的精力投入会在外部连同的渠道,他们需要新生力量;成长型的社区依然要投入50%的力量在此;即使成熟的社区,那么也许应该关注自身影响力的PR。      另外我觉得很多互联网公司需要一套营销和运营的系统,这些是可以提升工作效率,提高工作方法的一些手段。这系统有可能大部分是一些很多人都理解的做法,但需要用系统来促进高校执行和流程控制,往往以此我们可以提高营销的精准和效果,当然也会大幅度降低成本。最近我在思考,希望能够提炼一些方式和方法,希望能与大家更多的交流。

More »