加入收藏
 地图
 用户登陆
 帮助中心
电子商务 SEO动态 SEO技术 SEO软件 SEO推荐 网站留言 SEO用户 SEO专栏 电子商务   SEO培训
今天是:2019年4月19日 星期五   您现在位于: 首页 →  SEO专栏 → GOOGLE搜索引擎研究(浏览贴子)
   GOOGLE搜索引擎研究  -  浏览贴子 (回复:0 浏览:727  杰米   [ 本版精华 ]  [ 版面管理 ]
 主题:面向搜索引擎的网站设计(三)
   
舍我!? 
等级: SEO管理员
头衔:什么是头衔?
贴子:83
积分:199
SEO币:0
来自:山西运城
注册:2006/6/8
          1
 面向搜索引擎的网站设计(三)
转载自cnblog.org——“突发”文字可能揭示社会趋势

在“新科学家”(New Scientist)在线杂志上,公布了康奈尔大学的一个新研究成果,引人注目,也许与Google 收购Pyra 的动机有关。

这所大学的计算机科学家 Jon Klenberg 开发了一个计算机算法,能够识别一篇文章中某些文字的“突发”增长,而且他发现,这些“突发”增长的文字可以用来快速识别最新的趋势和热点问题,因此能够更有效地筛选重要信息。过去很多搜索技术都采用了简单计算文字/词组出现频率的方法,却忽略了文字使用增加的速率。

Jon 特别指出,这种方法可以应用到大量Weblog上,以跟踪社会趋势,这对商业应用也很有潜力。例如,广告商可以从成千上万的个人Blog 中快速找到潜在的需求风尚。而且只要Blog 覆盖话题范围足够大(实际上发展趋势确实如此),这项技术对政治、社会、文化和经济等领域也都会有实际意义了。

虽然Google 新闻的内部算法至今没有公开,但是人们猜测这种完全由机器所搜集的头条新闻应当不是Google搜索引擎中惯用的鸽子算法,很可能与这种“突发”判断算法有关。如此说来,Google收购Blog工具供应商的举动确实还有更深层次的远见了。

- NewScientist.com news, Word ''bursts'' may reveal online trends
- 还没有写完这些介绍,在 SlashDot 上也看到了很多有关这个发现的讨论


附:Google官方的站点设计指南

Make a site with a clear hierarchy and text links. Every page should be reachable from at least one static text link.  让网站有着清晰的结构和文本链接,所有的页面至少要有一个静态文本链接入口
批注:尽量不要用图片和javascript 
Offer a site map to your users with links that point to the important parts of your site. If the site map is larger than 100 or so links, you may want to break the site map into separate pages.
为用户提供一个站点地图:转向网站的重要部分。如果站点地图页面超过100个链接,则需要将页面分成多个页面。
批注:索引页不要超过100个链接:SPIDER只考虑页面中头100个链接 
Create a useful, information-rich site and write pages that clearly and accurately describe your content.
用一些有用的,信息量丰富的站点,清晰并正确的描述你的信息。 
Think about the words users would type to find your pages, and make sure that your site actually includes those words within it.
想像用户可能用来找到你的关键词,并保证这些关键词在网站中出现。
批注:少用“最大”,“最好”之类的形容词,用用户最关心的词,比如:下载,歌星名字,而不是一些抽象名词。 
Try to use text instead of images to display important names, content, or links. The Google crawler doesn''t recognize text contained in images.
尽可能使用文本,而不是图片显示重要的名称,内容和链接。GOOGLE的机器人不认识图片中的文字。 
Make sure that your TITLE and ALT tags are descriptive and accurate.
保证:页面的TITLE和ALT标记正确的精确描述 
Check for broken links and correct HTML.
检查坏链并修正这些HTML错误。 
If you decide to use dynamic pages (i.e., the URL contains a ''?'' character), be aware that not every search engine spider crawls dynamic pages as well as static pages. It helps to keep the parameters short and the number of them small.
如果你打算使用动态页面:链接中包含"?",必须了解:并非所有的搜索引擎的机器人能想对待静态页面一样对待动态页面,保持动态页面的参数尽可能的少也会很有帮助。 
Keep the links on a given page to a reasonable number (fewer than 100).
让一个页面中的链接少于100个。
批注:用lynx -dump http://www.chedong.com 可以模拟从robot角度看到的页面。其最后有链接统计

输出类似:

   [1]Google Free Search _______________________________ Google Search
   (_) Search WWW (_) Search chedong.com

   更 新 [2]站点地图 / Site Map [3]留 言簿 / Guest Book [4]意见反馈 /
   Feed Back
    ...
References

   Visible links
   1. http://www.google.com/services/free.html
   2. http://www.chedong.com/sitemap.html#sitemap
   3. http://www.chedong.com/guestbook/
   4. http://www.chedong.com/formmail.htm
    ...
   Hidden links:
  50. http://www.chedong.com/bbcweb/

 
 
只要你面向阳光,黑暗就永远在你身后。
 本贴发表时间:2006/6/13 14:53:18  
 分页: [1]
主题贴类型:[ 正常 ] 
您是否还没有 注册 或还没有 登陆 本站?!

   电子商务网每日推荐文章: Google补充材料形成的原因 2019/4/19
    我们在Google中进行搜索时,如果搜索结果比较少,有时候会发现有的网页后面被标记为“补充材料”(Supplemental Result)。补充材料是什么东西呢?Google在Google向网站管理员提供的信息高级问题里是如此定义补充材料的:
    补充网站是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到我们的补充索引里。
    将网站包括其中的索引是完全自动的,没有任何方式可以选择或更改您网站的索引。请放心,包含网站的索引不会影响该网站的PageRank。
    根据Google的说法,作为补充材料的网页,只是一种辅助、补充的索引,并不作为主要索引。也就是说,这些网页并非在Google的主数据库中,而是在辅助数据库中。一般情况下,当我们在Google进行搜索时,他展现给我们的结果,是主数据库中的网页,并非辅助数据库中的网页。由此可以得出结论,作为补充材料的网页,在Google的表现会非常非常的差。
    根据yoo的观察,作为补充材料的网页,被Google爬虫爬行的间隔时间非常长,很多时候几个月、甚至半年都不会被Google爬虫造访,严重影响网页在Google数据库中的更新。同时这些网页的排名非常差,只有在搜索结果很少的时候,才会被Google列出来。一般情况下,根本无法在搜索结果里看见这些网页。......查看详细内容
关于我们 ┋ 网站留言 ┋ 电子商务网成员网站 ┋ SEO培训基地 ┋ 地图 ┋ SEO培训 ┋ 管理 ┋ TOP
合作站点: 杰晶网络 | 建材互联 | Herbal | 淘宝优惠券 | 中国保健品网 | OilPainting | NHE | 杰米世界 | 南强新网
电子商务网 网络营销顾问:杰晶网络 版权所有
Copyright © 2006 ECSoon.com All Rights Reserved