搜索引擎对您的内容进行排名之前,它首先需要知道它的存在。通常是通过”爬虫抓取”页面的数据。这里主要从技术方面去叙述我所知道的优化
代码优化
- title 设置
- keywords 设置
- description 设置
- meta属性设置
- 页面H1-H3标签的使用
- 图片设置Alt属性
- 404页面设置、301重定向
- Robot.txt
- 删除页面无用代码,css、js优化
网站结构
- 扁平化网站架构:扁平化的网站结构,意味着用户(和搜索引擎爬虫) 只需4次(或更少)点击, 就可以到达网站上的任何页面。
- 导航和面包屑导航
- 页面打开速度
- 简化页面结构 重要的内容尽量排在从上到下从左到右的结构
- sitemap.xml
- 使用内部链接
网站地图
站点链接
- 不良内部链接: Google依靠内链来抓取您网站上的所有页面。没有内部链接的页面通常不会被抓取。
- robots.txt作用: Robots.txt是一个文本文件,告诉Google它的爬虫是否可以在您的网站上访问。如果你用了这个文件,则谷歌不会抓取。
- 不编入索引的页面: 您可以使用noindex元标记或HTTP标头把页面排除于谷歌索引之外。如果您网站上的其他网页只有来自noindexed页面的内链,谷歌很有可能无法找到他们。
- Nofollowed内链: 是HTML页面中a标签的属性值。这个标签的意义是告诉搜索引擎”不要追踪此网页上的链接或不要追踪此特定链接”。
nofollow的作用?
1、防止不可信的内容,最常见的是博客上的垃圾留言与评论中为了获取外链的垃圾链接,为了防止页面指向一些拉圾页面和站点。
2、为了防止付费链接影响Google的搜索结果排名。
3、引导爬虫抓取有效的页面,避免爬虫抓取一些无意义的页面,影响爬虫抓取的效率。
nofollow2个基本用法
- 用于标签,告诉搜索引擎(爬虫)该页面上所有链接都无需追踪(这种方法一般用的较少)
1
<meta name="robots" content="nofollow" />
- 用于标签,告诉搜索引擎(爬虫)加上此属性的链接无需追踪(一般推荐用这种方法)
1
<a href="login.aspx" rel="nofollow">登录</a>