SEO前端篇(一)页面布局
2023-09-05 加入收藏
一、SEO定义
SEO全称:Search English Optimization,搜索引擎优化。自从有了搜索引擎,SEO便诞生了。为了提升网页在搜索引擎自然搜索结果中的收录数量以及排序位置而做的优化行为。简言之,就是希望百度等搜索引擎能多多我们收录精心制作后的网站,并且在别人访问时网站能排在前面。
二、搜索引擎的工作原理
当我们在输入框中输入关键词,点击搜索或查询时,然后得到结果。深究其背后的故事,搜索引擎做了很多事情。
在搜索引擎网站,比如百度,在其后台有一个非常庞大的数据库,里面存储了海量的关键词,而每个关键词又对应着很多网址,这些网址是百度程序从茫茫的互联网上一点一点下载收集而来的,这些程序称之为“搜索引擎蜘蛛”或“网络爬虫”。这些勤劳的“蜘蛛”每天在互联网上爬行,从一个链接到另一个链接,下载其中的内容,进行分析提炼,找到其中的关键词,如果“蜘蛛”认为关键词在数据库中没有而对用户是有用的便存入数据库。反之,如果“蜘蛛”认为是垃圾信息或重复信息,就舍弃不要,继续爬行,寻找最新的、有用的信息保存起来提供用户搜索。当用户搜索时,就能检索出与关键字相关的网址显示给访客。
一个关键词对用多个网址,因此就出现了排序的问题,相应的当与关键词最吻合的网址就会排在前面了。在“蜘蛛”抓取网页内容,提炼关键词的这个过程中,就存在一个问题:“蜘蛛”能否看懂。如果网站内容是flash和js,那么它是看不懂的,会犯迷糊,即使关键字再贴切也没用。相应的,如果网站内容是它的语言,那么它便能看懂,它的语言即SEO。
因此可以得出结论,需要优化体现的部分尽量不用flash和js来加载,用HTML直接方式加载。
有了上面的了解,那么我们只需要了解“蜘蛛”爬取的规则即可。当然百度和谷歌等搜索引擎大佬也没有公示其相应的爬取收录规则,因此这里只能对自己实际的应用和网上的一些资料做一个整合。
三、蜘蛛的规则
1、让蜘蛛知道你的网站。
一些人认为网站建好后首先到各大搜索引擎免费登录你的网站。其实这个真是多此一举,360已经做过相应测试(他们新建一个网站发布然后通过百度访问,第二天该关键词的网站显示在了首页)。所以这个搜索引擎会自动做的工作,我们就不要在这里长篇大论,盲人瞎马了。只要发布了,有人访问蜘蛛就会自己来。
2、留住蜘蛛
蜘蛛来了也会走,蜘蛛跟人工访问网页一样。这里着重看了将下网页静态化和三层结构。
网页的静态化
网页实现静态化,重要的信息通过HTML直观的展现。同时实现网页文字与图片等其他信息的分离,图片要有专门的图片服务器,大的资源文件分离到文件服务器。做到尽量减少应用网页的大小,最好控制在120KB之内,能做到秒加载。一些加载太慢的网页,用户会走,同时蜘蛛也会走,没时间等你。舞台只留给准备好的人。
网页的三层结构
曾今在网上看到有人说能让蜘蛛迷路,我不觉感到好笑。纵然能,也是暂时的,蜘蛛是会进化的,不要拿你一个人的智商去挑战一个优秀的团队。一个程序陷入无限的死循环那是程序员的无知无能,但凤毛菱角。一般来讲,你想要展示的部分比如商品最好是三层结构之内,比如:手机 —> 华为 —> HUAWEI P30 就能看到一个详细的SPU。太繁琐别人找得烦,蜘蛛也闲烦,结构太深蜘蛛不是迷路跟着你的套路走而是直接跳出,不是蜘蛛over而是你over。
3、蜘蛛爬取的关键部分——标签。
当然网上有一些总结的比较细的,仅供参考。