前端SEO相关
前言
- 先了解什么是seo?
- 再了解搜索引擎蜘蛛的工作原理?
- seo为啥对vue单页面不友好?
- vue项目怎么做seo优化?
- prerender-spa-plugin怎么使用,
- prerender-spa-plugin原理探究
- prerender-spa-plugin不能解决的问题
- 静态页面分配title和meta标签----vue-meta-info

什么是seo?
SEO是由英文Search Engine
Optimization缩写而来, 中文意译为“搜索引擎优化”。SEO是指通过对网站进行站内优化和修复(网站Web结构调整、网站内容建设、网站代码优化和编码等)和站外优化,从而提高网站的网站关键词排名以及公司产品的曝光度。通过搜索引擎查找信息是当今网民们寻找网上信息和资源的主要手段。
引擎蜘蛛的工作原理?
搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。
网络爬虫在爬取网页内容的时候,需要分析页面内容,主要有以下几点:
- 从 meta 标签中读取 keywords 、 description 的内容。
- 根据语义化的 html 的标签爬取和分析内容。一个整体都是用 div 标签的网站和正确使用了 html5 标签的效果是不一样的。
- 读取 a 标签里的链接,通过 a 标签的链接可以跳转到别的网站。(爬虫是先跳转,还是继续爬内容再跳转,就看算法是广度优先还是深度优先了)
- 像 h1 - h6 标签是具有不同程度的强调意义的。
- 一般将 h1 视为重要内容。同样有强调内容还有 strong 、 em 标签。
seo为啥对vue单页面不友好?
- 爬虫在爬取的过程中,不会去执行js,所以隐藏在js中的跳转也不会获取到
- vue通过js控制路由然后渲染出对应的页面,而搜索引擎蜘蛛是不会去执行页面的js的,导致搜索引擎蜘蛛只能收录index.html一个页面,在百度中就搜索不到相关的子页面的内容。
- 我们加载页面的时候,浏览器的渲染包含:html的解析、dom树的构建、cssom构建、javascript解析、布局、绘制,当解析到javascript的时候才回去触发vue的渲染,然后元素挂载到id为app的div上,这个时候我们才能看到我们页面的内容,所以即使vue渲染机制很快我们仍然能够看到一段时间的白屏情况,用户体验不好
引起的问题
- 收录的页面少了->被抓取的页面就少了->点击量之类的也就少了;
- 不能对对应的页面做TDK(title, keywords, description)不同的配置,每个页面的title和meta标签都是一样的,不利于网络爬虫的爬取
vue项目怎么做seo优化?
html就不能通过js生成,我们需要在加载js之前做一下页面的预渲染,目前了解到的有两种方法
常见的解决方案:
prerender-spa-plugin的使用
vue-cli3的解决方案
使用 webpack +prerender-spa-plugin + vue-meta-info 轻松地添加预渲染
prerender-spa-plugingithub.com/chrisvfritz/prerender-spa-plugin
vue-meta-infowww.npmjs.com/package/vue-meta-info
// 安装依赖
npm install prerender-spa-plugin --savevue.config.js配置如下
const PrerenderSPAPlugin = require("prerender-spa-plugin");
const Renderer = PrerenderSPAPlugin.PuppeteerRenderer;
// eslint-disable-next-line no-unused-vars
const webpack = require("webpack");
const path = require("path");
module.exports = {
configureWebpack: (config) => {
if (process.env.NODE_ENV !== "production") return;
return {
plugins: [
new PrerenderSPAPlugin({
// 生成文件的路径,也可以与webpakc打包的一致。
// 这个目录只能有一级,如果目录层次大于一级,在生成的时候不会有任何错误提示,在预渲染的时候只会卡着不动。
staticDir: path.join(__dirname, "dist"),
// outputDir: path.join(__dirname, './'),
// 对应自己的路由文件,比如a有参数,就需要写成 /a/param1。
routes: ["/testData", "/contact"],
// 这个很重要,如果没有配置这段,也不会进行预编译
renderer: new Renderer({
inject: {
//默认挂在window.__PRERENDER_INJECTED对象上,可以通过window.__PRERENDER_INJECTED.foo在预渲染页面取值
foo: "bar",
},
headless: false,
// 在 main.js 中 document.dispatchEvent(new Event('render-event')),两者的事件名称要对应上。
renderAfterDocumentEvent: "render-event", //等到事件触发去渲染,此处我理解为是Puppeteer获取页面的时机
}),
}),
],
};
},
};- staticDir 指的是预渲染输出的页面地址,
- routes 指的是需要预渲染的路由地址,
- renderer 则是所采用的渲染引擎是什么,目前用的是 V3.4.0 版本支持 PuppeteerRenderer。
- inject 则是预渲染过程中都能拿到的值,该值提供给你了机会,让你觉得是否渲染这部分代码。例如下面的代码,是不会被预渲染进 HTML 中的。
- renderAfterDocumentEvent 这个则很关键,这个是监听 document.dispatchEvent 事件,决定什么时候开始预渲染
main.js中mounted触发 main.js中mounted触发
new Vue({
router,
store,
render: h => h(App),
//添加到这里,这里的render-event和vue.config.js里面的renderAfterDocumentEvent配置名称一致
mounted () {
document.dispatchEvent(new Event('render-event'))
}
}).$mount('#app')注意:
1、如果打包之后,刷新页面样式丢失,请配置对应的webpack的资源路径publicPath: '/',字段;
2、router.js里面把mode要改为:'history', 因为hash模式打包的时候会生成同样的页面;
prerender-spa-plugin原理探究
它是如何做到将运行时的 html 打包到文件中的呢?
- prerender-spa-plugin 利用了 Puppeteer[4] 的爬取页面的功能。 Puppeteer 是一个 Chrome官方出品的 headlessChromenode 库。它提供了一系列的 API, 可以在无 UI 的情况下调用 Chrome 的功能, 适用于爬虫、自动化处理等各种场景。它很强大,所以很简单就能将运行时的 HTML 打包到文件中。
- 原理是在 Webpack 构建阶段的最后,在本地启动一个 Puppeteer 的服务,访问配置了预渲染的路由,然后将 Puppeteer 中渲染的页面输出到 HTML 文件中,并建立路由对应的目录。
- 每个路由对应的 HTML,然后我们可以更改每个路由文件里的 title 、 meta keyword等 。
- 另外页面的内容都已经在 HTML 中直接呈现,也可以解决 js 等资源加载慢导致白屏的问题。
prerender-spa-plugin不能解决的问题
- 不同的用户看到不同的页面,动态数据页面(预渲染在获取用户权限数据之前就进行渲染了,所以这个不能)
- 动态路由也不可以(webpack编译的时候 路由还没挂载)
- 经常发生变化的页面,数据实时性展示(比如体育比赛等 我们现在的方式是前端拿到组件后进行组装数据,然后在进行渲染 像这种实时数据的会不准确)
- 路由过多,构建时间过长
静态页面分配title和meta标签----vue-meta-info
// 安装依赖
npm install vue-meta-info --save
// main.js中引入注册
import MetaInfo from 'vue-meta-info'
Vue.use(MetaInfo)
// 需要seo的组件中使用
<template>
...
</template>
<script>
export default {
metaInfo: {
title: '我是contact头', // set a title
meta: [{ // set meta
name: 'keyWords',
content: '我是contact关键字'
},
{
name: 'description',
content: '我是contact描述'
}],
link: [{ // set link
rel: 'asstes',
href: 'https://assets-cdn.github.com/'
}]
}
}
</script>如何才能吸引蜘蛛光顾我们的网站,如何才能让蜘蛛经常光顾我们的网站。这里提出以下几个优化点:
- 提交页面。提交页面又分为几种不同的方式
- sitemap提交。sitemap,顾名思义,就是网站地图,当蜘蛛来到我们的网站时,告诉它我们有多少页面,不同页面是按什么分类的,每个页面的地址是什么。顺着我们的指引,蜘蛛会很轻松的爬遍所有内容。另外,如果你的页面分类比较多,而且数量大,建议添加sitemap索引文件。如果站点经常更新添加新页面,建议及时更新sitemap文件;
- 主动提交。就是把你的页面直接丢给百度的接口,亲口告诉百度你有哪些页面,这是效率最高也是收录最快的方式了。但是需要注意,百度对每天提交的数量是有限制的,而且反复提交重复的页面,会被降低每日限额,所以已被收录的页面不建议反复提交。收录有个时间过程,请先耐心等待;
- 实时提交。在页面中安装百度给的提交代码,当这个页面被用户打开我,便自动把这个页面提交给百度。这里不需要考虑重复提交的问题。 以上几种提交方式可以同时使用,互不冲突。
googlesyndication.com 的引荐是指 DoubleClick 广告获得的点击次数。
渲染的几个名词
- CSR:Client Side Rendering,客户端(通常是浏览器)渲染;
- SSR:Server Side Rendering,服务端渲染;
- SSG:Static Site Generation,静态网站生成;
- ISR:Incremental Site Rendering,增量式的网站渲染;
- DPR:Distributed Persistent Rendering,分布式的持续渲染 如果需要改动的页面太多,给页面设置keywords和description的。也可以在router中配置,结合vuex去设置更加优雅一点。
谷歌
同国内其他统计服务一样,Google Analytics也提供包括流量来源、搜索关键词、访客资料、入口页面等,但除此之外我们还能看到下面这些参数:
SSR性能问题
- 每个请求都是n个实例的创建,不然会污染,消耗会变得很大
- 缓存 node serve 、 nginx判断当前用户有没有过期,如果没过期的话就缓存,用刚刚的结果。
- 降级:监控cpu、内存占用过多,就spa,返回单个的壳
- 服务器负载变大,相对于前后端分离务器只需要提供静态资源来说,服务器负载更大,所以要慎重使用 所以在我们选择是否使用SSR前,我们需要慎重问问自己这些问题: 需要SEO的页面是否只是少数几个,这些是否可以使用预渲染(Prerender SPA Plugin)实现 首屏的请求响应逻辑是否复杂,数据返回是否大量且缓慢
采用什么方法来进行单页面的SEO
起一个node服务,使用Prerender.io来应对爬虫
动态网站SEO解决方案经验汇总
基于Vue SEO的四种方案
SSR 学习 - 传统服务端渲染 Web 应用、客户端渲染、同构渲染、优缺点和案例演示
phantomjs实现服务端屏幕截图
利用PhantomJS做预渲染后生成的HTML如何保留交互效果
SSR解释-vue中如何实现SSR服务端的渲染?