chazhan123 发表于 2022-3-9 13:57:04

传统SEO可以在自己的站点上做什么

我们现在如果去注册 seo、sem、自媒体 这样名称的公众号,要嘛被人抢占了,要嘛因为各种政策原因或法律原因不让注册。



因此我们需要退而求其次,注册这些目标领域里的大词而不是主词,它们实际上也有很大体量的搜索,同时流量更加精准,商业价值更高。



当然:



如果我们只是选择一个seo,立刻能想到“seo优化”这种有商业价值的大词,那么实际上别人也能想得到,搜索一下马上就失望了。



因此我们需要一批领域、一个领域提取一批大词,大批量的词汇里才能找到别人遗漏的。



那么如何提取领域大词呢?



步骤3

当我们面对一个领域想要得到这个领域的大词,比如seo,靠想是不应该的,因为我们不可能对那么多领域都知根知底如数家珍,而且再熟悉的领域,一时也可能会有遗漏的。



因此,交给程序是最适合的。



当我们有一份50万条“seo”相关长尾词的数据,如何把这个领域的常见词根提取出来呢?



词频,这是比较直接的,最高词频就是常见的。



但是,词频数据首先要基于分词,可分词技术只能识别已登录词(可以理解为它认识的),对于很多领域的专业术语是识别不出来的。



它可能认得“优化”、“排名”这些词,因为这些词不只是这个领域的常见词,但是它大概率不认得“霸屏”这个词,可这还是这个领域的常见词。





在这里,我们引入新词发现技术,这个算法我们后续文章再聊,简单来说:它会根据数据里的文本分布,结合左右邻文本和整体出现频率,用概率的方式计算一段文本是不是一个词汇。



当我们把一份seo相关数据给它时,它可以返回这样一份数据(限定返回TOP100个):



TOP前的词汇一般都是正确的,但是这些词汇是按照概率返回的,不一定是seo领域主要的、常见的。



所以我们只需要再根据词频排序(领域常见的词频就比较高):

可以看到TOP前的大都是seo这个领域常见、重要、主要的词汇,即:这个领域聊来聊去都是在聊这些的词汇,提供的数据越多越丰富,结果越准确。



这个算法我有封装了一个小工具,给它数据(给一批也行),就返回相应的词汇,可以限制数量,可以做词汇过滤:

工具除了这个作用以外,还适合提取出大词,用于深挖领域长尾词,而新词发现的功能还可以用于其他地方,后续再介绍。查站网

页: [1]
查看完整版本: 传统SEO可以在自己的站点上做什么