chazhan123 发表于 2022-3-9 14:01:15

不存在SEO层面的技术问题

新词算法根据提供的数据计算,它有可能直接计算出“seo优化”这样一个组合词(如果这个组合在数据里出现足够多的频率)。



因此我们需要挨个判断一下:如果seo这个领域返回的某个词有包含seo,那就不需要组合了,它一定是个常见组合词,反之,需要把“seo”组合进去。



但是这又会有个问题:当它出现“优化”这个词时,到底要让程序把“seo”放前面还是放后面呢?



人工显然知道放哪里,但这是程序自动执行的,需要给它判断条件才行,否则就可能会组合出“优化seo”,要是碰到“书籍”,出现“英语”,然后组合出“书籍英语”,这就很尴尬了。



行业不同,很多表述千奇百怪,一味放前或放后都不行,需要灵活判断。





在这里我们运用一个简单的策略,基本可以做到万无一失:



我们分别把“seo”放到前面和后面,会得到“seo优化”和“优化seo”,然后把这两个组合词拿到原始数据里统计词频。



看看哪一个组合词的词频高,词频高代表“这个描述更常见”,取词频高的那一种作为组合结果。



同时,因为“优化”这个词是来源于seo里的高频词汇,与“seo”组合并经过词频比较,得出来的组合词一定是通顺自然的。



运用这种方式就不可能得到“书籍英语”这样的结果,毕竟在一份正常的行业内容数据里,“英语书籍”这个文本怎么都会比“书籍英语”来得更常见。



这个步骤在上述工具里会自动执行!查站网

页: [1]
查看完整版本: 不存在SEO层面的技术问题