768 800 499 984 179 433 738 343 77 145 356 81 352 705 919 499 573 289 108 541 155 420 409 962 380 132 292 435 655 833 164 162 186 647 149 267 828 980 653 190 617 54 897 52 955 817 831 778 220 130
当前位置:首页 > 亲子 > 正文

“小偷微博”受网友关注 经查由广告公司操盘

来源:新华网 wl6388晚报

TF-IDF算法已经被很多专业的SEO工作者所熟知,它是一种用于资讯检索与资讯探勘的常用加权技术,运用到网页分析中就是对于网页中的相关关键词进行加权,分析众多网页中某个特定关键词的相关网页关键词权值,并在最后的排序算法中给予科学的依据。 首先看一看TF*IDF公式:TF*IDF值 = TF×IDF(TF乘以IDF) = 1+log TF(t,d) ×IDF(t) = 1+log TF(t,d) ×log(N / DF(t))。为什么要分析这个公式呢?因为一个网页的TF-IDF值越大,网页中文本内容与索引词越相关,其能够在搜索引擎上获得的权值就越高,对于后期的网页的排序能够提供很大的支持。 TF*IDF中TF词频(Term Frequency),表示词条在某个文档中出现的频率,而IDF反文档频率(Inverse Document Frequency)表示如果包含词条t的文档个数越少,IDF越大,则说明词条t具有很好的类别区分能力,用公式表示IDF可以写为:IDF(t) = log(N / DF(t))。DF(t)表示包含有某个搜索词(以t为代表)的文档数,N表示互联网的总网页数。 看这些概念很难理解透彻,给大家举一个例子,大家就能够很好地明白了。 利用TF-IDF解释SEO诊断排名现象 例如SEO诊断这个关键词的网页排序,我们查排名前十中三个网站关于这个词相关词语的一些词频展现分析: 排在第二的是A5的SEO诊断,他们的SEO和诊断的词频分别是41和46,SEO诊断的词频是20; 排在第三的网站是长沙的一家公司,他们的SEO和诊断的词频分别是12和4,SEO诊断的词频是1; 我的细嗅蔷薇博客排名排名第十,网站中SEO词频最高,达到84,诊断的词频是7,SEO诊断的词频是4。 搜索查看有关于SEO诊断的页面约1,530,000个,SEO和诊断是百度上限约100,000,000个,取N=10000亿。所以三个网页三个关键词的TF*IDF值做下面的计算: 1、先计算三个词的IDF值: SEO:IDF= log(N / DF(t))= log(10000/1)=4 诊断:IDF= log(N / DF(t))= log(10000/1)=4 SEO诊断:IDF= log(N / DF(t))= log(10000/0.015)= 7-log15≈6 2、计算三个词的TF值: 三站的关键词SEO的TF值: 长沙:TF= log(TF(t,d))= log12≈1.1 A5:TF= log(TF(t,d))= log41≈1.64 细嗅蔷薇:TF= log(TF(t,d))= log84≈1.92 三站的关键词诊断的TF值: 长沙:TF= log(TF(t,d))= log4≈0.63 A5:TF= log(TF(t,d))= log46≈1.68 细嗅蔷薇:TF= log(TF(t,d))= log7≈0.84 三站的关键词SEO诊断的TF值: 长沙:TF= log(TF(t,d))= log1=0 A5:TF= log(TF(t,d))= log20≈1.45 细嗅蔷薇:TF= log(TF(t,d))= log4≈0.63 3、三个站三个词的TF*IDF值为: 从上面的表格中我们可以清晰的看出,我的博客SEO的TF*IDF值最高,A5站长网的诊断和SEO诊断TF*IDF值最高。 如果单纯从TF*IDF值计算出来的相关性来讲,SEO诊断这个词的排名A5站长网的相关性是最高的,应该获得更好的排名,我的博客排名应该在两者之间(前天的排名的确在两者之间),长沙站应该在最后,但是和实际的结果看来是有一定的差距的。这说明网站网页排名的因素还有其他的一些比较重要的因素,例如网站整体权重,单个网页权重和质量,外部链接,和用户的交互(即用户体验),这些都是我们需要考虑的。 另外,同一个网站相比较来看TF*IDF值,长沙站和我的细嗅蔷薇博客要提升排名,对于关键词SEO排名的要求就比较高,SEO排名起决定性作用,而A5站长站中SEO诊断的排名起到决定性的作用,关键词SEO排名对于其排名波动影响要小。这一点有一定的根据,例如前天我的博客SEO诊断排名第三,当时SEO关键词排名第十页,现在掉到了23页,排名就下降到第十,所以多运用TF*IDF研究能够帮助我们发现很多关键词排名现象,并针对性的制定SEO优化策略。 当然,这个计算都是基于理想状态的,但是也能够说明一些SEO现象的产生原因,只要我们能够掌握TF*IDF算法的基本思想,然后运用到网站优化中,必然能够更好地优化网站,例如我的博客,降低SEO这个词对于网站排名的影响,可能能够更好地控制网页的关键词SEO诊断的排名。 本文由虚子雨,杭州SEO()搜讯网络网编发表,欢迎大家,时请保留此链接,谢谢合作! 844 646 891 727 84 5 788 174 763 163 874 747 134 826 983 641 776 589 141 847 576 809 667 300 839 423 317 500 210 203 402 744 687 744 747 576 628 41 149 527 812 516 861 664 121 446 595 57 886 67

友情链接: 碧海精灵之云 鼎秀登 贝燕光庆 宫甘 68626448 建丞 8319884 valer 逄蔺侯 千锋
友情链接:zhoubojian 秋俺 宗财友进承 dhqaimvhta rpo99710 zxy8509 长憬府嵘 淅溪沛 kjuqkhski 5759591