百分百源码网-让建站变得如此简单! 登录 注册 签到领金币!

主页 | 如何升级VIP | TAG标签

当前位置: 主页>网站教程>网站优化> 百度是维护原创,网站建设原创内容的重要性
分享文章到:

百度是维护原创,网站建设原创内容的重要性

发布时间:06/10 来源:未知 浏览: 关键词:
百度是维护原创,网站建设原创内容的重要性

   本文内容主要分为下列五个大点:一、百度谈原创项目那点事;二、百度原创维护的进展;三、站长关于原创维护的差错认知;四、会员关于原创的态度;五、关于大型网站说维护原创更货真价实,对小站,说维护高质量内容更好。原创不断是大题目,往大了说,互联网生态环境日趋恶劣,采集伪原创低质量内容泛滥,重大挤占了优质原创资源的生存空间。导致互联网资源整体质量大幅下降,网民挨损、优质站长挨损、搜寻引擎亦挨损。往小了说,许多站长不断在进行原新建设,而得不到应有的维护。怎样加大对站点原创的维护以及怎样掂量原创是否能知足会员需求是一个艰巨的任务。为此,百度不断在进行原创维护和展示建设,由于这是会员的需求,只管进展迟缓,但客观看来,的确有很大的进步。那么百度是怎样维护原创的?下面谈谈百度原创那点事。 

  一、百度谈原创项目那点事

  1、搜寻引擎为何要注重原创
  采集泛滥化。来自百度的一项观察显示,超过80%的消息和资讯等都在被人工转载或机器采集,从传统媒体的报纸到文娱网站花边新闻、从游戏攻略到产品评测,甚至高校图书馆发的催还通知都有站点在做机器采集。可以说,优质原创内容是被包抄在采集的汪洋大海中之一粟,搜寻引擎在海中淘粟,是既困难又拥有挑衅性的事情。

  提高搜寻会员体验
  数字化降低了传播老本,工具化降低了采集老本,机器采集行为混同内容来源降低内容质量。采集历程中,出于无心或成心,导致采集网页内容残缺不全,格局错乱或附加垃圾等题目层出不穷,这已经重大影响了搜寻效果的质量和会员体验。搜寻引擎注重原创的基本缘由是为了提高会员体验,这里讲的原创为优质原创内容。

  激励原创作者和文章
  转载和采集,分流了优质原创站点的流量,不再具属原创作者的名称,会直接影响到优质原创站长和作者的收益。长期看会影响原创者的积极性,不利于翻新,不利于新的优质内容发生。激励优质原创,激励翻新,给予原创站点和作者合理的流量,从而增进互联网内容的繁华,理应是搜寻引擎的一个重要任务。

  2、采集很狡猾,辨认原创很困难
  采集假冒原创,篡改要害信息。目前,大量的网站批量采集原创内容后,用人工或机器的办法,篡改作者、发表工夫和来源等要害信息,假冒原创。此类假冒原创是需要搜寻引擎辨认出来予以恰当调整的。

  内容生成器,制造伪原创
  应用主动文章生成器等工具,“首创”一篇文章,然后安一个吸引眼球的title,此刻的老本也低得很,而且一定拥有首创性。然而,原创是要拥有社会共鸣价值的,而不是胡乱制造一篇基本不通的垃圾就能算做有价值的优质原创内容。内容虽然奇特,但是不具社会共鸣价值,此类伪原创是搜寻引擎需要重点辨认出来并予以打击的。

  网页悬殊化,构造化信息提取艰难  不一样的站点构造化悬殊比拼大,html标签的含义和散布也不一样,因而提取要害信息如标题、作者和工夫的难易程度差别也比拼大。做到既提得全,又提得准,还要最及时,在目前的中文互联网规模下实属不易,这局部将需要搜寻引擎与站长配合好才会更顺畅的运转,站长们要是用更清晰的构造奉告搜寻引擎网页的布局,将使搜寻引擎高效地提取原创相干的信息。

  3、百度辨认原创之路怎样走?
  成立原创项目组,打耐久战。面临挑衅,为了提高搜寻引擎会员体验、为了使优质原创者原创网站得到应有的收益、为了推进中文互联网的前进,我们抽调大量人员组成原创项目组:技术、产品、经营、法务等等,这不是临时组织不是1个月2个月的项目,我们做好了打耐久战的预备。原创辨认“发源”算法

  互联网动辄上百亿、上千亿的网页,从中开掘原创内容,可以说是海底捞针,千头万绪。我们的原创辨认系统,在百度大数据的云盘算平台上发展,能够迅速实现对全部中文互联网网页的反复聚合和链接指向关系剖析。首先,通过内容类似程度来聚合采集和原创,将类似网页聚合在一起作为原创辨认的候选汇合;其次,对原创候选汇合,通过作者、发表工夫、链接指向、会员评价、作者和站点的历史原创状况、转发轨迹等上百种因从来辨认判断出原创网页;最后,通过价值剖析系统判断该原创内容的价值上下进而恰当的引导终究排序。

  当前,通过我们的实验以及真实线上数据,“发源”算法已经取得了一定的进展,在消息、资讯等领域解决了绝大局部题目。当然,其他领域还有更多的原创题目期待“发源”去解决,我们坚决的走着。

  原创星火规划
  我们不断致力于原创内容的辨认和排序算法调整,但在目前互联网环境下,迅速辨认原创解决原创题目的确面对着很大的挑衅,盘算数据规模巨大,面临的采集方式层出不穷,不一样站点的建站方式和模版悬殊庞大,内容提取复杂等等题目。这些因素都会影响原创算法辨认,甚至导致判断出错。这时候就需要百度和站长共同努力来保护互联网的生态环境,站长举荐原创内容,搜寻引擎通过一定的判断后优待原创内容,共同推动生态的改进,激励原创,这就是“原创星火规划”,旨在迅速解决目前面对的重大题目。另外,站长对原创内容的举荐,将利用于“发源”算法,进而帮忙百度发明算法的不够,一直改善,用更加智能的辨认算法主动辨认原创内容。

  二、百度原创维护的进展  原创星火规划一期和发源算法出来都有段工夫了,当前主要遮盖的都是一些大型的消息类站点,当前,原创星火规划取得了初步的结果,一期对局部重点原翻新闻站点的原创内容在百度搜寻效果中给予了原创标志、作者展现等等,并且在排序及流量上也取得了合理的晋升。百度LEE也表示原创发源算法,也让这些优质的网站有了一个比拼好的收益。

  1、原创星火规划上线先后的同期流量对照显示,原创url流量增长显明。  

   2、原创星火规划上线后一段工夫内原创url流量增长显明并逐步趋于平稳。  
   这个是一个小范畴的数据,我们在来宏观的看看。2013年,中国低质网站泛滥,在低质网站中采集及作弊站点泛滥两种共占比高达80%。恶劣采集站占到40%之多,采集站、作弊站点、垃圾无价值站点在整个互联网资源环境中的比例越来越高,且有主导趋势,优质资源的空间在一直减小。优质站长挨损,原创内容挨到很大的阻碍。2014年,作弊站和采集站占比35%,有所遏制,采集站下降了16%,百度关于原创的宣扬维护起到了很大的结果,然而无价值站点越来越多,在一定程度上也是“原创”惹的祸,背面细说。  

  三、站长关于原创维护的差错认知

  1、原创内容不等于高质量内容
  网页主体内容是网页的价值所在,百度主要从下列角度评论网页内容质量:内容制作老本上下;内容是否有效、完备丰硕;是否原创;信息是否真实有效;是否权威或投入较多专业的知识和经验;是否存在作弊行为。关于页面的主体内容价值,原创二字并没有怎么突出。  什么内容算质量高?内容质量高:内容质量好的网页,破费了较多工夫和精神编辑,倾泻了大量经验和专业知识,内容清晰、有效、完备且丰硕。例如:专业医疗网站发表的内容丰硕的医疗专题页面、资深工程师发表的完备解决某个技术题目的专业文章、专业B2C网站上,完备有效的商品购置页、权威消息站原创或经过编辑整理的热点消息报道、经过网友认真编辑,内容丰硕的百科词条。

  而对内容质量高的定义压根都没有原创这个规范。原创只是一个高质量内容的简略说法,或者说是高质量内容的更好一个条理。你的内容质量高又是原创那当然最佳,但反过来就比拼尴尬了,是原创但质量低,这是百度维护原创以来许多站长涌现的一个题目,整天捣鼓原创,以为原创内容等于高质量内容,殊不知站点原创度在晋升,但站点价值却在下降。  前面也说了2014无价值站点越来越多,这其中不乏站长关于原创内容的差错相识,由于不是每一个人都能原创出高质量的内容。原创二字只是高质量网页内容的一个非必须特征,能在一定程度上反馈网页内容的稀缺度,但原创并非一定稀缺,原创更不能代表高质量的内容的所有特性,这些一定要了解。

  2、原创内容不等于收录
  网站更新的内容是原创的就一定收录,这种相识其实是差错的,而且非常差错。总有许多人埋怨我的原创文章怎么不收录?也有的埋怨为何他人复制我的就收录了?第一个题目其实很简略,为何要收录你的?你本人写的这个老掉牙的东西,排版凌乱、还要加载半天,读完都晓得说的什么,这样的原创对搜寻引擎对会员有什么价值?没有解决以为题目,只是在那自我沉醉,感觉本人文彩多好。而且这跟你整体网站的权值,构造,历史体现,里外链等都有关。

  第二个题目为何他人复制我的就收录了?就是他人把你的内容放到本人网页后,这个网页比你那个网页多了一些你没有的,也就是添加了附加价值,可能他的网站信用度比你高,可能构造比拼好,可能没那么多弹窗,可能会员可读性更强等等。内容质量高不高不由原创决议,搜寻引擎收不收录那就更不是原创决议,至于百度为何不收录你的网站,需要从多方面去思索,而不仅仅看是否原创。要真要说原创二字与收录的关系,那我只能说原创的可能反复度低,仅此而已,但这不是百度收录你的理由。

  3、原创内容不等于排名
  无论是百度搜寻质量白皮书对网页的内容质量、网页阅读体验、可访问性进行掂量,然后排序;还是百度搜寻研发部在谈互联网页面价值时指出的挨众群大小、页面稀缺程度、页面质量上下、页面时效性四个排序规范;或者是站长圈里谈到的页面根基得分、站内得分、站外得分、会员得分这四个网页的综合排名得分因素。我们可以发明页面内容质量不断只是众多百度网页排名因素中的一个,而原创又只是页面内容质量形成的一小局部。

  经常会听到有人说,“我的原创文章怎么没有排名?”、“为何我坚持原创,排名却不好”。事实上许多人都有这个题目,有时候我也有。做好优质原创内容的确是一个提高网站排名延续有效的办法,但这只是一个办法,哪怕是你不断延续更新优质原创,也只是说理论上排名会好起来,没有哪一个搜寻引擎曾通告:只有你有优质原创内容,我就给你好排名。影响排名的因素非常多,只管内容是做网站的重中之重,但你不能保证你的网站不会有其他因素影响你的排名,比方构造,比方加载速度,甚至被黑。

  网站原创这一个价值大放异彩不一定就能在页面排序大战中脱颖而出,需要综合各方面因素,我想这一点大家都明确。况且我刚刚不断假如的是优质原创,延续的高质量内容,要是仅仅只是你以为的原创,按照上面说的原创内容不等于高质量内容,是不是更加悲剧了呢?  

   4、百度直接辨认发表工夫肯定原创不就行了吗?

  许多人可能说:辨认原创还不容易,看谁先发表的,辨认发表工夫不就行了吗?百度就是关照大网站,辨认原创都是假的。我只能说,你把原创辨认判断想得太容易了。百度Lee也说过,发表工夫现实上早就已经辨认,单纯靠发表工夫是没法判断原创性的。

  前面说了百度原创辨认系统在百度大数据的云盘算平台上发展,首先,通过内容类似程度来聚合采集和原创,将类似网页聚合在一起作为原创辨认的候选汇合;其次,对原创候选汇合,通过作者、发表工夫、链接指向、会员评价、作者和站点的历史原创状况、转发轨迹等上百种因从来辨认判断出原创网页。发表工夫工夫仅仅是这上百种因素中的一个,想直接通过辨认发表工夫肯定原创,你想得太容易了。

  互联网动辄上百亿、上千亿的网页,从中开掘原创内容,可以说是海底捞针,而且辨认原创历程非常复杂,更是难上加难。百度的确不断致力于原新建设,不是为你,而是为了百度本人。但解决原创题目的确面对着很大的挑衅,盘算数据规模巨大,面临的采集方式层出不穷,不一样站点的建站方式和模版悬殊庞大,内容提取复杂等等题目都会影响原创算法辨认,甚至导致判断出错。所以才会涌现许多原创假象,这也是没方法的,对原创的维护的确是一个非常艰巨的题目,谷歌研究原创这么多年,照旧是勉勉强强,原创维护仍是个长久题目。

  说完站长关于原创的相识,再说说会员的态度,都是我们在争执原创,有没有想过是创给谁看的呢?还不是给我们的会员看,那他们是怎么想的呢?  四、会员关于原创的态度  说一句不怎么好听的话,此刻的大局部网站,包括参加百度星火原创规划的网站,有多少是纯原创呢?大多都是由原创、投稿、编辑、英华文章转载等组成,也不都是原创。相反要说纯原创,我看它们还不如一些苦哈哈的小站站长,天天辛辛劳苦在那搞创作。但为何会员要看他的不看你的?  会员在乎什么?会员在看内容时会在乎原创吗,还是你觉得会员在乎?会员在乎的应当是内容对他有没有价值?有用没有用?而不是谁供给的这个内容,这个天下上的人最体贴的都是本人,会员找内容最体贴的一样是内容给本人带来的利益,至于原创者是谁恐怕只要原作者最体贴。

  你需要查一个东西,你去找内容,找到了,而且你非常满意,这就够了。至于这个内容是不是原创,你会在意吗?我不会,我会觉得这个网站不错,内容非常好,珍藏一下,下次继续来。有时候看到了原作者以及某些文章的原文出处,我也不会再去点,由于这里已经知足我的需求了,而且这里的速度、排版、构造都非常不错,我何必去找原内容。会员是懒的,没人整天在那找作者,他们找的是有价值内容,这就是为何此刻越牛的网站越不小气留原创地址,由于既然原作者在乎,他留就是了,反正他和他的会员都不在乎。  

   所以说整天争原创有什么意义了呢,是你的原创会员就得看?会员不是在找原创,他是在找有价值能解决他此刻题目的内容。打个比如,一个会员在找对于京东上市的信息,效果在新浪消息找到了,非常好,但文章下面写着内容来自京东论坛,这个会员会不会说:我X,不是原创,本来是来自京东的,垃圾,再也不看新浪消息了?我想不会,作为会员,只有有价值,原创who care?

  五、关于大型网站说维护原创更货真价实,对小站,说维护高质量内容更好  在我看来,关于大型网站说维护原创更货真价实,对小站说维护高质量内容更好,为何这么说,由于百度强调原创是要拥有社会共鸣价值的,而不是胡乱制造一篇基本不通的垃圾就能算做有价值的优质原创内容。关于大型网站,百度知根知底,信用度高,有权威,会员群体大,历史体现好,所以大多原创展示,原创发源算法都产生在大型网站上,由于技术跟不上,所以局部网站会提早维护,就像参加星火原创规划的都是大型网站,由于可信度高,成功率高。

  而关于小型网站,我觉得更多的是激励站长新建优质的内容,由于想要被维护,首先就必须有优质的内容做支持,不然何谈百度需要的原创。仔细的朋友在前面可能发明,百度每次提到原创都会加上低质、高质量等词,比方“原创高质量内容”、“伪原创低质量内容”、“高质原创”等。为何每次说原创都要带上这些词?由于百度也怕误导站长,也怕站长像前面说的只看到原创二字。这不是百度的目的,百度注重维护原创的基本缘由是为了提高会员体验,原创不是目的,但愿小站新建优质内容才是目的,所以百度讲的原创也不断是优质原创内容。

  激励小站原创,维护网站原创到不如说是维护高质量内容,杜绝垃圾采集内容,这么说可能更好,由于高质量内容还有个谱,但是原创以及原创判断真的是一个没谱的事。

  原创维护确定会是百度一个长期的规划,不可能一步到位,所以站长们一定要心态摆正,不要整天自觉原创+埋怨,会员真正要的不是原创,要的是有价值的内容,百度也只是借维护原创来晋升互联网高质量内容,原创只是一个措施,不是效果,不是终究的目的,百度维护原创是为了保持互联网生态、激励站长。站长们做原创是为了能给会员有价值奇特的内容,这些才是效果。

  关于站长而言,不要太多的考虑什么原创不原创,只需要依据会员需求给他们有价值的内容就行了,原创不能注明什么,原创不一定就好。就拿百度来说,百度晓得、百度百科、百度文库、百度网盘等有多少是原创的内容?许多都不是原创,那为何流量会那么高呢?由于这些平台的这些内容知足了会员的需求。在内容建设的时候,内容质量度和可读性都是网站经营的要害因素,不要一味的在那揣摩所谓的原创而忽视了会员,忽视了内容自身的质量。会员体验是将来的开展方向,搜寻引擎要知足的是会员,网站要知足的也是会员,所以只有网站内容能延续知足会员需求,获得会员青睐,网站在搜寻引擎那的展示也不会有什么太大题目。保不维护也没多大关系。

  这其中就有一个伪原创的题目,许多站长不屑,以为这是剽窃。其实从会员的需求出发,开掘关于会员有价值的内容是许多人都在做的,而且会经常开掘他人的优质内容,这个东西对我的会员很有价值,为何不用?他人用了你就不用了,那这个互联网的资源对你来说恐怕没多少了。你可以称之为伪原创,可以称之为整合,也可以叫它从新包装,但这不是剽窃,不是直接援用他人的就完事了,重点要比他人做得更好,更拥有竞争性。成功借用他人的成果不是让你剽窃,而是放大它的长处,填补它的缺陷,联合本人的优势,让内容更加完备更有价值。要是只是长期挪用他人的内容,做得尚无他人好,这才叫做剽窃。

打赏

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

百分百源码网 建议打赏1~10元,土豪随意,感谢您的阅读!

共有160人阅读,期待你的评论!发表评论
昵称: 网址: 验证码: 点击我更换图片
最新评论

本文标签

广告赞助

能出一分力是一分吧!

订阅获得更多模板

本文标签

广告赞助

订阅获得更多模板