2014-01-16 分類: 網(wǎng)站收錄
你是怎么去學(xué)習(xí)做seo優(yōu)化的呢?入門第一步是什么還記得嗎?是不是去買一本關(guān)于“seo優(yōu)化”的書(shū)籍去看,發(fā)現(xiàn)一開(kāi)端就會(huì)講到的根底概念,讓你云里霧里,想要強(qiáng)記下來(lái)發(fā)現(xiàn)徹底不能理解?
大多數(shù)沒(méi)人帶想自學(xué)的朋友都會(huì)有這樣一個(gè)苦楚的開(kāi)端。而來(lái)佛系站長(zhǎng)的新人,咱們一般都是安排這些新人從寫(xiě)文章開(kāi)端,先寫(xiě)再講概念,培訓(xùn)的時(shí)候也會(huì)多次說(shuō)到這些概念結(jié)合優(yōu)化技巧來(lái)講。再翻根底書(shū)籍的時(shí)候,才會(huì)清楚里邊講的究竟是些什么,并且你會(huì)發(fā)現(xiàn),不同的階段看同一本書(shū),感觸會(huì)徹底不相同,這就是“溫故而知新”了。
但在這期間也會(huì)有新人不按常理出牌,覺(jué)得我會(huì)這些技巧就行了,為什么還要去理解概念呢?
原因很簡(jiǎn)單,概念是技巧描繪的總結(jié)和濃縮,它的一個(gè)字或兩個(gè)字就會(huì)代表一個(gè)操作。現(xiàn)在您問(wèn)身邊的優(yōu)化人員,爬行是什么?抓取是什么?索引是什么?收錄是什么?他能描繪的清楚嗎?
當(dāng)然,并不是說(shuō)說(shuō)不清楚就代表他優(yōu)化能力不行,而是他的“輸出”能力不行,也就是不會(huì)總結(jié)。總結(jié)的越精辟也代表他對(duì)這塊業(yè)務(wù)的理解更深刻。那么今天,佛系站長(zhǎng)就帶你來(lái)重溫這些根底概念,希望能給初學(xué)者和沒(méi)有“輸出”主意的朋友提個(gè)醒。
爬行是什么?
爬行指的是搜索引擎蜘蛛從已知頁(yè)面上解析出鏈接指向的URL,然后沿著鏈接發(fā)現(xiàn)新頁(yè)面(也就是鏈接指向的URL)的過(guò)程。當(dāng)然,蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬曩昔抓取新頁(yè)面,而是把發(fā)現(xiàn)的URL存放到待抓地址庫(kù)中,蜘蛛依照一定順序從地址庫(kù)中提取要抓取的URL。
抓取是什么?
抓取是搜索引擎蜘蛛從待抓地址庫(kù)中提取要抓的URL,拜訪這個(gè)URL,把讀取的HTML代碼存入數(shù)據(jù)庫(kù)。蜘蛛的抓取就是像瀏覽器相同打開(kāi)這個(gè)頁(yè)面,和用戶瀏覽器拜訪相同,也會(huì)在服務(wù)器原始日志中留下記載。
索引是什么?
索引指的是將一個(gè)URL的信息進(jìn)行收拾,存入數(shù)據(jù)庫(kù),也就是索引庫(kù),用戶搜索時(shí),搜索引擎從索引庫(kù)中提取URL信息并排序展示出來(lái)。
收錄是什么?
從搜索引擎視點(diǎn)看,URL被收錄了,也就是這個(gè)URL的信息在索引庫(kù)中存在。
沒(méi)有被抓取的頁(yè)面是能夠被索引的
也就是說(shuō),蜘蛛沒(méi)有拜訪和抓取這個(gè)頁(yè)面(比方被robots文件制止抓取),這個(gè)頁(yè)面卻有信息存在索引庫(kù)中,用戶搜索時(shí)還能看到。
比方,淘寶整個(gè)網(wǎng)站用robots文件制止百度蜘蛛抓取,但沒(méi)有用noindex制止索引,所以即便百度沒(méi)有拜訪和抓取淘寶頁(yè)面,但淘寶許多頁(yè)面是被百度索引的,用戶能夠搜到的:
百度從網(wǎng)上那么多鏈接知道淘寶主頁(yè)的存在,通過(guò)鏈接的錨文字也知道這個(gè)頁(yè)面標(biāo)題大概是淘寶之類的,當(dāng)然更知道百度口碑里的點(diǎn)評(píng)數(shù)。所以即便百度蜘蛛沒(méi)有抓取淘寶主頁(yè),用戶還是能搜到,并且顯現(xiàn)一些百度知道的信息。
要想百度不能回來(lái)淘寶主頁(yè)該怎么辦呢?撤銷robots文件的制止抓取,頁(yè)面上用noindex制止索引。
被抓取的頁(yè)面是能夠不被索引的
最常見(jiàn)的就是上面說(shuō)過(guò)的,頁(yè)面頭信息運(yùn)用noindex制止索引,頁(yè)面被抓取,讀到noindex后,不被索引,不會(huì)在搜索成果中回來(lái)。老頁(yè)面新加noindex也不是馬上刪除索引,還會(huì)保留索引一段時(shí)刻,但不會(huì)回來(lái)在搜索成果中。
加了noindex的頁(yè)面上的鏈接是能夠被跟蹤一段時(shí)刻的,但時(shí)刻長(zhǎng)了,有noindex的頁(yè)面搜索引擎或許就不再抓取和索引了,上面的鏈接也就無(wú)效了。
還有或許是因?yàn)轫?yè)面內(nèi)容是抄襲、轉(zhuǎn)載、低質(zhì)量的,搜索引擎雖然抓取了頁(yè)面,索引過(guò)程中檢測(cè)出這些內(nèi)容問(wèn)題,被丟棄,沒(méi)有被索引。所以頁(yè)面沒(méi)有被收錄,一般要先查看原始日志,看看是否被抓取過(guò),假如被抓取過(guò),或許是內(nèi)容質(zhì)量問(wèn)題,假如底子沒(méi)被抓取,主張先看看網(wǎng)站結(jié)構(gòu)是否有問(wèn)題。
說(shuō)了這么多,是不是暈了?別暈別暈,這些對(duì)于你做seo優(yōu)化的時(shí)候會(huì)有許多協(xié)助的,不要以為一個(gè)概念是句廢話,實(shí)際上是經(jīng)過(guò)前人不停試驗(yàn)出的總結(jié),最難的是那些沒(méi)有界說(shuō)的當(dāng)?shù)?,你無(wú)法判定是對(duì)是錯(cuò)。
分享題目:說(shuō)不清楚SEO的爬取收錄和索引?
網(wǎng)頁(yè)URL:http://redsoil1982.com.cn/news7/5557.html
網(wǎng)站建設(shè)、網(wǎng)絡(luò)推廣公司-創(chuàng)新互聯(lián),是專注品牌與效果的網(wǎng)站制作,網(wǎng)絡(luò)營(yíng)銷seo公司;服務(wù)項(xiàng)目有網(wǎng)站營(yíng)銷、網(wǎng)站收錄等
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容