目前百度spider抓取新鏈接的途徑有兩個(gè),一是主動(dòng)出擊發(fā)現(xiàn)抓取,二就是從百度站長(zhǎng)平臺(tái)的鏈接提交工具中獲取數(shù)據(jù),其中通過(guò)主動(dòng)推送功能 “收”上來(lái)的數(shù)據(jù)最受百度spider的歡迎。
對(duì)于站長(zhǎng)來(lái)說(shuō),如果鏈接很長(zhǎng)時(shí)間不被收錄,建議嘗試使用主動(dòng)推送功能,尤其是新網(wǎng)站,主動(dòng)推送首頁(yè)數(shù)據(jù),有利于內(nèi)頁(yè)數(shù)據(jù)的抓取。
那么同學(xué)們要問(wèn)了,為什么我提交了數(shù)據(jù)還是遲遲在線上看不到展現(xiàn)呢?那涉及的因素可就多了,在spider抓取這個(gè)環(huán)節(jié),影響線上展現(xiàn)的因素有:
1、網(wǎng)站封禁。你別笑,真的有同學(xué)一邊封禁著百度蜘蛛,一邊向百度狂交數(shù)據(jù),結(jié)果當(dāng)然是無(wú)法收錄。
2、質(zhì)量篩選。百度spider進(jìn)入3.0后,對(duì)低質(zhì)內(nèi)容的識(shí)別上了一個(gè)新臺(tái)階,尤其是時(shí)效性內(nèi)容,從抓取這個(gè)環(huán)節(jié)就開始進(jìn)行質(zhì)量評(píng)估篩選,過(guò)濾掉大量過(guò)度優(yōu)化等頁(yè)面,從內(nèi)部定期數(shù)據(jù)評(píng)估看,低質(zhì)網(wǎng)頁(yè)比之前下降62%。
3、抓取失敗。抓取失敗的原因很多,有時(shí)你在辦公室訪問(wèn)完全沒(méi)有問(wèn)題,百度spider卻遇到麻煩,站點(diǎn)要隨時(shí)注意在不同時(shí)間地點(diǎn)保證網(wǎng)站的穩(wěn)定性。
4、配額限制。雖然我們正在逐步放開主動(dòng)推送的抓取配額,但如果站點(diǎn)頁(yè)面數(shù)量突然爆發(fā)式增長(zhǎng),還是會(huì)影響到優(yōu)質(zhì)鏈接的抓取收錄,所以站點(diǎn)在保證訪問(wèn)穩(wěn)定外,也要關(guān)注網(wǎng)站安全,防止被黑注入。
新聞標(biāo)題:百度不收錄原因分析:spider抓取
標(biāo)題鏈接:http://redsoil1982.com.cn/news/241746.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信公眾號(hào)、外貿(mào)建站、搜索引擎優(yōu)化、品牌網(wǎng)站設(shè)計(jì)、小程序開發(fā)、域名注冊(cè)
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源:
創(chuàng)新互聯(lián)