在公司許多網(wǎng)站seo優(yōu)化工作中,有一項日常工作就是對網(wǎng)站死鏈接(無法訪問的鏈接或者是404錯誤的頁面)進行檢測和檢查。這是因為在搜索引擎抓取網(wǎng)站鏈接時,百度蜘蛛會從一個進入網(wǎng)站的分支中形成多個分支,并通過網(wǎng)站內(nèi)部鏈接路徑進行深入抓取。如果遇到錯誤的鏈接則會停止在抓取下去,則會導(dǎo)致搜索索引量的降低
百度Spider模擬真實用戶抓取頁面的方式。想象一下,如果百度Spider在爬行時遇到多個無法打開的頁面,它會高興嗎?同樣網(wǎng)站上存在過多的死鏈接,會影響百度蜘蛛的友好度,降低百度蜘蛛在網(wǎng)站上的爬行頻率,影響網(wǎng)站的網(wǎng)站排名,甚至降低網(wǎng)站本身的權(quán)重和關(guān)鍵詞排名。
什么是網(wǎng)站鏈接?
一個網(wǎng)站生成(或指向)的所有URL地址都可以稱為網(wǎng)站鏈接、渠道頁、目錄頁、文章列表頁、文章內(nèi)容頁、標(biāo)簽標(biāo)簽頁、內(nèi)容聚合頁。這里所指的網(wǎng)站鏈接還包括網(wǎng)站的對外鏈接,如:其他網(wǎng)站的友好鏈接、ICP備案信息鏈接、工信部網(wǎng)站等。
什么是網(wǎng)站上的死鏈接?
一般來說,無法打開的網(wǎng)站頁面(即頁面內(nèi)容不存在)可以稱為“網(wǎng)站死鏈接”。其中一些鏈接被標(biāo)識為404頁面,而另一些則不是。我們討論的網(wǎng)站死鏈接也包括到其他網(wǎng)站的鏈接(出站鏈接)。如果無法訪問,也可以稱為“網(wǎng)絡(luò)死鏈接”。
網(wǎng)站的死鏈接是如何形成的?
在網(wǎng)站的實際運營維護中,修改網(wǎng)站url規(guī)則,調(diào)整目錄名稱(或目錄別名),刪除網(wǎng)站目錄或文章,在寫頁面url時手動滑動頁面url,這些操作都可能在網(wǎng)站上形成死鏈接。另外,要經(jīng)常更新站點地圖,清除站點緩存,更新目錄頁、列表頁、通道頁等,否則會出現(xiàn)網(wǎng)站死鏈接。最后一點是要經(jīng)常檢查外部鏈接(這里指網(wǎng)站的出站鏈接);如前所述,網(wǎng)站的出站鏈接也是網(wǎng)站死鏈接的范圍,也會影響網(wǎng)站的權(quán)重。
如何檢查網(wǎng)站的死鏈接?
綜上所述,檢查網(wǎng)站的死鏈接似乎是一項非常重要和艱巨的任務(wù)。你可以選擇手動檢查網(wǎng)站的死鏈接(手工檢查),但這是在檢查你是不是變老了。有沒有一種快速、高效、智能的方法?這個問題的答案是肯定的。下面,我們將列出一些檢查網(wǎng)站死鏈接的方法、工具和方法。
網(wǎng)站的死鏈接檢查工具是什么?
1、瀏覽器插件:這里特別指出是運行于360瀏覽器(極速版)插件,在插件中心https://ext.chrome.# 頁面右側(cè)的搜索框中輸入“死鏈”開始搜索,在頁面中間位置會出現(xiàn)兩個和“死鏈”有關(guān)的插件;下圖中藍色方線框選的部分;
2、站長平臺(網(wǎng)站)在線工具:
站長之家死鏈檢測工具 http://tool.chinaz.com/Links
愛站網(wǎng)死鏈檢測 https://tools.aizhan.com/bl/
3、獨立運行的死鏈檢查工具:
軟件Xenu,這是一款為網(wǎng)站死鏈接檢查而生的工具,目前僅可在Windows系統(tǒng)下運行。
Broken Link Detector(死鏈接檢測工具),這款軟件是英文界面對站長們的英文水平有所要求;可以幫助用戶在電腦上分析鏈接的軟件,而且可以將錯誤的鏈接(網(wǎng)站死鏈接)獨立顯示,并且可以將地址保存到TXT文件 或者是CSV文件。
4、百度等搜索引擎站長平臺:
http://zhanzhang.so.com/
http://zhanzhang.sogou.com/
https://ziyuan.baidu.com/
網(wǎng)站死鏈如何處理?
1、收集死鏈
前面所做的網(wǎng)站死鏈查檢工作,都是為這一步做準(zhǔn)備,那些網(wǎng)站死鏈要如何處理呢?通過網(wǎng)站死鏈檢測工具(網(wǎng)頁版在線檢測工具或軟件版)檢測后,逐個手動打開并查看是什么原因?qū)е碌摹?/p>
2、向搜索引擎提交死鏈地址
同時將確定為死鏈的頁面URL地址保存至TXT文件中,提交至各大搜索引擎https://ziyuan.baidu.com/badlink/index (這里以百度站長平臺為例),這個操作是為了 告訴搜索引擎,這些URL地址不要再次抓取了,是錯誤的、不能正常打開的頁面。
3、設(shè)置404頁面告知搜索引擎
網(wǎng)站設(shè)置404頁面,并將錯誤頁面導(dǎo)向至網(wǎng)站上其他可以打開的頁面。這樣做可以通過404碼告訴蜘蛛該頁面是不正常的,同時可以降低網(wǎng)站用戶流失率。
4、更新robots.txt協(xié)議文件
將網(wǎng)站死鏈URL地址存儲于網(wǎng)站機器人協(xié)議robots.txt文件中,并設(shè)置為蜘蛛禁止抓取,即屏蔽蜘蛛訪問這些URL地址。
