2015年5月25日,百度站長平臺發布公告,宣布全面放開對HTTPS站點的收錄,HTTPS站點不再需要做任何額外工作即可被百度抓收。采用了本文之前建議的HTTPS站點可以關閉HTTP版,或者將HTTP頁面跳轉到對應的HTTPS頁面。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
百度搜索引擎目前(qian)不主動抓取(qu)HTTPS網頁,導致(zhi)大部分(fen)HTTPS網頁無(wu)法收(shou)錄。但是如(ru)(ru)果網站一定要使用HTTPS加密協議的話該如(ru)(ru)何做到(dao)對百度搜索引擎友好呢。其實很簡單:
1,為需要被百度搜索(suo)引擎收(shou)錄的(de)HTTPS頁(ye)面制作HTTP可訪問版。
2,通過user-agent判斷來訪者,將Baiduspider定向到HTTP頁面,普通用戶通過百度搜索引擎訪問該頁面時,通過301重定向至相應的HTTPS頁面。如圖所示,上圖為百度收錄的HTTP版本,下圖為用戶點擊后會自動跳入HTTPS版本。
3,HTTP版(ban)本不(bu)是(shi)只(zhi)為首頁制作,其它重(zhong)要(yao)頁面(mian)也需要(yao)制作HTTP版(ban)本,且互相(xiang)鏈(lian)接(jie),切不(bu)要(yao)出(chu)現這種情況:首頁HTTP頁面(mian)上的鏈(lian)接(jie)依然鏈(lian)向HTTPS頁面(mian),導(dao)(dao)致Baiduspider無法(fa)繼(ji)續抓取——我(wo)們曾(ceng)經遇到這種情況,導(dao)(dao)致整(zheng)個網點我(wo)們只(zhi)能收錄一個首頁。
如下面這(zhe)個做(zuo)法就是錯誤的(de)://www.abc.com/ 鏈(lian)向//www.adc.com/bbs/
4,可(ke)以將部分不需要加密的內(nei)(nei)容,如(ru)資訊等使用(yong)二級(ji)域名承載(zai)。比如(ru)支付寶站點(dian),核心加密內(nei)(nei)容放在HTTPS上,可(ke)以讓Baiduspider直(zhi)接抓取的內(nei)(nei)容都放置在二級(ji)域名上。