HTTPS是以安全為目標的HTTP通道,是HTTP的安全版,保證數據傳輸的安全,有效保障用戶隱私數據,截取也無法解密。
?
HTTPS的收錄機制是什么?
一、蜘蛛如何發現HTTPS
1、網頁中出現的超鏈接是不是HTTPS,如果是HTTPS蜘蛛會認為是HTTPS站點。
2、站長平臺鏈接提交工具,比如主動提交,文件中如果提交的是HTTPS的鏈接則以HTTPS的形式來發現。
3、參考抓取相對路徑,如果第一個網頁是HTTPS,網站里面的內容路徑提供的也是相對路徑,認為這種鏈接是HTTPS。
4、觀察歷史的鏈接,通過這種方式的原因主要是為了糾錯,如果提取HTTPS是錯誤的會出現以下兩種情況:第一種,因為HTTPS不可訪問導致抓取失敗。第二種,抓取成功但是可能會導致展現出來的效果不是站長想要的。
二、HTTPS鏈接的抓取
鏈接的抓取有兩種:第一種HTTPS抓取,它沒有HTTP的版本。第二種是通過HTTP重定向到HTTPS。通過這兩種方式都是可以正常的進行抓取,和HTTP抓取的效果是一樣的。
三、HTTPS的展現方式
HTTPS數據,在展現端會有明顯的提示。
閱讀本文的人還可以閱讀:
?
?
?
?
?
?
?
?
?