《移動搜索建站優化白皮書》百度發布--網站建設
2 網站建設
2.1 域名選擇
網站域名選擇,不(bù)僅能快速直觀讓用戶了(le/liǎo)解網站定位,域名設置,更會影響搜索對網站的(de)抓取情況。因此,選擇簡單好記且安全的(de)域名,是(shì)網站搭建前期最重要(yào / yāo)的(de)一(yī / yì /yí)步。
2.1.1 域名選擇的(de)注意事項
網站搭建之(zhī)初,對網站域名選擇,建議域名獨立,簡單好記;獨立移動站域名選擇也(yě)遵循此規則。
移動站的(de)域名需與PC站域名分開,移動站不(bù)建議與PC站公用一(yī / yì /yí)個(gè)域名;比如PC網站域名建議是(shì)www.test.com,對應移動站的(de)域名是(shì)m.test.com,而(ér)不(bù)是(shì)www.test.com/m/的(de)形式;如果是(shì)自适應網站可不(bù)考慮此情況。
網站域名選擇中,主要(yào / yāo)有以(yǐ)下兩點建議:
√ 建議使用比較常見的(de)域名後綴,如.com\.cn\.net等;
√ 如果網站追求個(gè)性化使用罕見域名後綴,爲(wéi / wèi)了(le/liǎo)保證搜效果,請來(lái)百度搜索資源平台(原百度站長平台)進行站點驗證。
2.1.2 使用子(zǐ)域名或目錄
網站是(shì)否需要(yào / yāo)建立子(zǐ)域名,或是(shì)劃分多級目錄,可根據網站自身定位及網站内容量級決定。通常來(lái)說(shuō),綜合類或内容量較多的(de)網站,可将内容按照不(bù)同二級域明确劃分;而(ér)如果網站内容較少,不(bù)建議網站開設過多的(de)子(zǐ)域名。
舉例來(lái)說(shuō),blog形式站點,有的(de)網站給到(dào)每個(gè)blog作者單獨的(de)三級域,但如果作者發布頻率較低,整個(gè)三級域都是(shì)更新頻率很低的(de)狀态,過低的(de)發布頻率對搜索引擎來(lái)說(shuō)是(shì)不(bù)友好的(de)。
2.2 内容發布系統
内容發布系統,無論是(shì)網站自建還是(shì)使用第三方建站系統,百度都是(shì)支持的(de);所有發布系統,除遵循有條理、邏輯清晰建站,還要(yào / yāo)注意網站搭建的(de)安全問題,避免網站安全隐患,才能更好的(de)提升網站價值。
2.2.1 自建内容發布系統
網站自建内容發布系統,注意事項包括:
√ 主體内容清晰且能夠很好的(de)識别與分辨;
√ 後台發布時(shí)間切勿自行設置,遵循發布時(shí)間與展示時(shí)間一(yī / yì /yí)緻;
√ 内容發布系統中各表單設置合理,如對tag标簽的(de)設置不(bù)宜過多、不(bù)宜羅列關鍵詞;
√ 分類劃分明确,分類主題的(de)文章對應發布到(dào)相應分類下;
√ 題文相符,切勿挂羊頭賣狗肉,欺騙搜索引擎流量,損傷用戶體驗;
√ 段落清晰合理、字體大(dà)小适中、字體顔色切勿使用與背景色相近的(de)顔色;
√ 發布内容目錄劃分清晰,具體參考2.3章節中網站結構設置。
2.2.2 第三方發布系統
使用第三方發布系統建站,需要(yào / yāo)站長關注以(yǐ)下注意事項:
√ 模闆主題不(bù)建議頻繁更換;
√ 類似wordpress等系統,不(bù)建議使用過多插件,會影響網頁打開速度;
√ URL僞靜态的(de)處理,命名規範、層級清晰;
√ 開源建站系統存在(zài)較多安全隐患,使用過程中務必做一(yī / yì /yí)些安全上(shàng)的(de)設置和(hé / huò)優化。
2.2.3 頁面生成規範
無論網站自建發布系統,還是(shì)網站使用第三方建站系統,網站頁面的(de)生成,都應注意以(yǐ)下幾點:
√ 網頁結構清晰、各分類名稱設置醒目;
√ 導航、面包屑導航設置合理,機器可讀、位置突出(chū),用戶能很好得知所訪問頁面在(zài)網站中的(de)位置;
√ 不(bù)存在(zài)遮擋主體内容的(de)廣告元素;
√ 無三俗圖文、音頻元素;
注意網站搭建系統安全問題,杜絕網站安全隐患。
訪問請求中的(de)content-type需要(yào / yāo)根據對應的(de)類型進行正确設置,圖示如下:
除此之(zhī)外,關于(yú)頁面規範标準,建議參考搜索學院發布的(de)《百度搜索Mobile Friendly(移動友好度)标準V1.0》
2.3 網站結構
合理設置網站結構,是(shì)網站被快速抓取、獲得搜索流量的(de)基礎;因網站結構設置不(bù)合理,導緻網站無法被快速識别抓取的(de)事例在(zài)百度日常反饋中經常見到(dào),且網站換域名也(yě)會對網站造成一(yī / yì /yí)定損失,故希望各位站長從建站之(zhī)初重視網站結構設置,避免不(bù)必要(yào / yāo)的(de)損失。
2.3.1 URL結構設置
URL搭建是(shì)否有嚴格要(yào / yāo)求,請看以(yǐ)下幾點注意事項:
√ 在(zài)搭建網站結構、制作URL時(shí),盡量避開非主流設計,追求簡單美即可,越簡單越平常,越好,例如URL中出(chū)現生僻字符,如不(bù)常見的(de)“II”,會引起搜索引擎識别錯誤;
√ URL長度要(yào / yāo)求去掉協議頭http(s)://之(zhī)後的(de)URL長度不(bù)要(yào / yāo)超過256個(gè)字節;
√ 謹慎使用#參數,有效的(de)參數不(bù)能放在(zài)#後面;可能被截斷導緻網頁抓取異常。
2.3.2 目錄結構設置
網站目錄結構搭建是(shì)否合理,影響搜索引擎對網站的(de)抓取情況,這(zhè)裏需要(yào / yāo)提到(dào)的(de)是(shì),網站目錄結構無論是(shì)扁平化還是(shì)樹形結構,一(yī / yì /yí)般都可以(yǐ)被搜索引擎發現,但有以(yǐ)下幾點注意事項:
√ 建議不(bù)同内容放在(zài)不(bù)同目錄或子(zǐ)域下,域名劃分在(zài)2.1.2網站域名劃分章節中有詳細提到(dào);
√ 不(bù)要(yào / yāo)使用孤島鏈接,孤島鏈接很難被搜索引擎快速發現;若網站已存在(zài)大(dà)量孤島鏈接,建議使用搜索資源平台的(de)鏈接提交工具向百度提交數據;
√ 重要(yào / yāo)内容不(bù)建議放在(zài)深層目錄,若該内容沒有大(dà)量内鏈指向,搜索引擎很難判斷該頁面的(de)重要(yào / yāo)程度。
以(yǐ)下是(shì)圖片示例:
2.4 服務商/自建服務器
選擇服務商或者自建服務器,對網站搭建都是(shì)十分重要(yào / yāo)基礎的(de)一(yī / yì /yí)環;服務器安全和(hé / huò)穩定将直接影響百度搜索引擎對網站的(de)整體判斷。
2.4.1 域名服務
2.4.1.1 域名服務&域名部署
關于(yú)域名服務和(hé / huò)域名部署,有以(yǐ)下注意事項:
√ 站長在(zài)域名部署中請仔細各環節問題,不(bù)要(yào / yāo)出(chū)現域名部署錯誤情況;
√ 不(bù)建議網站進行泛解析,若網站爆發大(dà)規模泛解析,且影響惡劣,則會受到(dào)搜索策略打壓;
√ 盡量選擇優質域名服務商。
2.4.2 服務器
做網站還有非常重要(yào / yāo)的(de)一(yī / yì /yí)環,就(jiù)是(shì)服務器的(de)選擇,那服務器選擇中,無論是(shì)虛拟主機、雲主機還是(shì)獨立的(de)服務器,都應該注意以(yǐ)下四點:
√ 中文網站不(bù)建議選擇國(guó)外服務器;
√ 服務器的(de)穩定性非常重要(yào / yāo),需要(yào / yāo)保持訪問流暢,服務器是(shì)否穩定,可以(yǐ)使用百度搜索資源平台(原百度站長平台)抓取異常、抓取診斷工具進行檢測維護。(服務器經常無法訪問或者死機,對爬蟲來(lái)講都是(shì)緻命傷害);
√ 服務器選擇除了(le/liǎo)自身的(de)穩定性外,實際上(shàng)還要(yào / yāo)考慮網站的(de)業務量,例如帶寬、内存、CPU是(shì)否能夠承受訪問量,突發大(dà)流量情況下是(shì)否可以(yǐ)正常訪問;
√ 服務器主機設置,需要(yào / yāo)注意是(shì)否有禁止爬蟲抓取的(de)設置、或存在(zài)404錯誤信息設置,這(zhè)些情況都會引起不(bù)必要(yào / yāo)的(de)搜索引擎抓取判斷異常,爲(wéi / wèi)網站帶來(lái)不(bù)必要(yào / yāo)的(de)損失。
2.4.2.1 虛拟主機
總的(de)來(lái)說(shuō),建議虛拟主機選購時(shí)候需要(yào / yāo)特别注意:
√ 主機商是(shì)否存在(zài)限制搜索引擎訪問的(de)情況;
√ 主機商的(de)資質是(shì)否符合要(yào / yāo)求;
√ 主機商的(de)技術沉澱是(shì)否足夠,建議選擇品牌較大(dà)的(de)主機商;
√ 主機商托管的(de)機房的(de)物理條件和(hé / huò)網絡條件是(shì)否足夠優秀;
√ 主機商的(de)技術和(hé / huò)客服支持情況是(shì)否夠好;
√ 主機商是(shì)否會存在(zài)超容量的(de)情況;
√ 主機商是(shì)否存在(zài)違規接入高風險站點的(de)問題或同一(yī / yì /yí)IP下是(shì)否會存在(zài)高風險站點的(de)情況;
√ 國(guó)内站點建議選購國(guó)内雲主機建站。
2.4.2.2 獨立主機
獨立主機爲(wéi / wèi)站點帶來(lái)更加寬松的(de)使用環境和(hé / huò)個(gè)性軟件的(de)安裝,因此獨立主機需要(yào / yāo)站長擁有一(yī / yì /yí)定的(de)技術力量來(lái)保證網站的(de)正常運行和(hé / huò)安全。
我們對于(yú)站長選購和(hé / huò)托管獨立主機的(de)建議是(shì):
√ 注意虛拟主機是(shì)否有将爬蟲IP拉入黑名單,關于(yú)百度UA,可以(yǐ)參考3.1.2.1百度蜘蛛章節;
√ 建議使用獨立IP地(dì / de)址的(de)主機;
√ 建議使用規模較大(dà)機構的(de)主機,在(zài)安全配置、穩定性上(shàng)相對更好;
√ 對IDC服務商的(de)建設标準需要(yào / yāo)一(yī / yì /yí)定的(de)考慮,例如防火、防盜、是(shì)否有UPS保證、室内溫控、消防等;
√ IDC服務商的(de)服務質量和(hé / huò)技術是(shì)否達标,是(shì)否24h值班,是(shì)否能夠協助排查一(yī / yì /yí)些故障、免費重啓重裝系統等;
√ IDC機房的(de)資質是(shì)否齊全,存放站點是(shì)否有高風險站點或服務器存在(zài)。
2.4.3 安全服務
2.4.3.1 HTTPS
當前百度已實行全站化HTTPS安全加密服務,百度HTTPS安全加密已覆蓋主流浏覽器,旨在(zài)用戶打造了(le/liǎo)一(yī / yì /yí)個(gè)更隐私化的(de)互聯網空間、加速了(le/liǎo)國(guó)内互聯網的(de)HTTPS化。同時(shí)也(yě)希望更多網站加入到(dào)HTTPS的(de)隊伍中來(lái),爲(wéi / wèi)網絡安全貢獻一(yī / yì /yí)份力量。
HTTPS安全原理解析
HTTPS主要(yào / yāo)由有兩部分組成:HTTP + SSL / TLS,也(yě)就(jiù)是(shì)在(zài)HTTP上(shàng)又加了(le/liǎo)一(yī / yì /yí)層處理加密信息的(de)模塊。服務端和(hé / huò)客戶端的(de)信息傳輸都會通過TLS進行加密,所以(yǐ)傳輸的(de)數據都是(shì)加密後的(de)數據。
HTTS複雜的(de)加密機制有效的(de)加大(dà)了(le/liǎo)網站的(de)安全性,加密機制與認證機制可以(yǐ)減少網站被劫持和(hé / huò)假冒的(de)風險,建議站長們可以(yǐ)通過做HTTPS改造來(lái)強化網站安全。
百度搜索資源平台爲(wéi / wèi)了(le/liǎo)更好的(de)抓取識别HTTPS網站,2017年還推出(chū)了(le/liǎo)HTTPS認證工具,已經完成HTTPS改造的(de)網站,可以(yǐ)在(zài)搜索資源平台-網站支持-HTTPS認證工具中提交網站的(de)HTTPS數據,便于(yú)百度更好抓取識别網站。關于(yú)HTTPS認證工具詳解,可以(yǐ)參考5.3.2HTTPS認證工具章節。
2.4.3.2 網站防止被黑對策
網站被黑,通常表現爲(wéi / wèi)網站中出(chū)現大(dà)量非本網站發布的(de)類似博彩内容,或網站頁面直接跳轉到(dào)博彩頁面;以(yǐ)下是(shì)網站被黑後發布的(de)内容:
内容非網站發布,内容中含大(dà)量博彩網站指向:
網站頁面直接跳轉到(dào)博彩網站:
網站被黑代表網站安全存在(zài)嚴重問題或漏洞,如何防範網站被黑,請參考以(yǐ)下:
首先,自查是(shì)否被黑
√ 被黑網站在(zài)數據上(shàng)有一(yī / yì /yí)個(gè)特點,即索引量和(hé / huò)從搜索引擎帶來(lái)的(de)流量在(zài)短時(shí)間内異常數據異常。所以(yǐ),站長可以(yǐ)利用百度搜索資源平台(原百度站長平台)的(de)索引量工具,觀察站點索引量是(shì)否有異常;如果發現數據異常,再通過流量與關鍵詞工具查看獲得流量的(de)關鍵詞是(shì)否與網站有關、是(shì)否涉及博彩和(hé / huò)色情;
√ 通過Site語法查詢站點,結合一(yī / yì /yí)些常見的(de)色情、博彩類關鍵詞效果更佳,有可能發現不(bù)屬于(yú)站點的(de)非法頁面;
√ 由于(yú)百度流量巨大(dà),有些被黑行爲(wéi / wèi)僅針對百度帶來(lái)的(de)流量予以(yǐ)跳轉,站長很難發現,所以(yǐ)在(zài)查看自己站點是(shì)否被黑時(shí),一(yī / yì /yí)定要(yào / yāo)從百度搜索結果中點擊站點頁面,查看是(shì)否跳轉到(dào)了(le/liǎo)其他(tā)站點;
√ 站點内容在(zài)百度搜索結果中被提示存在(zài)風險;
√ 後續可以(yǐ)請網站技術人(rén)員通過後台數據和(hé / huò)程序進一(yī / yì /yí)步确認網站是(shì)否被黑。
其次,被黑之(zhī)後如何處理
√ 确認網站被黑後,SEO人(rén)員除了(le/liǎo)要(yào / yāo)推動技術人(rén)員快速修正外,還需要(yào / yāo)做一(yī / yì /yí)些善後和(hé / huò)預防的(de)工作;
√ 網站如有變更頁面,變更頁面建議使用鏈接提交工具向百度提交數據;
√ 立即停止網站服務,避免用戶繼續受影響,防止繼續影響其他(tā)站點;
√ 如果同一(yī / yì /yí)主機提供商同期内有多個(gè)站點被黑,可以(yǐ)聯系主機提供商,敦促對方做出(chū)應對;
√ 清理已發現的(de)被黑内容,将被黑頁面設置爲(wéi / wèi)404死鏈,并通過百度搜索資源平台(原百度站長平台)死鏈提交工具進行提交。(我們發現有些站點采用了(le/liǎo)将被黑頁面跳轉至首頁的(de)做法,非常不(bù)可取。);
√ 排查出(chū)可能的(de)被黑時(shí)間,和(hé / huò)服務器上(shàng)的(de)文件修改時(shí)間相比對,處理掉黑客上(shàng)傳、修改過的(de)文件;檢查服務器中的(de)用戶管理設置,确認是(shì)否存在(zài)異常的(de)變化;更改服務器的(de)用戶訪問密碼。注:可以(yǐ)從訪問日志中,确定可能的(de)被黑時(shí)間。不(bù)過黑客可能也(yě)修改服務器的(de)訪問日志;
√ 做好安全工作,排查網站存在(zài)的(de)漏洞,防止再次被黑。
網站自我防護的(de)注意事項:
√ 多種安全防護同步進行:适合中小型資訊網站;
● 網站程序勤打補丁:現在(zài)很多資訊類網站用的(de)系統使用了(le/liǎo)内容管理系統(CMS),作爲(wéi / wèi)新聞發布系統,功能還算可以(yǐ)了(le/liǎo),但是(shì)作爲(wéi / wèi)比較常見的(de)内容管理系統(CMS),也(yě)有另一(yī / yì /yí)個(gè)問題,那就(jiù)是(shì)漏洞比較大(dà)衆化,因爲(wéi / wèi)源碼是(shì)公開的(de),所以(yǐ)很容易被研究出(chū)漏洞,需要(yào / yāo)對網站程序及時(shí)進行漏洞修複。
√ 對服務器進行常規的(de)安全防護;
● 在(zài)上(shàng)班時(shí)間之(zhī)外,對服務器上(shàng)的(de)網站權限做設置,禁止文件修改,後台文件隐藏或遷移到(dào)根目錄之(zhī)外。
● 參考一(yī / yì /yí)些網站的(de)安全設置,非限定的(de)IP不(bù)能寫入到(dào)數據庫。
√ 不(bù)使用開源程序默認的(de)robots文件;
● 下圖是(shì)一(yī / yì /yí)個(gè)地(dì / de)級市的(de)資訊類站點的(de)robots文件,從robots文件中可以(yǐ)看出(chū),該網站用的(de)是(shì)織夢後台,那黑客就(jiù)可以(yǐ)通過各種針對織夢攻擊的(de)軟件進行操作了(le/liǎo),也(yě)可以(yǐ)針對織夢網站的(de)常見漏洞進行掃描和(hé / huò)針對性攻擊了(le/liǎo)。
2.4.4 網絡服務
2.4.4.1 CDN
從搜索抓取機制上(shàng)講:百度蜘蛛對站點的(de)抓取方式和(hé / huò)普通用戶訪問一(yī / yì /yí)樣,隻要(yào / yāo)普通用戶能訪問到(dào)的(de)内容,百度蜘蛛就(jiù)能抓取到(dào)。不(bù)管是(shì)用什麽技術,隻要(yào / yāo)能保證用戶能流暢的(de)訪問網站,對搜索引擎就(jiù)沒有影響。但有站長反饋使用CDN後出(chū)現網站抓取異常、甚至流量異常等問題,主要(yào / yāo)是(shì)兩方面的(de)因素:
一(yī / yì /yí)是(shì)部分CDN服務商硬件投入不(bù)夠,經常出(chū)現不(bù)穩定情況,會導緻大(dà)量的(de)蜘蛛抓取失敗,從而(ér)影響網站抓取效果,有的(de)甚至影響了(le/liǎo)索引量數據;所以(yǐ)選擇有實力的(de)CDN服務商很重要(yào / yāo);
二是(shì)緩存機制在(zài)網站出(chū)現死鏈、無法打開、被黑等情況的(de)時(shí)候起到(dào)了(le/liǎo)推波助瀾的(de)作用。短時(shí)間内産生了(le/liǎo)一(yī / yì /yí)些不(bù)利快照,影響了(le/liǎo)排名。這(zhè)種情況不(bù)用擔心,及時(shí)清理源文件和(hé / huò)CDN緩存,并在(zài)百度搜索資源平台(原百度站長平台)提交相關死鏈數據等方法進行挽回,是(shì)可以(yǐ)恢複的(de)。
- 上(shàng)一(yī / yì /yí)篇:《移動搜索建站優化白皮書》百度發布--前言
- 下一(yī / yì /yí)篇:《移動搜索建站優化白皮書》百度發布--網站優化