建站優(yōu)化

Website development

感性網(wǎng)站建設(shè):企業(yè)網(wǎng)絡(luò)營(yíng)銷需要了解的搜索引擎原理

發(fā)布時(shí)間：2014-04-30 11:56:24

TAGS：

搜索引擎從輸入關(guān)鍵字，到列出搜索結(jié)果的過程，往往只需要一秒不到。那么百度是怎么做到在這么短的時(shí)間內(nèi)將相關(guān)的網(wǎng)站展示給用戶看的呢？

其實(shí)搜索引擎為用戶展示的每一條搜索結(jié)果，都是對(duì)應(yīng)著互聯(lián)網(wǎng)上一個(gè)真實(shí)存在的頁面。搜索引擎在收集每一條結(jié)果都需要經(jīng)過四個(gè)過程：抓取-過濾-建立索引-輸出結(jié)果。

第一步、抓取

百度蜘蛛或baiduspider就是百度的一個(gè)程序，他的工作就是搜集互聯(lián)網(wǎng)上，搜索引擎會(huì)通過復(fù)雜的計(jì)算，來決定對(duì)哪些網(wǎng)站進(jìn)行頁面抓取，以及抓取的頻率和內(nèi)容。而且搜索引擎在計(jì)算過程中會(huì)參考你網(wǎng)站的歷史表現(xiàn)記錄。比如更新時(shí)間，內(nèi)容質(zhì)量，是否有對(duì)用戶不友好的設(shè)置等。

當(dāng)你的網(wǎng)站產(chǎn)生新的頁面的時(shí)候，百度蜘蛛會(huì)通過互聯(lián)網(wǎng)上的鏈接指向進(jìn)行訪問和抓取，如果你沒有設(shè)置任何外部鏈接指向網(wǎng)站中的新增內(nèi)容，那么百度蜘蛛就不會(huì)及時(shí)的進(jìn)行抓取。對(duì)于已經(jīng)被抓取過的頁面內(nèi)容，搜索引擎會(huì)對(duì)抓取的頁面進(jìn)行記錄，并根據(jù)這些頁面對(duì)用戶的重要程度計(jì)算出不同頻率的抓取更新工作。

但是需要注意的是，有些抓取軟件為了達(dá)到某種目的而偽裝成各種蜘蛛對(duì)網(wǎng)站進(jìn)行抓取，如果你在網(wǎng)站日志中發(fā)現(xiàn)這種情況，要學(xué)會(huì)判斷蜘蛛的真?zhèn)蝸聿扇〈胧?，防止網(wǎng)站的正常運(yùn)行受到影響。

第二步、過濾

在百度抓取回來的頁面中，不是所有的頁面都是對(duì)用戶有用的，比如一些明顯欺騙用戶的頁面，死鏈接，空白頁，抄襲內(nèi)容等。這些頁面對(duì)于用戶來說都是沒有意義的，因此百度會(huì)自動(dòng)對(duì)這些內(nèi)容頁面進(jìn)行過濾，刪除那些低質(zhì)量的網(wǎng)頁，網(wǎng)百度收錄的頁面盡可能的是對(duì)用戶有效的。這樣才能保證百度給用戶展示的頁面都是優(yōu)質(zhì)的頁面。提升他自己的用戶體驗(yàn)。

第三步、建立索引

搜索引擎會(huì)對(duì)蜘蛛抓取回來的頁面內(nèi)容進(jìn)行逐一標(biāo)記和識(shí)別，將這些標(biāo)記進(jìn)行存儲(chǔ)為結(jié)構(gòu)化數(shù)據(jù)，比如頁面的基本title信息，tag,discripition,keywords，網(wǎng)頁外鏈描述，抓取記錄等一系列內(nèi)容。以便在用戶搜索的時(shí)候提供匹配的內(nèi)容頁面。

第四步、輸出結(jié)果

當(dāng)用戶在搜索框輸入關(guān)鍵詞的時(shí)候，百度會(huì)對(duì)其進(jìn)行復(fù)雜的算法，并更具分析結(jié)果，在索引庫中尋找為匹配的一系列網(wǎng)頁。按照用戶的需求強(qiáng)弱和網(wǎng)頁的質(zhì)量來進(jìn)行打分，而終根據(jù)分?jǐn)?shù)進(jìn)行排列，來展現(xiàn)優(yōu)質(zhì)的內(nèi)容給用戶。

原創(chuàng)不易，未經(jīng)授權(quán)，嚴(yán)禁轉(zhuǎn)載

原文地址：http://www.mpian.cn/web/seo/2014-04-30/407.html

上一篇：感性網(wǎng)站建設(shè):網(wǎng)站降權(quán)都有哪些表象

下一篇：感性網(wǎng)站建設(shè):七大因素影響網(wǎng)站權(quán)重

您還有可能感興趣的內(nèi)容

建站流程

Website development

網(wǎng)站需
求分析
網(wǎng)站策
劃方案
頁面風(fēng)
格設(shè)計(jì)
程序設(shè)
計(jì)研發(fā)
資料錄
入優(yōu)化
確認(rèn)交
付使用
后續(xù)跟
蹤服務(wù)
+86 10 64758810
18510861135

熱門標(biāo)簽

Website development

客戶評(píng)價(jià)

更多+

感謝云智互聯(lián)，系統(tǒng)提前完成，在整個(gè)項(xiàng)目周期內(nèi)，云智互聯(lián)對(duì)待我們并不像是對(duì)待客戶，更像是朋友一樣，每一次，都能以專業(yè)的角度向我們提出更合理、更有效的解決方案，并快速、細(xì)致地完成我們的每一個(gè)需求，再次感謝以至誠之心做事的云智互聯(lián)團(tuán)隊(duì)。

潘濤
我是東方龍馬集團(tuán)，在云智家做了2個(gè)企業(yè)官網(wǎng)，服務(wù)態(tài)度超級(jí)好。如果想做網(wǎng)站，選擇他家一定不后悔。性價(jià)比高，服務(wù)態(tài)度好。值得你的信賴！

譚嬌
技術(shù)好，設(shè)計(jì)精良，操作便利，很專業(yè)！配套的服務(wù)和后續(xù)的服務(wù)都很好,網(wǎng)站封面堪稱精品，運(yùn)行方便，后臺(tái)操作的簡(jiǎn)單。技術(shù)還會(huì)耐心教我,很好的云智互聯(lián)（北京）科技有限公司，建站很不錯(cuò)的。

陳曦
不錯(cuò)，價(jià)格比較合適，重點(diǎn)是響應(yīng)速度蠻快，有什么問題都會(huì)馬上給你解決，公司很滿意，因?yàn)樗麄兌际轻槍?duì)每個(gè)項(xiàng)目建了相應(yīng)的討論組，有問題可以再里面提出，人員分工到位，解決問題很及時(shí)。

張經(jīng)理