360搜索部門(mén)的工作人員告訴我360已經(jīng)推出了ICO算法了,ICO 全稱(chēng) Index clear optimize,簡(jiǎn)單來(lái)說(shuō)就是處理重復(fù)內(nèi)容的算法 這也意味著,這是繼Google、百度之后,又一家敢公布算法的搜索引擎,也是自信的一種表現(xiàn)OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
360也聰明了,為了避免之前百度犯過(guò)的錯(cuò)(每次更新不明不白,導(dǎo)致怨聲載道),所以在360搜索逐漸強(qiáng)大的時(shí)候公布每一次算法的改動(dòng)OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
ICO算法是對(duì)已經(jīng)入索引庫(kù)的低質(zhì)量URL和無(wú)效URL數(shù)據(jù)進(jìn)行清理的算法,在不同的階段會(huì)對(duì)不同類(lèi)型的無(wú)效數(shù)據(jù)進(jìn)行清理,該算法是一個(gè)長(zhǎng)期執(zhí)行的算法OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
一次清理超過(guò)10億頁(yè)面的算法360搜索都將提前公布告知站長(zhǎng),并告知算法優(yōu)化處理的主要方向OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
ICO算法OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
處理量級(jí) 10億以上OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
處理網(wǎng)頁(yè)特點(diǎn):OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
該算法主要是針對(duì)重復(fù)內(nèi)容進(jìn)行清理,對(duì)用戶沒(méi)有價(jià)值的內(nèi)容頁(yè)面,內(nèi)容時(shí)效性強(qiáng)且過(guò)期的頁(yè)面,采集站類(lèi),URL地址含有無(wú)效參數(shù)的頁(yè)面等OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
例如 招聘類(lèi)網(wǎng)站不同子站中內(nèi)容相同的頁(yè)面,小說(shuō)采集站尤其處理對(duì)用戶無(wú)價(jià)值的頁(yè)面,舊新聞頁(yè)且內(nèi)容重復(fù)的頁(yè)面也會(huì)處理一部分,以及其他的部分無(wú)效頁(yè)面OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
OCR北京網(wǎng)站設(shè)計(jì)開(kāi)發(fā),小程序開(kāi)發(fā),公眾號(hào),微信開(kāi)發(fā)-云智互聯(lián)
原創(chuàng)不易,未經(jīng)授權(quán),嚴(yán)禁轉(zhuǎn)載
原文地址:http://www.mpian.cn/web/exp/5029.html