国产www亚洲а∨天堂一区_中国国产精品一区二区三区_www99热精品视频_丰满少妇被猛烈进入av久久

搜索引擎是怎么處理內(nèi)容的?

2014/12/8 13:05:14

　　搜索引擎是怎么處理內(nèi)容的?

　　內(nèi)容處理一直是一個比較神秘的工作，很多SEO人員都好奇搜索引擎是怎么處理內(nèi)容的，處理內(nèi)容的算法是怎樣的，具體的搜索算法及公式，這里無從談起，只能從內(nèi)容處理邏輯方面給大家一塊了解下。

　　1、判斷目標(biāo)頁面的類型

　　抓取到的內(nèi)容，首先要對內(nèi)容所屬的類型進(jìn)行歸類，是普通的網(wǎng)頁文件，還是pdf、word等特殊文件文檔。如果是普通網(wǎng)頁還要判斷網(wǎng)頁的類型是普通文本內(nèi)容，還是視頻內(nèi)容等類型。甚至還會對網(wǎng)頁是普通文章頁還是論壇帖子頁進(jìn)行判斷，然后有針對性的進(jìn)行內(nèi)容處理。這里李現(xiàn)龍(微信號：李現(xiàn)龍)提示一點(diǎn)，論壇性的帖子權(quán)重不及普通文章頁。

　　2、提取網(wǎng)頁中的文本信息

　　當(dāng)下主流的搜索引擎雖然都聲稱可以讀取JS等非普通網(wǎng)頁文件中的內(nèi)容，但是索引的還是以文本為主。還是會重點(diǎn)提取title、keywords和description標(biāo)簽中的內(nèi)容。雖然有傳言說是description和keywords中的內(nèi)容已經(jīng)被搜索引擎拋棄了，對排名沒有什么作用了，但是，有很多人經(jīng)過自己的測試，至少百度還是會參考下keywords中的關(guān)鍵詞的。所以，這一塊布局關(guān)鍵詞的地方還是不要放棄的為好。

　　3、去除頁面噪聲

　　如果當(dāng)前頁面是普通網(wǎng)頁，搜索引擎會把與當(dāng)前網(wǎng)頁無關(guān)的廣告，導(dǎo)航，鏈接，圖片，登入窗口，網(wǎng)站版權(quán)等信息內(nèi)容全部剔除掉，只是提取網(wǎng)頁中的主體內(nèi)容。

　　在剔除過程中，百度并不會把主體之外的其他東西全部拋掉，比如相關(guān)推薦，關(guān)聯(lián)閱讀的內(nèi)容在一定程度也會被算作是本頁的內(nèi)容，或者是對本頁內(nèi)容的補(bǔ)充，也會對搜索排名有一定的影響。

　　4、去除停止詞

　　所謂的停止詞，其實(shí)就是文章中出現(xiàn)的“的、地、得、哎、呀、卻、但”等之類的詞。這些詞在文章中出現(xiàn)的頻率極高，而且沒有什么實(shí)際的意義，除掉這些詞不影響搜索引擎內(nèi)容進(jìn)行分詞和理解，還可以減少搜索引擎的計算量。

　　需要指出的是，搜索引擎并不是嚴(yán)格遵守去除規(guī)則的，畢竟中國的文字博大精深，同一個詞出現(xiàn)在不同的位置意思可能就大不一樣，所以適當(dāng)?shù)姆潘梢?guī)則也是可以理解的。

　　經(jīng)過上述4點(diǎn)對內(nèi)容的處理，spider抓進(jìn)來的內(nèi)容幾乎就可以認(rèn)為是洗干凈了，再經(jīng)過后續(xù)的分詞及去重處理后，內(nèi)容就可以進(jìn)行正向所以和倒排索引處理了。

推薦文章

網(wǎng)站SEO優(yōu)化

SEO操作			SEO類型

網(wǎng)站定位
明確網(wǎng)站定位、用戶定位,根據(jù)產(chǎn)品屬性結(jié)合用戶搜索習(xí)慣進(jìn)行關(guān)鍵詞研究和建立。
站內(nèi)優(yōu)化
網(wǎng)站結(jié)構(gòu)及HTML代碼優(yōu)化、標(biāo)題、描述、關(guān)鍵詞定義；
圖片ALT優(yōu)化、快照縮略圖優(yōu)化、H\STRONG\FONT\P\DIV\LI標(biāo)簽優(yōu)化
鏈接A標(biāo)簽設(shè)置、URL優(yōu)化、死鏈、空鏈、#號鏈等處理
文本匹配與關(guān)鍵字設(shè)置、導(dǎo)航優(yōu)化、目錄優(yōu)化、詳情頁優(yōu)化
站外優(yōu)化
百度收錄主動請求代碼、網(wǎng)站Sitemap.xml索引設(shè)置
高質(zhì)量外鏈和友情鏈接建設(shè)、URL引導(dǎo)收錄提交
搜索體驗及縮略圖優(yōu)化、網(wǎng)頁快照優(yōu)化、權(quán)重評級提升
文章發(fā)布技巧
標(biāo)題醒目、準(zhǔn)確傳遞文章思想，標(biāo)題具備高度的總結(jié)性和概括性
關(guān)鍵字設(shè)置從文章標(biāo)題里提煉，必修按詞組提煉有指數(shù)的關(guān)鍵詞
文章摘匹配關(guān)鍵字并統(tǒng)攬全局，摘要必須準(zhǔn)確表達(dá)文章的觀點(diǎn)
文章配圖必須121x75的倍數(shù)，文章發(fā)布后必做URL收錄提交
SEO策略與技巧
確保鏈接被收錄形成快照，確保網(wǎng)頁快照參與權(quán)重評級
標(biāo)題用部分匹配原則，描述用完整匹配原則
排名靠前的內(nèi)鏈引導(dǎo)靠后的，提高搜索展現(xiàn)率和有效點(diǎn)擊
內(nèi)容用完整匹配、關(guān)鍵字加粗，內(nèi)鏈錨文本與導(dǎo)出鏈接相關(guān)
鏈接層級扁平化、目錄簡短，合理使用網(wǎng)站導(dǎo)航和分類
重要鏈接放到第一屏，文案內(nèi)容匹配長尾詞而非主詞
快速排名
單個鍵詞是否進(jìn)入搜索首頁或前三
關(guān)鍵字必須在搜索引擎結(jié)果有排名
網(wǎng)站不需要過多調(diào)整、局部優(yōu)化
排名速度快、一般2周左右
按約定驗收客戶指定的關(guān)鍵詞
整站優(yōu)化
整個網(wǎng)站從搜索引擎過來的流量
只要網(wǎng)站收錄大于100條即可
網(wǎng)站每級都要做站內(nèi)調(diào)整優(yōu)化
整站優(yōu)化初期相對較慢
根據(jù)主詞持續(xù)擴(kuò)展長尾詞

SEO問題（FAQs）

網(wǎng)站TDK怎么定義?

明確網(wǎng)站定位、用戶定位,根據(jù)產(chǎn)品屬性結(jié)合用戶搜索習(xí)慣進(jìn)行關(guān)鍵詞研究和建立。
站內(nèi)優(yōu)化包含什么內(nèi)容？
站內(nèi)優(yōu)化主要包含網(wǎng)站代碼優(yōu)化和網(wǎng)站內(nèi)容調(diào)整，如下：
1. 網(wǎng)站結(jié)構(gòu)及HTML代碼優(yōu)化、標(biāo)題、描述、關(guān)鍵詞定義；
2. 圖片ALT優(yōu)化、快照縮略圖優(yōu)化、H\STRONG\FONT\P\DIV\LI標(biāo)簽優(yōu)化
3. 鏈接A標(biāo)簽設(shè)置、URL優(yōu)化、死鏈、空鏈、#號鏈等處理
4. 文本匹配與關(guān)鍵字設(shè)置、導(dǎo)航優(yōu)化、目錄優(yōu)化、詳情頁優(yōu)化

深度傳播，精準(zhǔn)獲客

網(wǎng)站優(yōu)化邀請您一起推進(jìn)營銷精準(zhǔn)化、簡單化！

電話咨詢

18810118859