多用戶網(wǎng)店系統(tǒng)優(yōu)化必須先了解搜索引擎原理,再做SEO優(yōu)化(上)
你知道“百度”這個搜索引擎是怎么工作的嗎?你有過這樣的疑惑嗎,同樣多用戶網(wǎng)店系統(tǒng)主題,為什么在百度上他的排名在我前面?其實都是百度的排序算法左右著我們的多用戶網(wǎng)店系統(tǒng)排名。那好,我們只要摸清楚百度是如何給我們這些網(wǎng)站排名的話,我們就能對癥下藥把我們多用戶網(wǎng)店系統(tǒng)優(yōu)化成它喜歡的多用戶網(wǎng)店系統(tǒng),排名自然就上去嘍!
其實,搜索引擎的工作過程大體上可分為三個階段:
一、爬行和抓取--搜索引擎蜘蛛通過跟蹤鏈接訪問網(wǎng)頁,獲得頁面HTML代碼存入數(shù)據(jù)庫。
二、預處理--索引程序?qū)ψト淼捻撁鏀?shù)據(jù)進行文字提取,中文分詞,索引等處理,以備排名程序調(diào)用。
三:排名--用戶輸入關(guān)鍵詞后,排名程序調(diào)用索引庫數(shù)據(jù),計算相關(guān)性,然后按一定格式生成搜索結(jié)果頁面。
那么問題來了!我們知道,要想讓我們的多用戶網(wǎng)店系統(tǒng)讓百度收錄到它的數(shù)據(jù)庫中,就必須讓百度蜘蛛在茫茫的互聯(lián)網(wǎng)中發(fā)現(xiàn)我們,蜘蛛的工作原理是順著網(wǎng)站的鏈接地址進行爬行抓取頁面信息,單從理論上來說蜘蛛可以爬行和抓取互聯(lián)網(wǎng)上所有頁面,但是實際上不能,也不會這么做,在這種前提下,蜘蛛所要做的就是盡量抓取重要頁面。 所以,我們SEO人員要想讓自己的更多頁面被收錄,就要想方設法吸引蜘蛛來抓取。
被搜索引擎認為符合重要頁面的幾個因素:
1、網(wǎng)站和頁面權(quán)重
2、頁面更新度
3、導入鏈接
4、與首頁點擊距離
我們只有讓我們的網(wǎng)站向上面這4條信息靠攏,才會被蜘蛛發(fā)現(xiàn)并收錄到數(shù)據(jù)庫中。好了,當我們的網(wǎng)站信息被百度收錄后接下來就可以分為以下幾個步驟:
1、預處理。在一些SEO材料中,“預處理”也被簡稱為“索引”,因為索引是預處理最主要的步驟。我們知道在百度數(shù)據(jù)庫中收錄的并不是現(xiàn)成的頁面,而是“HTML”標簽源代碼,搜索引擎預處理的工作內(nèi)容首先除去HTML代碼后,剩下的用于排名的文字只是一行。
除了可見文字,搜索引擎也會提取出一些特殊的包含文字信息的代碼,如:META標簽中的文字,圖片替代文字,F(xiàn)lash文件中的替代文字,鏈接錨文字等。
2、中文分詞(這是中文搜索引擎所獨有的,誰讓我們的文化博大精深呢,沒辦法,就是任性!)。中文分詞方法基本上有兩種:
(1)、基于詞典匹配--將待分析的一段漢字與一個事先造好的詞典中的詞條進行匹配,在待分析漢字串中掃描到詞典中已有的詞條則匹配成功,或者說切分出一個單詞。
(2)、基于統(tǒng)計--指的是分析大量文字樣本,計算出字與字相鄰出現(xiàn)的統(tǒng)計概率,幾個字相鄰出現(xiàn)越多,就越可能形成一個單詞。
3、去停止詞 。停止詞--無論是英文還是中文,頁面內(nèi)容中都會出現(xiàn)頻率很高,卻對內(nèi)容沒有任何影響的詞,如“的”、“地”、“得”之類的助詞,“啊”、“哈”、“呀”之類的感嘆詞,“從而”、“以”、“卻”之類的副詞或介詞,這些詞被稱為停止詞。 因為這些停止詞對頁面的主要意思沒什么影響,所以搜索引擎索引頁面之前會去掉停止詞,使索引數(shù)據(jù)主題更為突出,減少無謂的計算量。
4、消除噪聲。所謂噪聲,就是除了停止詞以外,對頁面主題沒有什么貢獻的因素,比如:博客頁面的“文章分類”、“歷史存檔”等。
消噪的基本方法: 根據(jù)HTML標簽對頁面分塊,區(qū)分出頁頭,導航,正文,頁腳,關(guān)高等區(qū)域,在網(wǎng)站上大量重復出現(xiàn)的區(qū)塊旺旺屬于噪聲。對頁面進行消噪后,剩下的才是頁面主題內(nèi)容。
5、去重。搜索引擎在進行索引前還需要識別和刪除重復內(nèi)容,這個過程就稱為“去重”。其意義在于提升用戶體驗(搜索引擎不喜歡重復性內(nèi)容)。
去重方法: “去重”的基本方法是對頁面特征關(guān)鍵詞計算指紋,也就是說從頁面主題內(nèi)容中選取最有代表性的一部分關(guān)鍵詞(經(jīng)常是出現(xiàn)頻率最高的關(guān)鍵詞),然后計算這些關(guān)鍵詞的數(shù)字指紋。
6、正向索引 。正向索引也可以簡稱為索引 ,搜索引擎索引程序?qū)㈨撁婕瓣P(guān)鍵詞形成詞表結(jié)構(gòu)存儲進索引庫。并由文件ID映射著其關(guān)鍵詞內(nèi)容,一一對應。
7、倒排索引。正向索引還不能用于排名,最終用于排名的是倒排索引。所以搜索引擎會將正向索引數(shù)據(jù)庫重新構(gòu)造為倒排索引,把文件對應到關(guān)鍵詞的映射轉(zhuǎn)換為關(guān)鍵詞的文件的映射。
8、鏈接關(guān)系計算。鏈接關(guān)系計算也是預處理中很重要的一部分。 搜索引擎在抓取頁面內(nèi)容后,必須事前計算出: 頁面上有哪些鏈接指向哪些其他頁面 每個頁面有哪些導入鏈接 鏈接使用了什么錨文字 這些復雜的鏈接指向關(guān)系形成了網(wǎng)站和頁面的鏈接權(quán)重。
9、特殊文件處理。
搜索引擎除了可以抓取HTML文件外,通常還能抓取和索引以文字為基礎的多種文件類型,如:PDF、WORDS、WPS、PPT、TXT等文件。 目前搜索引擎還不能處理圖片、視頻、Flash這類非文字內(nèi)容,也不能執(zhí)行腳本和程序。
做完上面這幾件事后,最后的工作就是多用戶網(wǎng)店系統(tǒng)排名了。由于這里寫不下,還望大家關(guān)注我下一篇文章哦,我會詳細講解搜索引擎是如何給我們的多用戶網(wǎng)店系統(tǒng)進行排名的。也歡迎大家有什么問題能跟我交流討論!
<本文由himall原創(chuàng),商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請標明:himall原創(chuàng)>
滿足不同行業(yè)發(fā)展電商的需求,HiMall更有針對性的提供不同行業(yè)內(nèi)的電商解決方案
-
跨境電商解決方案
支持直郵/保稅模式
對接海關(guān)/保稅倉
支持多國國際語言
對接Paypal國際支付
幫助跨境外貿(mào)企業(yè)搭建跨境進口/出口電商平臺,搶占國際電商市場,針對企業(yè)需求定制個性化跨境電商解決方案 -
分賬解決方案
迎合金融監(jiān)管要求
規(guī)避“二清”結(jié)算
節(jié)約平臺財務成本
降低平臺招商成本
在合法、合規(guī)的前提下,為電商平臺提供資金收付、賬戶管理、資金合規(guī)等一體化整體解決方案 -
B2B批發(fā)解決方案
多級階梯批發(fā)價
布局全渠道批發(fā)入口
專屬批發(fā)訂貨市場
銀聯(lián)B2B大額支付
為企業(yè)快速搭建綜合性B2B批發(fā)電商平臺,整合線下批發(fā)資源,拓展線上批發(fā)渠道,實現(xiàn)批發(fā)業(yè)務24小時在線經(jīng)營
-
2024年c2c商城系統(tǒng)開發(fā)需要多少錢?C2C開發(fā)流程
最新消息:近些年互聯(lián)網(wǎng)+的是帶發(fā)展迅速,企業(yè)依靠各種方式都邁入互聯(lián)網(wǎng)時代,也許是走的人多了,c2c商城系統(tǒng)這種商城系統(tǒng)的模式...詳情
-
2023年外貿(mào)元旦新年祝福郵件模板
最新消息:元旦客戶郵件主題,外貿(mào)客戶的郵件模板,新年元旦來臨之即,在外國人的眼中,在這個非常重要的新年假期,你有電子郵件問候你...詳情
【本站聲明】
1、本網(wǎng)站發(fā)布的該篇文章,目的在于分享電商知識及傳遞、交流相關(guān)電商信息,以便您學習或了解電商知識,請您不要用于其他用途;
2、該篇文章中所涉及的商標、標識的商品/服務并非來源于本網(wǎng)站,更非本網(wǎng)站提供,與本網(wǎng)站無關(guān),系他人的商品或服務,本網(wǎng)站對于該類商標、標識不擁有任何權(quán)利;
3、本網(wǎng)站不對該篇文章中所涉及的商標、標識的商品/服務作任何明示或暗示的保證或擔保;
4、本網(wǎng)站不對文章中所涉及的內(nèi)容真實性、準確性、可靠性負責,僅系客觀性描述,如您需要了解該類商品/服務詳細的資訊,請您直接與該類商品/服務的提供者聯(lián)系。