<b>進軍教育搜索 百度搞不定的三件事</b>
作者:caiji 來源:未知 2013-05-04 10:07:11
閱讀次
我要評論
直達商品
張迪歐
據報道,搜索引擎巨子百度起頭涉足教育培訓規模,低調測試一款新品。當用戶在搜索欄中輸入“雅思培訓”時,搜索結不美觀直接顯示教學機構名稱,其搜索深度已經接近課程級。這在教育培訓行業是個爆炸性新聞值得剖析關注,因為此舉有可能改變教育行業的推廣名目。可是讓我們拋開百度的年夜平臺效應 ,僅年夜教育行業紀律出發,以沙盤演繹的體例剖析之后,至少今朝我認為,百度教育搜索應該有三件年夜事兒搞不定。
百度起頭涉足教育培訓規模
以上是百度以這種體例考試考試教育搜索時難以解決的三年夜問題,當然,百度作為流量巨子和資金巨子,必定會有不少高人年夜中經營,是以也許內部已經解決了這些問題,只是沒有展示出來而已。這些問題如不美觀能夠解決,將為國內教育培訓規模帶來一次概縵泓性的轉變,否則百度還不如自己另做或收購一家教育中心頁網站更為平安妥帖。

第一個搞不定:課程數據是個黑洞。
如不美觀百度此舉是為了晉升搜索體驗,那必定要采納搜索引擎爬蟲的體例向全行業抓取數據。否則如不美觀百度的不抓取數據而是要求教育機構自行提交數據的話,此舉將只是鳳巢推廣系統的一部門;這一點咱們暫且不表,留不才文言說。
先談談搜索引擎爬取的問題�?梢哉f,所有的行業里,教育培訓規模的課程數據整合是最難的,甚至難到了在邏輯上都不能驗證通順的水平。我之前介入過一個教育類垂直搜索引擎的項目,那一段時刻最年夜的惡夢就是數據問題。之所以最終選擇了收集教育,就是因為收集教育的課程數據具有必然水平的可實施性。而百度這么年夜的動作不成能只知足于收集教育,他們的指向應該是全行業的線下教育搜索,于是,問題馬上就要來了。
如不美觀UE工程師能很好地解決這個問題的話,那么還有個更恐怖的問題根消融決不了,這就是展示單元的問題。百度按照測試頁面的樣子展示課程數據,其根基的單元就是“課”,而不是“校”。如不美觀舊的搜索體例中,一個搜索結不美觀頁列表能最多容納20個教育機構廣告的話,那么新的教育搜索,一個頁面最多只能容納20條目程。如不美觀用戶想多看就只能翻頁了…… 如不美觀這樣的話,用戶不罵街才怪。
第二,課程數據難以抓取和更新。假定課程已經規范,但教育規模的網站之千姿百態是巨匠所公認。即便一家網站,分歧學科的頁面html規范都分歧,更有甚者,教育機構的課程介紹根基以課表形式展示,這需要人類的智能去讀懂。百度爬蟲若何能把這么多種分歧的HTML,把這么多分歧邏輯的蓖ㄐ偶爬取拆解清算入庫呢?這是人工智能規模的一浩劫題,生怕百度難以解決。即便真的做到了,那么教育機構的課表轉變,搜索爬蟲的更新頻率能跟得膳縵憒?當然,百度可以讓教育機構自動提交信息,這個在后文將進行切磋。
所以如不美觀百度以搜索引擎的體例解決教育規模精準搜索的問題,只能犧牲量而求質,求質就得推廣少數機構,推廣少數機構就釀成磷貧費推廣,成了鳳巢系統的一部門,就成了廣告行為。反過來,如不美觀求量而犧牲質,那么這種數據黑洞解決不了,質量不高,百度吃力不奉迎。
第二個搞不定:搜索展示頁空間不足,在產物層面解決不了教育規模的問題。
前文中已經鋪墊過,即,如不美觀百度采納讓教育機構推送課程數據的體例,像傳統的競價系統一樣,只有付費的機構才可以推廣,那么這種體例與百度的頁面若何融合,與用戶的閱讀習慣若何融合,若何供給充實的展示空間,這將成為UE設計師的惡夢。
眾所周知,搜索引擎SEM推廣占領的就是搜索結不美觀首頁首屏的位置,而這個頁面總共才有3到4頻奔傳統搜索結不美觀里,一條搜索結不美觀的Title和Description最多有四五行;但在百度教育搜索測試頁面展示的,除了每條目程信息占有4行之外,頂部還要掛上篩選器,篩選器就占有了一年夜塊空間。而且我們已經看到,這4行名目化的課程信息,其作為商業數據,行高必然要高于傳統的文本。也就是說,百度教育搜索的搜索結不美觀頁與通俗搜索結不美觀頁對比,要吃失蹤年夜量的高度,會把頁面拉長良多,這很考驗用戶耐心。
用戶會不滿,教育機構也會罵街:“以前20塊錢一個點擊,我的機構介紹能上首頁首屏第一位,此刻20塊錢一個點擊,我的機構只能上一個課程在膳縵沔,還沒有毛遂自薦的處所。”
產物司理必定會很委屈,那么就把這種教育搜索縮成小塊放在頂部吧,也會碰著同樣的問題,在小塊里展示校仍是課?展示“校”,和以前對比意義不年夜;展示“課”,每家教育機構的課都足夠這個小框里翻頁N次,這么多機構若何展示完全若何排序呢?如不美觀競價的話,若何按“課”向教育機構收費呢?教育機構會知足么?
首先是數據的規范性極低,無法統一展示。教育行業的素質是處事,依年夜分歧的學科擁有分歧的處事特征,分歧的機構則有分歧的課表尺度。就拿課時來說,A機構說的是課時,B機構談的是學時,C機構爽性就按小時計費,D機構說一個月是個培訓期,E機構也談課時,但他們的一課時是30分鐘……再說班型的概念,分歧機構的班型界說紛歧樣,班型自己千變萬化,而且還有同樣概念分歧名稱的班型。僅收集教育的現有機構,網校網抓取的班型就快要300種,更況且線下教育的復雜集群。再年夜教育機構來看,有的機構以教師引領,有的機構以教學的組織引領,有的是一對一教學,分歧的黌舍理念分歧,課程設置分歧,促銷體例分歧,甚至根基的名詞界說都分歧。這個不像什物商品,什物商品屬性是根基規范的;也不像飯館,飯館是以“店”為單元去組織的。教育搜索引擎如不美觀想做到真正的處事深度,那么必需以“課”為根基單元(百度今朝就是這么做的),這就相當于搜索到飯館里“菜品”的級別了。在這種極不規范的市場下,根柢無法實現這種級此外抓取。如不美觀百度提出自己的尺度,教育機構能否按照百度的批示棒去執行?如不美觀百度把這些屬性強行整合,那媚暌怪若何為用戶供給切確處事呢?
推薦閱讀
網站如何牽著搜索引擎的鼻子走路
在站長圈子里,如不美觀要談判seo與搜索引擎的關系,簡陋會有這么三種不美觀念: 第一種,也是斗勁初級的不美觀念:搜索引擎就是全數,排名就是網站的生命線,流量就是站長的衣食怙恃,而seo是帶來網站流量的獨一手段>>>詳細閱讀
本文標題:<b>進軍教育搜索 百度搞不定的三件事</b>
地址:http://www.xglongwei.com/a/34/20130504/268091.html
1/2 1
2 下一頁