初心者站長之家
打印

自建搜索网站的难点

自建搜索网站的难点

自建搜索网站的难点
& z! K$ s6 N* C$ b  g  j3 B$ x% ~( l% `
自建搜索与做seo还是不同的,做seo要依赖于其它的搜索,而自己建一个搜索的话,排名就完全可以自己控制,但这个资源占用太多,一般的公司是做不起的,不过作为一个从事seo优化网站的人员,了解一下这个原理还是不错的。
* a' G; D) O: \8 N- s3 N
' b& k+ z% E; W* x* T. O* [" m5 S现在开源的搜索代码也不少,但是满网络爬的还是不多见,大多数是垂直搜索。近日,继搜狗公开叫板百度之后,奇虎360、腾讯和优酷昨日均明确表示,将在搜索领域发力。加上一些小的搜索,垂直搜索的越来越多了。也有不少个人站长在尝试做google这样的站点。本博一时兴起,也跟进做了一个,但是在做的过程中,发现资源占用太大,根本进行不下去。
9 Q, H6 P* E2 v6 E7 D- ?
" [: U9 Q; x6 X* L0 _' M就拿关键字提取来说吧,测试时一个22M的文本,通过字典提取关键字,在VPS上花了我30多个小时。SCWS是一个开源免费的简易中文分词系统,PHP分词的上乘之选!确实可以解决中文的问题,加上Sphider。看起来很完美,可是建一个索引,就把我的资源占完了,说超过限制。
5 u1 t1 \: k3 A  z& B# O
; Q- s) j) Z2 B3 U  |7 h, }% k# c看来,自建搜索网站还真不是个人玩的起的。不过,了解一下这个原理还是有意思的。


TOP