2012年8月19日 星期日

[note] 兩則 關於 搜尋引擎 搜索引擎 search engine

[note] 兩則 關於 搜尋引擎 搜索引擎 search engine

[转发]新浪网招聘搜索引擎研发工程师/数据挖掘和推荐系统工程师(实习生)
2012-07-17 16:33

职位:

搜索引擎研发工程师

职责:

新浪网新闻和资讯搜索系统(http://search.sina.com.cn)的开发和优化

要求:

熟练掌握C/C++语言
熟悉Linux系统开发环境及常用脚本语言
熟悉搜索引擎原理和相关算法
具备搜索引擎系统开发经验者优先

职位:

数据挖掘和推荐系统工程师或实习生

职责:

新浪网用户兴趣数据的挖掘和分析
基于用户兴趣的推荐阅读系统

要求:

熟练掌握C/C++语言
熟悉Linux系统开发环境及常用脚本语言
熟悉自然语言处理、数据挖掘和推荐系统相关算法
具备数据挖掘和推荐系统开发经验者优先
在京高校在校生优先(实习生)

感兴趣的话请把简历发到 pilot.cn{at}gmail.com 把{at}替换为@


從lucene變成顯學後,其實 搜尋引擎 的技術已經運轉了二三十年了(從1990~2012),
以目前來看,
搜尋引擎技術,已經不是什麼太艱難的獨家技術。

大部份要徵搜尋引擎的人,普遍上來說,都是公司已經以hadoop 來大規模處理,更甚至建反轉索引,還有直接使用Lucene。
從Lucene開始,Nutch的發展,後來有了Hadoop跟 Google GFS paper與Mapreduce paper。
以前,以前的精華技術都大量的流出。
trace Lucene code到爛的工程師應該也不計其數。

十之八九的公司在運用這技術時都脫離不了那個影子,
甚至來說,是直接使用。
當然,如果是做搜尋的公司,那可能需要很大精力的調教了。

所以說,現在這些公司徵的大多要會Machine Learning 或者是Data Mining的人了。






沒有留言:

張貼留言