2013年7月16日 星期二

[hadoop] Hadoop Summit, San Jose - June 26-27, 2013 slides and video and about hive

Hadoop Summit, San Jose - June 26-27, 2013
http://hadoopsummit.org/san-jose/schedule/

已經有上傳slides跟影片可以看了。

幾個hive相關的sessions

- Simplifying Use of Hive with the Hive Query Tool
http://www.slideshare.net/Hadoop_Summit/scaffidi-june26-405pmroom212
Simplifying Use of Hive with the Hive Query Tool - YouTube
http://www.youtube.com/watch?v=5if1GXBBKMQ
TripAdvisor內部使用 perl 撰寫 接上 Hive CLI 的 Hive Query Tool
還有提供Template制定要選取的query語法範本,
主要是想要提供給非程式設計師使用的query介面。
tripadvisor/hive-query-tool
https://github.com/tripadvisor/hive-query-tool
A web interface to Hive with flexible, user-friendly query customization

- An In-Depth Look at Putting the Sting in Hive
http://www.slideshare.net/Hadoop_Summit/gates-june27-1100amroom210a
Hortonworks 對 Hive改進的報告,
其中有幾個重要的改進點,還有join的時候把所以的data都load到各台的memory裏面,
減少很多步驟會產生中間暫存檔,加快了不少速度。
還有 sort merge bucket /SMB 的改進。

- Master Chief Loves Hive -- Using Hadoop in the Cloud
http://www.slideshare.net/Hadoop_Summit/flasko-june27-425pmhall1
Master Chief Loves Hive- Using Hadoop in the Cloud - YouTube
http://www.youtube.com/watch?v=dXodQRFA1HM
microsoft 的keynote 關於 hive query and online service HDinsight demo,
怎麼從小的規劃演變到使用big data tools。
可以看到很多關於,windows上的tools演示 包跨使用 excel 操作hive。

- ORC File & Vectorization - Improving Hive Data Storage and Query Performance
http://www.slideshare.net/Hadoop_Summit/hanson-o-malleypandeyjune27425pmroom212
ORC File & Vectorization - Improving Hive Data Storage and Query Performance - YouTube
http://www.youtube.com/watch?v=GV7vpR7vpjM








沒有留言:

張貼留言