Diplomová práca
Optimalizácia vyhľadávania najlepších k objektov v prostredí Hadoop
Vedúci:
RNDr. Peter Gurský PhD.
Ciele:
- Porovnanie rôznych spôsobov uloženia zdrojových dát pre vyhľadávania v prostredí Hadoop.
- Adaptácia úložísk v prostredí Hadoop na prácu s fuzzy lokálnymi používateľskými preferenciami.
- Otestovanie rýchlosti vybraných úložísk pri vyhľadávaní najlepších k objektov.
- Získané výsledky analyzovať a vyhodnotiť.
- COULOURIS G., DOLLIMORE J., KINDBERG T.: Distributed systems, concepts and design. Third edition. Pearson Education Limited, 2001, 772 s
- DEAN J., GHEMAWAT S.: MapReduce: Simplified Data Processing on Large Clusters. 2004
- Wiki projektu Hadoop: http://hadoop.apache.org/
- MICHEL S., TRIANTAFILLOU P., WEIKUM G.: KLEE: A framework for distributed top-k query algorithms. In Proceedings of the 31st International Conference on Very Large Data Bases. 2005, s. 637–648
- CHANG F., DEAN J., GHEMAWAT S., HSIEH C. W., WALLACH D. A., BURROWS M., CHANDRA T., FIKES A., GRUBER R. E.: Bigtable: A Distributed Storage System for Structured Data. 2006