Opis Big Data
Trajanje 5 dana
Predznanje poznavanje pythona, alogritama
Tko treba slušati -


SADRŽAJ:

Finding Similar Items (SimHash, MinHash,LSH (Locality Sensitive Hashing), Primjeri implementacije u pythonu i u nekoj raspodijeljenoj okolini (Spark, Hadoop)),Finding Frequent sets (Apriori, PCY,SON, primjeri implementacije u pythonu, Recommender Systems (Content-based Recommendation,, Collaborative Filtering, Matrix Factorization,Primjeri implementacije u pythonu i u nekoj raspodijeljenoj okolini (Spark, Hadoop)), Alternativa – Stream Analysis (Sliding windows, Bloom Filter,Flajolet-Martin, Alon-Matias-Szegedy, Datar-Gionis-Indyk-Motwani,Primjeri implementacije u pythonu i u nekoj raspodijeljenoj okolini, Mining Large graphs (Link Analysis, Community Detection, Clustering,), Dimensionality Recuction, Principal component Analysis, Singular Value Decomposition, CUR Decomposition (Primjeri implementacije u pythonu i nekoj raspodijelčjenoj okolini (Spark, Hadoop).