derrickburns / generalized-kmeans-clustering 1.2.2

Apache License 2.0 Website GitHub

Spark library for generalized K-Means clustering. Supports general Bregman divergences. Suitable for clustering probabilistic data, time series data, high dimensional data, and very large data.

embeddings
spark-mllib
itakura-saito-divergence
cosine-similarity
euclidean-distance
k-means
clustering
spark
kullback-leibler-divergence
similarity-search
entropy
bregman-divergence

Scala versions: 2.10

Latest version

[![massivedatascience-clusterer Scala version support](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer/latest.svg)](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer)

JVM badge

[![massivedatascience-clusterer Scala version support](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer/latest-by-scala-version.svg?platform=jvm)](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer)