到今朝为止,我们所有的实现都是单线程的,所以我们决定摸索 k-means++ 算法的并行化部分。因为我们在应用 Jupyter Notebook,所以我们选择应用用于并行计算的 ipyparallel 来治理并行性(ipyparallel 地址:https://github.com/ipython/ipyparallel)。应用 ipyparallel,我们不必担心┞符个办事器分叉,但我们须要解决一些特别问题。比如说,我们必须指导我们的工作器节点加载 NumPy。
- t1 = time.time()
- centroids = k_means(signals, 100, 100)
- t2 = time.time()
- print("Took {} seconds".format(t2 - t1))
- Took 1138.8745470046997 seconds
向量化的实现
应用 NumPy 的一大年夜优势是向量化运算。(如不雅你不太懂得向量化运算,请参考这个链接:http://www.scipy-lectures.org/intro/numpy/operations.html)
推荐阅读
Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 固然 git 出生距今已有 12 年之久,网上各类关于 git 的介绍文┞仿数不堪数,然则依然有很多人(包含我本>>>详细阅读
本文标题:如何为时间序列数据优化K-均值聚类速度?
地址:http://www.17bianji.com/lsqh/38787.html
1/2 1