Mahout API简介它主要包括以下几个部分:(1)基于协同过滤的Taste(一个推荐引擎)相关的api,包名以org.apache.mahout.cf.taste开始(2)聚类算法相关的api,包名以org.apache.mahout.clustering开始(3)分类算法,包名以org.apache.mahout.classifier开始(4)频繁模式算法,包名以org.apache.mahout.fpm开始(5)数学计算相关算法,包名以org.apache.mahout.math开始(6)向量计算相关算法,包名以org.apache.mahout.vectorizer开始
Mahout实现了数据挖掘中常见的算法,包括:频繁模式挖掘,聚类,分类以及推荐引擎另外,还实现了数据挖掘中常见的预处理算法。Apache Mahout因为实现的聚类算法有:Canopy聚类算法,K-means聚类算法,模糊K-Means聚类算法,Mean Shift聚类算法,Dirichlet过程聚类算法和Latent Dirichlet Allocation聚类算法。这些算法相关的API都可以在org.apache.mahout.clustering包中实现。
Mahout应用:使用taste建立一个推荐引擎Taste 是 Apache Mahout 提供的一个协同过滤算法的高效实现,它是一个基于 Java 实现的可扩展的,高效的推荐引擎。Taste 既实现了最基本的基于用户的和基于内容的推荐算法,同时也提供了扩展接口,使用户可以方便的定义和实现自己的推荐算法。同时,Taste 不仅仅只适用于 Java 应用程序,它可以作为内部服务器的一个组件以 HTTP 和 Web Service 的形式向外界提供推荐的逻辑。Taste 的设计使它能满足企业对推荐引擎在性能、灵活性和可扩展性等方面的要求。