多语言展示
当前在线:460今日阅读:23今日分享:25

数据挖掘之Mahout框架简介

Apache Mahout 是一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout 的最近版本中还加入了对 Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。
方法/步骤
3

Mahout API简介它主要包括以下几个部分:(1)基于协同过滤的Taste(一个推荐引擎)相关的api,包名以org.apache.mahout.cf.taste开始(2)聚类算法相关的api,包名以org.apache.mahout.clustering开始(3)分类算法,包名以org.apache.mahout.classifier开始(4)频繁模式算法,包名以org.apache.mahout.fpm开始(5)数学计算相关算法,包名以org.apache.mahout.math开始(6)向量计算相关算法,包名以org.apache.mahout.vectorizer开始

4

Mahout实现了数据挖掘中常见的算法,包括:频繁模式挖掘,聚类,分类以及推荐引擎另外,还实现了数据挖掘中常见的预处理算法。Apache Mahout因为实现的聚类算法有:Canopy聚类算法,K-means聚类算法,模糊K-Means聚类算法,Mean Shift聚类算法,Dirichlet过程聚类算法和Latent Dirichlet Allocation聚类算法。这些算法相关的API都可以在org.apache.mahout.clustering包中实现。

5

Mahout应用:使用taste建立一个推荐引擎Taste 是 Apache Mahout 提供的一个协同过滤算法的高效实现,它是一个基于 Java 实现的可扩展的,高效的推荐引擎。Taste 既实现了最基本的基于用户的和基于内容的推荐算法,同时也提供了扩展接口,使用户可以方便的定义和实现自己的推荐算法。同时,Taste 不仅仅只适用于 Java 应用程序,它可以作为内部服务器的一个组件以 HTTP 和 Web Service 的形式向外界提供推荐的逻辑。Taste 的设计使它能满足企业对推荐引擎在性能、灵活性和可扩展性等方面的要求。

推荐信息