前言介绍
Weka 的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是 SPSS 公司商业数据挖掘产品--Clementine )的,基于 JAVA 环境下开源的机器学习(machine learning)以及数据挖掘(data mining)软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写 WEKA 也是新西兰独有的一种鸟名(新西兰秧鸡),而 Weka 的主要开发者同时恰好来自新西兰的怀卡托大学(The University of Waikato)。
2005 年 8 月,在第 11 届 ACM SIGKDD 国际会议上,怀卡托大学的 Weka 小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka 系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一(已有 16 年的发展历史)。Weka 的每月下载次数已超过万次。
1、安装 weka
1.1 安装环境
- win10
- 已经安装了 jdk
1.2 下载
找到weka 官网,找到如下下载界面,点击 download:
点击后可以打开如下界面,下载可以分为三个选项:
这里简单说一下这三个版本的区别:
- stable version:是稳定版本,当前是 3.8 版本
- developer version:开发者版本,也就是最新版本,当前版本是 3.9 版本,拥有更多的功能,但是也可能存在一些未解决的 bug
- old version:历史版本,指的是 3.7 及以前的版本
我用的是稳定版本,大家可以根据自己的需求去下载自己想要的版本。
安装比较简单,一路 next 即可:
1.3 安装目录说明
打开安装目录,说一下安装目录的各个子目录作用,如下图:
还有目录下各个文档程序相关说明:
1.4 documentation.html
仔细看了这个内容还挺重要的,这里重点提一下,尤其是不熟悉 weka 的新手,打开这个网页,可以看到如下所示:
其中比较关键的是 weka 的 java 包 API 文档,如果要集成到 java 开发环境中,这个还是比较关键的,不过因为是英文的,看起来略微有些困难。
2、软件界面基本介绍
打开 weka,可以得到如下界面:
如上所示,weka 的 GUI 界面包含 4 个菜单选项和右边五个应用选项,下面来一一说明一下。
2.1 weka 菜单
(1)Program(程序)
- LogWindow:日志窗口,打开一个日志窗口,捕获所有的 stdout 或者 stderr 输出。在 Windows 环境下,如果不带控制台输出启动 Weka,日志窗口比较有用。
- Memory usage:打开一个显示内存使用情况的窗口,如果用户发现内存占用过大,可单击窗口右边的 GC 按钮,启动垃圾回收器。
- Settings:设置,可以设置图形界面的风格和网络超时时间。
- Exit:退出,退出 GUI 选择器。
(2)Visualization(可视化)
- Plot:散点图,绘制数据集的 2D 散点图。
- ROC:受试者工作特征曲线,显示预先保存的 ROC 曲线。
- TreeVisualizer:树结构可视化,显示有向图,例如,决策树
- GraphVisualizer:图结构可视化,显示 XML、BIF 或 DOT 格式的图,例如,贝叶斯网络。
- BoundaryVisualizer:边界可视化,显示二维空间中分类器决策边界的可视化。
(3)Tools(工具)
- Package manager:包管理器,允许用户选择安装感兴趣或需要的软件包。
- ArffViewer ARFF:文件查看器,以电子表格形式查看 ARFF 文件的 MDI 应用。
- SqlViewer SQL:查看器通过 JDBC 查询数据库的简单窗口,支持连接数据库,执行 SQL 语句,并显示结果。
- Bayes net editor:贝叶斯网络编辑器,一个用于编辑、可视化和学习贝叶斯网络的应用。
(4)Help(帮助) 
- Weka Homepage Weka:主页,在浏览器中打开 WEKA 主页。
- HOWTOs, code snippets, etc.:WekaWiki,其中包含许多关于 WEKA 开发和使用的示例和指南。
- Weka on Sourceforge:Weka 项目在 Sourceforge.net 网站上上的主页。
- SystemInfo:系统信息,显示关于 Java/WEKA 环境的内部信息,例如,CLASSPATH。
2.2 application(应用程序)
- Explorer 探索者界面,WEKA 中用于数据探索的软件环境。
- Experimenter 实验者界面,针对不同的机器学习方法进行实验和统计测试。
- KnowledgeFlow 知识流界面,功能和 Explorer 类似,但是使用拖拽的方式进行操作,同时它还支持增量学习。
- Workbench 工作台界面,包含了其他界面的组合。
- SimpleCLI 简单命令行界面,一个简易的命令行接口,可以在不支持命令行的操作系统中直接调用 Weka 命令。
2021年4月18日 下午2:14 1F
登录回复
测试一下
2021年4月18日 下午4:04 B1
登录回复
@ 王毅 你好!!
2021年4月18日 下午4:04 B1
登录回复
@ 王毅 你好
2021年4月18日 下午4:05 B1
登录回复
@ 王毅 测试一下sss
2021年4月18日 下午4:43 B1
登录回复
@ 王毅 为什么不生效?
2021年4月18日 下午8:57 B1
登录回复
@ 王毅 fdaf
2021年4月18日 下午9:00 B1
登录回复
@ 王毅 供热无人
2021年4月18日 下午9:08 B1
登录回复
@ 王毅 dfadsafa
2021年4月18日 下午4:06 2F
登录回复
你有毒有毒!!
2021年4月18日 下午4:06 3F
登录回复
太假了吧