1、特征选择
特征选择决定了使用哪些特征来做判断。在训练数据集中,每个样本的属性可能有很多个,不同属性的作用有大有小。因而特征选择的作用就是筛选出跟分类结果相关性较高的特征,也就是分类能力较强的特征。在特征选择中通常使用的准则是:信息增益。
2、决策树生成
选择好特征后,就从根节点触发,对节点计算所有特征的信息增益,选择信息增益最大的特征作为节点特征,根据该特征的不同取值建立子节点;对每个子节点使用相同的方式生成新的子节点,直到信息增益很小或者没有特征可以选择为止。
3、决策树剪枝
剪枝的主要目的是对抗「过拟合」,通过主动去掉部分分支来降低过拟合的风险。
【简介】
决策树是一种解决分类问题的算法,决策树算法采用树形结构,使用层层推理来实现最终的分类。
画决策树的步骤如下:
A、先画一个方框作为出发点,又称决策节点;
B、从出发点向右引出若干条直线,这些直线叫做方案枝;
C、在每个方案枝的末端画一个圆圈,这个圆圈称为概率分叉点,或自然状态点;
D、从自然状态点引出代表各自然状态的分枝,称为概率分枝;
E、如果问题只需要一级决策,则概率分枝末端画三角形,表示终点 。
例题)
假设有一项工程,施工管理人员需要决定下月是否开工。如果开工后天气好,则可为国家创收4万元,若开工后天气坏,将给国家造成损失1万元,不开工则损失1000元。根据过去的统计资料,下月天气好的概率是0.3,天气坏的概率是0.7。请做出决策。现采用决策树方法进行决策
【解】第一步:将题意表格化
第二步:画决策树图形,根据第一步所列的表格,再绘制决策树,如下图;
决策树是一种帮助企业管理者更有效地进行分析的决策工具。一些简单的情况,用Word或者简单的工具就可以完成,Word操作有点困难;用亿图图示软件工具对相对复杂的情况都能轻松画出,会让你更好的分析和判断,希望对你有帮助!
决策树的画法如下:
1、下载一个“决策树”的绘制软件,比如亿图图示,更新到最新版本,在电脑联网的情况下启动软件,登录账号后新建一个“决策树”。依次点击“管理-咨询”-“项目管理”-“决策树”,然后选择一个模板,点击使用。
2、打开画布左侧的符号库,可以看到很多专业的决策树符号,然后对想用的符号进行拖拽和使用,也可以修改模板的绘图形状打造个性化的决策树。
3、双击文本框,替换掉决策树模板中文字或者删除一些不需要的文本框。
4、完成对决策树的绘制后,可以点击右侧上方的保存、下载、分析等按钮,对制作好的决策树进行存储。还可以将决策树导出为图片、PDF、PPT等多种格式。
绘制软件亿图图示
亿图图示是一款国产的办公软件,支持Windows、Mac系统平台,还支持网页在线版和云同步储存,只需要登录账号就能绘制图示。它支持多种导入格式,例如Visio文件、SVG、Excel等,也支持多样的导出格式,如图片、PDF、PPT、SVG等。
决策树法的几个关键步骤是:
1、画出决策树,画决策树的过程也就是对未来可能发生的各种事件进行周密思考、预测的过程,把这些情况用树状图表示出来.先画决策点,再找方案分枝和方案点.最后再画出概率分枝。
2、由专家估计法或用试验数据推算出概率值.并把概率写在概率分枝的位置上。
3、计算益损期望值,从树梢开始,由右向左的顺序进行.用期望值法计算.若决策目标是盈利时,比较各分枝,取期望值最大的分枝,其他分枝进行修剪。
扩展资料
决策树的优点
1、决策树易于理解和实现. 人们在通过解释后都有能力去理解决策树所表达的意义。
2、对于决策树,数据的准备往往是简单或者是不必要的 . 其他的技术往往要求先把数据一般化,比如去掉多余的或者空白的属性。
3、能够同时处理数据型和常规型属性。其他的技术往往要求数据属性的单一。
4、 在相对短的时间内能够对大型数据源做出可行且效果良好的结果。
5、对缺失值不敏感
6、可以处理不相关特征数据
7、效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
决策树的缺点
1、对连续性的字段比较难预测。
2、对有时间顺序的数据,需要很多预处理的工作。
3、当类别太多时,错误可能就会增加的比较快。
4、一般的算法分类的时候,只是根据一个字段来分类。
5、在处理特征关联性比较强的数据时表现得不是太好
本文转载自互联网,如有侵权,联系删除