《金融数据挖掘》实验课程教学大纲
1.
课程概况
|
开课单位
|
合肥工业大学经济学院
|
课程类型
|
|
|
课程名称
|
金融数据挖掘课程实习
|
课程代码
|
1841133B
|
|
开课学期
|
第六学期
|
学时
/
学分
|
16
|
|
选课对象
|
金融工程系学生
|
|
先修课程
|
计量经济学、统计学等
|
|
实验课程指导书
|
Pang-Ning Tan, Michael Steinbach
等著,范明、范宏建等译
.
数据挖掘导论
.
人民邮电出版社,
2015
|
|
参考书目和资料
|
戴红等著
.
数据挖掘导论
.
清华大学出版社,
2015
黄文,王正林编著,数据挖掘:
R
语言实战
.
电子工业出版社,
2014
|
|
课程简介
:数据挖掘作为当下大数据时代最关键的技术,其在金融领域的应用前景不可估量。金融数据挖掘课程设计是基于金融数据挖掘技术的实战演练,侧重使用具体的工具来进行数据挖掘,并进行数据分析。重点讲述
Weka
、
Matlab
、
R
等重要数据挖掘软件在分类、聚类、关联分析等经典数据挖掘算法中的使用,在引入大量金融数据的基础上,对挖掘结果进行充分分析和评估。
|
|
课程目标
(Course Objectives, CO)
|
对应的专业培养目标
(Learning Objectives, LO)
或实践能力标准
(Practical Abilbiy, PA)
|
|
(CO1)
掌握数据挖掘的基本知识
|
(PA2)
计量经济学的理论与应用能力
|
|
(CO2)
掌握数据挖掘的经典工具
|
(PA3)
金融数据处理能力
|
|
(CO3)
独立进行数据挖掘分析
|
(PA5)
金融统计软件应用能力
|
|
教学方式
(
Pedagogical Methods,PM)
|
□
PM1.
讲授法教学
|
4
学时
25 %
|
□
PM2.
研讨式学习
|
学时
%
|
|
□
PM3.
案例教学
|
学时
%
|
□
PM4.
网络教学
|
学时
%
|
|
□
PM5.
角色扮演教学
|
学时
%
|
□
PM6.
体验学习
|
学时
%
|
|
□
PM7.
自主学习
|
8
学时
50%
|
□
PM8.
演示教学
|
4
学时
25 %
|
|
|
|
|
|
|
评估方式
(
Evaluation Methods,EM)
|
□
EM1.
实验预习
|
%
|
□
EM2.
实验操作
|
40%
|
□
EM3.
提问及讨论
|
%
|
|
□
EM4.
实验报告
|
40%
|
□
EM5.
总结
报告
|
%
|
□
EM6.
出勤率
|
20 %
|
|
□
EM7.
期末考试
|
%
|
□
EM8.
笔试
|
%
|
□
EM9.
口试
|
%
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
实验课程内容
(
实验类别分五种:演示、验证、综合、设计性、其它)
|
课次
|
学时
|
课程目标
|
实 验 教 学 主 要 内 容
|
教学方式
|
评估方式
|
实验
类别
|
|
1-2
|
3
|
CO1
CO2
|
实验一
决策树分类算法
内容提要:决策树分类算法是数据挖掘分类问题中的基本经典算法,通过
Weka\Matlab\R
工具实现决策树算法,并通过对样本数据的分类过程,加深对该分类算法的理解和应用过程。
|
PM1
PM7
PM8
|
EM2
EM6
|
演示
|
|
2-3
|
3
|
CO2
CO3
|
实验二
贝叶斯分类器
内容提要:基于贝叶斯的分类算法是数据挖掘在金融领域分类问题应用较多的算法,通过
Weka\Matlab\R
工具实现贝叶斯分类,并通过对样本数据的分类过程,加深对该分类算法的理解和应用过程。
|
PM1
PM7
PM8
|
EM2
EM6
|
演示
|
|
4-5
|
3
|
CO1
CO2
|
实验三
K
均值聚类算法
内容提要:
K
均值聚类算法是数据挖掘聚类问题中的基本经典算法,通过
Weka\Matlab\R
工具,利用
K
均值聚类算法对给定样本数据实现聚类过程。
|
PM1
PM7
PM8
|
EM2
|
演示
验证
|
|
5-6
|
3
|
CO2
CO3
|
实验四
DBSCAN
聚类算法
内容提要:掌握
DBSCAN
聚类算法原理,通过
Weka\Matlab\R
工具实现
DBSCAN
聚类,并探讨其与
K
均值聚类算法的区别。
|
PM1
PM7
PM8
|
EM2
EM6
|
演示
验证
|
|
7-8
|
4
|
CO1
CO2
CO3
|
实验五
关联规则的获取
内容提要:掌握关联规则获取过程,运用
Weka\Matlab\R
工具对训练数据集进行关联信息获取。
|
PM1
PM7
PM8
|
EM2 EM6
|
演示
验证
|
|
|
|
期末出具实验报告
|
|
EM4
|
|
|
|
|
学时合计
16
|
|
|
|
|
|
|
|
|
2.
授课教师信息一览表
3.
实验的主要仪器设备
本实验课程主要使用的仪器设备有:计算机、
Weka\Matlab\R
软件
4.
实验指导书具体要求
(限
300-600
字,需对实验课程目标达成有具体要求。)(有实验的课程必须有实验指导书,实验指导书应与实验课程教学大纲相配套。)
本课程在数据挖掘理论分析与算法设计的基础上,侧重联系实际问题,结合实际金融数据,运用数据挖掘技术及软件进行实例分析。依照课程目标,本实验指导书编排了三个实验,进一步巩固学生所学知识,加深对数据挖掘基本概念、基本原理与算法设计的理解,全面掌握基本数据挖掘技术与工具,综合运用所学算法,运用
Weka\Matlab\R
等
软件上解决给定的数据分析问题。
一、具体实验任务
实验一 分类算法实现
实验目的:通过分析决策树分类,贝叶斯分类器等分类算法的分类原理,利用
Weka\Matlab\R
等
软件实现具体分类算法,并通过对样本数据的分类过程,加深对该分类算法的理解与应用过程。
实验二 聚类算法实现
实验目的:通过分析
K
均值,
DBSCAN
等聚类算法的聚类原理,利用
Weka\Matlab\R
等
软件实现具体聚类算法,并通过对样本数据的聚类过程,加深对该聚类算法的理解与应用过程。
实验三 关联规则获取
实验目的:通过一个已有的训练数据集,观察训练集中的实例,进行关联信息的获取,更好的理解和掌握关联规则算法的基本原理。
二、实验基本要求
1.
熟练掌握相关数据挖掘算法原理及过程;
2.
全面分析样本数据,构造解决思路与实现步骤;
3.
熟悉并掌握基本数据挖掘软件,如
Weka\Matlab\R
等;
4.
运用数据挖掘软件展现数据挖掘结果并进行评价和说明。
5.
实验报告内容及要求
实验报告主要包括以下十部分内容:
一、实验目的
二、实验背景
三、算法思想
四、实验设计
五、实验环境
六、实验数据
七、实验步骤
八、代码及结果
九、结果分析
十、总结
实验要求:通过实验,要求掌握相关数据挖掘算法,并能够对实验结果进行分析及评价,最后完成实验报告。