极速天气 资讯 数据仓库与数据挖掘教与学(思政PPT+大纲+教案+视频+作业平台,魏伟一)

数据仓库与数据挖掘教与学(思政PPT+大纲+教案+视频+作业平台,魏伟一)

1

课程性质和课程目标

(一)课程性质

本课程以数据仓库和数据挖掘为主要内容,讲述数据仓库与数据挖掘的基本概念和方法,包括数据预处理、数据仓库与联机分析处理、数据仓库的设计与开发、以及数据挖掘的主要功能、数据挖掘、机器学习算法和应用,并通过对实际数据的分析更加深入地理解常用的数据挖掘与机器学习模型。培养学生数据分析和处理的能力。该课程的先修课程有概率论与数理统计、数据库原理和程序设计等。

(二)教学目的

本课程的主要目的是培养学生的数据仓库与数据挖掘的基本理论分析与应用实践的综合能力。通过本课程的教学,使学生掌握数据仓库和数据挖掘的一般原理和处理方法,能使用机器学习理论解决数据挖掘相关的问题。

2

教学内容

本课程全面而又系统地介绍了仓库与数据挖掘的方法和技术,反映了当前数据仓库与数据挖掘研究的最新成果。本课程主要学习的内容包括Python数据分析与可视化基础、认识数据、数据预处理、回归分析、关联规则挖掘、分类与预测、聚类分析、神经网络与机器学习基础、离群点检测以及Python数据挖掘案例分析等内容。

3

教学方式

多媒体机房教学、案例导向、项目驱动等教学方法、启发学生对学科知识的把握理解和实际操作能力。课程教学方法的改革以调动学生的积极性为核心。除讲授、提问、学生分析、讨论等常用的方法外,结合管理课程的特点,适应本科生培养的要求,探索并完善以 参与式、体验式、交互式和模拟教学等实践教学为基本形式的多种方法。并建立纸质、声音、电子、网络等多种媒体构成的立体化教学载体。

本课程的教学方式主要采用课堂讲授和实验操作,包括:课堂讲授、多媒体教学、实验操作、算法分析与设计、习题解析、课堂讨论、批改作业、课外辅导等多种形式相结合,保证学生掌握数据挖掘与机器学习的基本知识,理解算法的实现,培养学生的自学能力、分析问题和解决问题的能力。

教学方法:采用启发式教学和探究式教学,以学生为主体,鼓励学生自己针对某种数据挖掘与机器学习算法进行分析和研究,培养学生的自学能力。

教学手段:充分利用电子教案、CAI课件和网络教学平台等多种教学手段和资源。

考试环节:两次课堂小测验;学期末学生分为若干小组,每个小组研究讨论并实现某一前沿的数据挖掘算法或者实现实际的数据挖掘案例,以报告的形式进行讲解,最后提交一份课程学术报告。

4

建议学时和教学内容

本课程的教学时数为72学时,理论教学54学时,实验教学18学时。

向上滑动阅览

第一章绪论

教学要点:

1. 理解和掌握数据仓库与数据挖掘的基本概念、数据仓库的定义、组成以及数据挖掘的过程、数据挖掘的主要任务以及数据挖掘使用的主要技术。

2. 了解数据仓库和数据挖掘的应用和面临的问题。

3. 对数据挖掘能够解决的问题和解决问题思路有清晰的认识。

4. 熟练应用Jupyter notebook 的开发环境。

教学时数:

2 学时。

教学内容:

第一节数据仓库简介

1. 了解数据仓库的定义和特点。

第二节数据仓库与操作型数据库的关系

1. 熟练掌握数据仓库与数据库的区别。

第三节数据仓库的组成

1. 掌握数据仓库系统的组成。

第四节数据仓库的应用

1. 了解数据仓库的应用场景。

第五节基于Hadoop/Hive 的数据仓库技术

第六节数据挖掘的主要任务和数据源

第七节数据挖掘与机器学习常用的建模工具

1. 了解数据挖掘的商用和开源工具。

第八节利用Python进行数据挖掘

1. 掌握Python 数据挖掘的常用类库。

2. 熟悉Jupyter Notebook 的使用方法。

第九节数据仓库与数据挖掘的区别与联系

1. 掌握数据仓库与数据挖掘的区别及联系

考核要点:

掌握数据仓库与数据挖掘的定义和功能,理解数据挖掘在何种数据上进行, 数据挖掘可以挖掘什么类型的模式,掌握初级的数据仓库技术。

第二章认识数据

教学要点:

1. 理解和掌握数据对象和属性类型,数据的基本统计描述,掌握度量数据相似性和相异性的方法。

2. 了解数据可视化的方法。

教学时数:

2 学时。

教学内容:

第一节数据对象与属性类型

第二节数据的基本统计描述

第三节数据可视化

第四节度量数据的相似性和相异性

考核要点:

了解数据的属性类型,理解数据的基本统计描述, 掌握度量数据相似性和相异性的方法。

第三章数据预处理

教学要点:

1. 了解数据预处理的目的和意义。

2. 掌握如何对数据进行清理。

3. 掌握如何对不同数据源的数据进行合并。

4. 掌握如何对数据进行变换,使之适合建模的需要。

5. 掌握如何对数据进行消减,使得在消减后的数据集上挖掘更有效。

6. 掌握利用Python 进行数据预处理的方法。

教学时数

4 学时。

教学内容:

第一节数据预处理概述

第二节数据清理

第三节数据集成

第四节数据变换与数据离散化

1. 了解数值数据的离散化和概念分层产生。

2. 熟练掌握数据变换和数据离散化的方法。

第五节数据归约

1. 了解维归约:可以检测并删除不相关、弱相关或冗余的属性或维。

2. 理解数据压缩:使用编码机制压缩数据集。

考核要点:

理解数据清理、数据集成、数据规约、数据变换于数据离散化的方法, 掌握数据预处理的基本方法。

第四章数据仓库与联机分析处理

教学要点:

1. 掌握数据仓库的体系。

2. 掌握多维数据模型与OLAP

3. 掌握数据仓库的维度建模。

4. 了解数据仓库的发展。

教学时数:

4 学时。

教学内容:

第一节数据仓库的体系

1. 理解数据仓库的体系结构。

2. 理解数据仓库中的ETL 、数据集市和元数据。

第二节多维数据模型与OLAP

1. 掌握多维数据模型的概念。

2. 理解OLAP 的含义和基本操作。

3. 掌握多维数据建模的实现过程。

第三节数据仓库的维度建模

1. 理解数据仓库的维度建模。

2. 理解星型模型和雪花模型。

第四节数据仓库的发展

考核要点:

掌握数据仓库体系、OLAP 及维度建模。

第五章数据仓库设计与开发

教学要点:

1. 掌握数据仓库设计的过程。

2. 掌握基于Hive 的数据仓库实现

教学时数:

4 学时。

教学内容:

第一节数据仓库设计概述

1. 了解数据仓库设计的特点。

2. 掌握数据仓库的构建模式。

第二节数据仓库设计

1. 掌握数据仓库规划、需求分析及概念设计。

2. 理解数据仓库逻辑模型设计。

3. 理解数据仓库物理设计。

4. 了解数据仓库的部署与维护。

第三节基于Hive 的数据仓库实现

1. 理解Hive 数据仓库和数据库比较。

2. 掌握数据仓库的常用操作。

3. 掌握利用Hive 建立数据仓库。

考核要点:

掌握数据仓库的设计过程与方法,利用Hive 进行数据仓库设计开发。

第六章回归分析

教学要点:

1. 掌握回归分析原理。

2. 掌握一元线性回归分析。

3. 掌握多元线性回归分析。

4. 掌握逻辑回归。

5. 了解其他回归分析。

教学时数:

4 学时。

教学内容:

第一节回归分析概述

1. 理解回归分析的定义与分类。

2. 理解回归分析的过程。

第二节一元线性回归分析

1. 掌握一元线性回归方法。

2. 理解一元线性回归模型的参数估计。

3. 理解一元线性回归模型的误差方差估计。

4. 掌握利用Python 进行一元线性回归。

第三节多元线性回归

1. 理解多元线性回归模型。

2. 理解多元线性模型的参数估计。

3. 了解多元线性回归的假设检验及其评价。

4. 掌握利用Python 进行多元线性回归。

第四节逻辑回归

考核要点:

掌握回归的定义,各类回归的原理及Python 实现。

第七章关联规则挖掘

教学要点:

1. 了解关联规则的基本思想、概念和意义。

2. 了解关联规则挖掘的应用背景;掌握常用的关联规则算法。

3. 掌握利用Python 实现关联规则分析。

4. 了解其它方法的内容、了解关联规则挖掘的研究动态。

教学时数:4学时。

教学内容:

第一节关联规则分析概述

1. 了解购物篮分析。

2. 熟练掌握频繁项集、闭项集和关联规则的概念。

3. 理解频繁模式挖掘的路线图。

第二节频繁项集挖掘方法

1. 掌握Apriori 算法:使用候选项集找频繁项集。

2. 掌握由频繁项集产生关联规则的方法。

3. 理解提高Apriori 算法有效性的方法。

4. 掌握挖掘频繁项集的模式增长方法。

第三节关联规则评估方法

1. 了解强关联规则不一定是有趣的。

2. 使用提升度进行相关分析。

考核要点:

了解频繁项集、闭项集和关联规则的概念,理解模式评估方法, 掌握Apriori 算法和挖掘频繁项集的模式增长方法。

第八章分类

教学要点:

1. 了解分类及预测的基本思想、概念和意义。

2. 掌握常用的分类及预测算法(或模型)。

3. 了解分类及预测挖掘的研究动态。

4. 掌握利用Python 实现各种分类算法的方法。

教学时数:12学时。

教学内容:

第一节基本概念

1. 了解分类和预测的定义。

第二节决策树规约

1. 理解决策树归纳的概念。

2. 掌握属性选择度量的方法。

3. 理解树剪枝。

4. 决策树的Python 实现。

第三节K 近邻算法

1. K 近邻算法原理。

2. Python 算法实现。

第四节支持向量机

1. SVM 算法原理。

2. Python 算法实现。

第五节贝叶斯分类

1. 理解贝叶斯定理。

2. 掌握朴素贝叶斯分类算法。

3. 朴素贝叶斯算法的Python 实现。

第六节模型评估与选择

1. 分类器性能的度量。

2. 模型选择。

3. 利用Python 实现模型的评估与选择。

第七节组合分类

考核要点:

了解分类的概念,理解评估分类器性能的度量方法, 掌握决策树分类算法、SVM、贝叶斯分类算法、模型评估与选择、组合分类及利用Python实现分类的方法。

第九章聚类

教学要点:

1. 了解如何计算由各种属性和不同的类型来表示的对象之间的相异度。

2. 掌握K-Means 聚类、层次聚类、基于密度的聚类和其他常用方法。

3. 掌握利用sklearn 实现聚类的方法。

教学时数:10学时。

教学内容:

第一节聚类分析的概念

1. 理解什么是聚类分析。

2. 了解对聚类分析的要求。

3. 掌握基本的聚类方法。

第二节K-Means 聚类

第三节层次方法

1. 理解凝聚的和分裂的层次聚类。

2. 掌握簇间的距离度量。

3. 分裂和凝聚的层次聚类算法。

4. 算法实现。

第四节基于密度的方法

1. 算法原理。

2. 掌握DBSCAN 算法。

3. 掌握算法的Python 实现。

第五节其他聚类算法

1. 了解STING 算法。

2. 了解COBWEB 算法。

3. 掌握模糊聚类算法。

第六节聚类评估

1. 估计聚类趋势。

2. 学习确定簇数的方法。

3. 测定聚类质量。

考核要点:

了解聚类的概念,掌握k-Means k-Medoids 算法、层次方法和基于密度的方法等典型算法及其Python 的实现方法。

第十章神经网络与深度学习

教学要点:

1. 了解理解神经网络与深度学习的原理。

2. 掌握感知机与BP 神经网络的原理。

3. 了解深度学习基础。

教学时数:2 学时。

教学内容:

第一节神经网络基础

1. 理解神经元模型。

2. 理解感知机与多层网络。

第二节BP 神经网络

第三节深度学习

1. 理解深度学习基本原理。

2. 了解常用的深度学习算法。

考核要点:

了解神经网络的概念,掌握感知机模型和BP 神经网络、了解深度学习算法。

第十一章离群点检测

教学要点:

1. 了解离群点的概念与检测方法。

2. 掌握sklearn 中的异常值检测方法。

教学时数:2 学时。

教学内容:

第一节离群点概述

1. 理解离群点的概念和类型。

2. 理解离群点检测的挑战。

第二节离群点检测

1. 理解基于统计学的离群点检测方法。

2. 理解基于临近性的离群点检测方法。

3. 理解基于聚类的离群点检测方法。

4. 理解基于分类的离群点检测方法。

第三节sklearn 中的异常值检测方法

1. 了解利用Python 进行异常值检测的方法。

考核要点:

了解离群点的概念、类型以及离群点检测的常用方法,掌握sklearn 中的异常值检测方法。

第十二章文本和时序数据挖掘

教学要点:

1. 掌握文本数据挖掘的过程和基本方法。

2. 掌握时序数据挖掘主要方法。

教学时数:4 学时。

教学内容:

第一节文本数据挖掘

1. 理解文本数据挖掘的任务。

第二节文本分析与挖掘的主要方法

1. 理解文本挖掘预处理的方法。

2. 理解文本表征、文本分类、聚类与文本可视化方法。

第三节时序数据挖掘

1. 掌握时间序列平稳性与随机性判定方法。

2. 掌握时序数据的典型分析挖掘模型,主要包括自回归滑动平均模型、差分整合移动平均自回归模型和季节性差分自回归移动平均模型。

考核要点:

掌握文本挖掘的主要任务和基本方法,时序数据预测的主要模型。

第十三章数据挖掘案例

教学要点:

1. 掌握数据挖掘的分析与实现。

2. 掌握利用sklearn 进行综合数据挖掘。

教学时数:4 学时。

教学内容:

1. / 恶性乳腺肿瘤预测

2. 泰坦尼克号乘客生还预测

3. 图像的聚类分割

考核要点:

掌握利用Python 进行数据挖掘与机器学习的实现过程。

本课程使用教具和现代教育技术的指导性意见

本课程教材力求内容新颖,应采用多样化的方式进行教学,让学生在理论与实践相结合的基础上,对课程所要求的实际操作能力有进一步的提高。

充分利用多媒体等现代化教学手段,整体优化教学过程和教学内容,调动学生学习积极性;布置实际操作任务给学生上机操作并及时指导。

5

课程教材

扫码优惠购书

6

目录

向上滑动阅览

源码下载

1章绪论

11数据仓库概述

111数据仓库的定义及特点

112数据仓库与操作型数据库的关系

113数据仓库的组成

114数据仓库的应用

115基于 Hadoop/Spark的数据仓库技术

12数据挖掘概述

121数据挖掘的概念

122数据挖掘的主要任务

123数据挖掘的数据源

124数据挖掘使用的技术

125数据挖掘存在的主要问题

126数据挖掘建模的常用工具

127Python数据挖掘常用库

13数据仓库与数据挖掘的区别与联系

131数据仓库与数据挖掘的区别

132数据仓库与数据挖掘的联系

14小结

习题 1

2章认识数据

习题 2

3章数据预处理

习题 3

4章数据仓库与联机分析处理

41数据仓库的体系

411数据仓库体系结构

412数据 ETL

413数据集市

414元数据

42多维数据模型与 OLAP

421多维数据模型的相关概念

422OLAP的基本分析操作

423多维数据模型的实现

43数据仓库的维度建模

431数据仓库维度建模概述

432星形模型

433雪花模型

44数据仓库发展

441动态数据仓库

442数据中心

443数据中台

45小结

习题 4

5章数据仓库设计与开发

51数据仓库设计概述

511数据仓库设计的特点

512数据仓库设计与业务系统模型设计的区别

513数据仓库构建模式

514数据仓库建立框架

52数据仓库设计

521数据仓库规划、需求分析及概念设计

522数据仓库逻辑模型设计

523数据仓库物理模型设计

524数据仓库部署与维护

53基于 Hive的数据仓库实现

531Hadoop/Hive简介

532Hive数据仓库和数据库比较

533Hive常用数据操作

534利用 Hive建立数据仓库

54小结

习题 5

6章回归分析

654弹性回归

习题 6

7章关联规则挖掘

习题 7

8章分类

习题 8

9章聚类

习题 9

10章神经网络与深度学习

10.1神经网络基础

10.1.1神经元模型

10.1.2感知机与多层网络

10.2BP神经网络

10.2.1多层前馈神经网络

10.2.2后向传播算法

10.2.3BP神经网络应用

10.3深度学习

10.3.1深度学习概述

10.3.2常用的深度学习算法

10.4小结

习题 10

11章离群点检测

11.1离群点概述

11.1.1离群点的概念

11.1.2离群点的类型

11.1.3离群点检测的挑战

11.2离群点的检测

11.2.1基于统计学的离群点检测

11.2.2基于邻近性的离群点检测

11.2.3基于聚类的离群点检测

11.2.4基于分类的离群点检测

11.3sklearn中的异常检测方法

11.4小结

习题 11

12章文本和时序数据挖掘

121文本数据挖掘

1211文本挖掘概述

1212文本挖掘的过程与任务

122文本分析与挖掘的主要方法

1221词语分词

1222词性标注与停用词过滤

1223文本表征

1224文本分类

1225文本聚类

1226文本可视化

123时序数据挖掘

1231时间序列和时间序列分析

1232时间序列平稳性和随机性判定

1233自回归滑动平均模型

1234差分整合移动平均自回归模型

1235季节性差分自回归移动平均模型

124小结

习题 12

13章数据挖掘案例

13.1良性 /恶性乳腺肿瘤预测

13.2泰坦尼克号乘客生还预测

13.3图像的聚类分割

13.4小结

7

视频样例

已关注

关注

重播分享

关闭

观看更多

更多

正在加载

正在加载

退出全屏

视频加载失败,请刷新页面再试

刷新

视频详情

8

PPT样例

9

教案样例

10

配套题库网站www.qingline.net

在公众号书圈后台回复【9787302625735】,下载本书配套的教学资源

相 关 图 书

本文来自网络,不代表本站立场,转载请注明出处:https://www.jsu173.com/alarm/a15219.html

分析,大纲,方法,教学,数据,教案,平台,作业,视频,课程,算法,数据,模型,仓库,群点

极速天气后续将为您提供丰富、全面的关于分析,大纲,方法,教学,数据,教案,平台,作业,视频,课程,算法,数据,模型,仓库,群点内容,让您第一时间了解到关于分析,大纲,方法,教学,数据,教案,平台,作业,视频,课程,算法,数据,模型,仓库,群点的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。