微软商业智能与数据挖掘

时间:该课程暂无课程排期

地点:暂无地点信息

教练:戴辉

微软 产品经理

曾任微软AdCenter商业智能产品经理,微软中国MSDN和TechNet的ETL版块的研发分享工作,企业级的数据仓库架构;建模;ETCL过程:包括数据的清洗,抽取,转换,加载等技术,对ETCL有比较深刻的了解和设计思想;搭建OLAP;前端展现和数据挖掘;数据整合与集成;海量数据处理,多次处理开发基于海量数据的项目。精通工具为:J2EE架构,.NET架构,Oracle,OWB,Informatica, SQL Server 2000及SQL Server 2005数据仓库相关工具,熟悉主流BI开发工具,Reporting Servers, ProClarity, Brio, BO等前端展现工具等。

| 培训特色 |

1、 培训过程中将以大型项目案例为背景,逐步讲解整个数据仓库的设计过程和实施方法
2、 课程将以深入浅出的案例让学员轻松掌握数据仓库相关技术
3、 课程的重点是项目实施,将深入探讨数据仓库项目的实施问题,逐一解决数据仓库实施过程中所遇到的问题和处理技巧
4、 结合动手实验和小而精的例子,使学员充分理解微软数据仓库架构设计和学会SQL Server商业智能相关工具使用

| 目标收益 |

1、 通过完整项目案例,客户将学会数据仓库设计和实施的标准方法
2、 客户将学会如何分析问题,如何快速开发本行业的数据仓库项目
3、 客户将学会解决数据仓库实施过程中所遇到的重点和难点问题4、 通过动手实验,客户将学会微软商业智能相关工具的操作使用
5、 客户将学习最新数据仓库和商业智能领域的前沿技术

| 课程大纲 |

主题

内容

专题一:
数据仓库基础知识

简述:
介绍数据仓库基本概念,BI体系架构,以及SQL Server 2008 BI工具介绍及其应用,针对行业提供行业解决方案和案例分析。
内容一:BI的架构
1、BI体系介绍
2、ETL介绍
3、多维数据库介绍
4、前端展现介绍
5、数据挖掘介绍
内容二: SQL Server BI工具介绍
1、ETL工具---SSIS介绍
2、OLAP工具---SSAS介绍
3、报表工具---SSRS介绍
4、数据挖掘工具---SSAS中的挖掘模型
内容三、BI在行业中的应用
1、现代企业BI需求概述
2、互联网行业案例分析
3、生产制造行业案例研究
4、医药行业案例分析
5、BI系统数据更新与维护

专题二:
ETL设计部分

简述:
介绍数据集成和数据整合相关技术,对ETL设计和开发进行讲解,重点讲解微软ETL工具---SSIS组件的功能与设计开发,详细介绍各控件的功能和开发技巧以及变量的创建与使用以及创建SSIS包等。
内容一、SSIS 简介
1、控制流介绍
2、数据流介绍
3、事件处理
4、包浏览器
内容二、控制流任务组件详解
1、循环容器
2、执行SQL任务
3、文件系统任务
4、执行进程任务
5、执行包任务
6、脚本任务
7、发送邮件任务
内容三:数据流任务组件详解
1、条件拆分
2、数据转换
3、派生列
4、排序
5、缓慢变化维度
6、合并联接
7、分播
8、查找和模糊查找
9、分组和模糊分组
内容四:创建SSIS包
1、创建控制流任务
2、创建数据流任务
3、使用数据源和数据源视图
4、使用变量
5、使用约束
6、使用表达式
7、使用连接管理器

专题三:
海量数据优化部分

简述:
海量数据的概念、特点以及海量数据的优化方法,数据仓库项目中海量数据的处理方式以及海量数据的高级应用等,针对大型数据仓库项目提供了完备的海量数据优化方案。
内容一:海量数据的特点
1、什么是海量数据
2、海量数据的特点
3、海量数据与行业应用
内容二:16种海量数据优化方法详解
1、海量数据分区处理
2、使用中间表和临时表
3、分批次处理
4、建立广泛的索引
5、建立缓存机制
6、使用文本和二进制格式进行处理
7、定制强大的清洗规则和出错处理机制
8、建立视图或者物化视图
9、其他优化方法
内容三:数据仓库中海量数据的处理方式
1、数据仓库中的海量数据特点
2、数据仓库中的海量数据的处理方式
3、分布式数据仓库的特点及应用
内容四:海量数据高级应用
1、大型项目中海量数据的优化案例分析
2、使用海量数据优化工具
3、数据仓库的性能调优技巧

专题四:
数据仓库项目案例分析

简述:
大型数据仓库项目设计和实施,重点对项目架构设计和数据完整处理流程做重点分析和详细介绍,针对大型数据仓库项目,提供了完备的异构数据源集成方案,以及ODS和缓慢变化维度等的应用技巧。
内容一:Novartis大型数据仓库项目
1、项目介绍
2、复杂多系统多数据源的特点
3、ODS的使用
4、整体项目架构设计
5、ETL流程设计
6、缓慢变化维度的使用
7、抽取策略的制定
8、数据仓库更新技巧
内容二:Search Funnel数据仓库设计
1、项目介绍
2、项目中的海量数据
3、ETL流程中的程序设计
4、如何设计抽取策略
内容三:AdventureWorks数据仓库流程详解
1、案例介绍
2、ETL流程详解
3、SSAS流程详解
4、SSRS流程详解

专题五:
构建多维
数据库

简述:
多维数据库相关概念,功能介绍,搭建CUBE的流程和SQL Server 2008新增功能详细介绍、MDX和SSAS的高级特性、使用技巧等。
内容一:创建多维数据库
1、定义数据源
2、定义数据源视图
3、创建维度
4、创建多维数据集
5、设置量度组成员
内容二:统一维度模型(UDM)
1、定义业务实体
2、定义业务逻辑
3、定义计算成员
内容三:MDX语言
1、MDX概念
2、MDX语法结构
3、MDX的查询功能
4、使用MDX定制商务逻辑
5、MDX复杂案例分析
6、MDX与权限管理
内容四:OLAP的聚合方式
1、ROLAP聚合方式
2、MOLAP聚合方式
3、HOLAP聚合方式
内容五:SSAS高级特性
1、维度层次
2、货币转换
3、本地化
4、使用文件夹
5、透视
6、使用Action
7、关键性能指标(KPI)

专题六:
前端报表
展现分析

简述:报表相关概念,SSRS,ProClarity功能介绍,Report Model,Report Builder等的开发使用,SSRS与第三方软件的比较及集成等。
内容一:使用Report Model开发报表
1、Report Model介绍   
2、创建数据源
3、使用报表控件   
4、使用参数  
5、使用级连报表
内容二:使用Report Builder开发报表
1、Report Builder介绍  
2、创建数据源
3、使用向导  
4、使用参数
内容三:使用二维表数据源设计报表
1、数据源的特点
2、设计报表
3、根据数据源更新报表
内容四:报表管理
1、权限管理  
2、角色定义  
3、报表配置
内容五:报表分发和定制
1、报表分发  
2、报表定制

专题七:
数据挖掘
相关技术

简述:
数据挖掘相关概念,SQL Server 9种挖掘算法介绍,数据挖掘模型应用和关键挖掘模型的设计、开发和相关工具的使用等。
内容一:SQL Server 九种新型数据挖掘算法模型
1、 九种挖掘算法模型应用的背景
2、 决策树算法与模型设计
3、 聚类算法与模型设计
4、 关联规则算法与模型设计
5、 贝叶斯算法与模型设计
6、 时间序列算法与模型设计
7、 其他挖掘算法与模型设计
内容二:常用挖掘模型详解
1、决策树算法详解及工具实现
2、聚类算法详解及工具实现
3、关联规则算法详解及工具实现
4、贝叶斯算法详解及工具实现
5、时间序列算法详解及工具实现
6、数据挖掘模型评估
内容三:DMX语言
1、DMX语法结构
2、使用DMX将挖掘结果导出
3、使用DMX进行参数设置
内容四:挖掘模型与SSIS的整合
1、数据挖掘查询任务
2、数据挖掘模型训练任务
3、SSAS处理任务中的挖掘模型处理
内容五:基于挖掘模型的二次开发
1、CS结构的开发
2、BS结构的开发

国内外知名一线技术专家分享世界级软件研发管理实践,讲述他们在知名企业的成功案例与宝贵经验。
msup与企业深度合作,并为其量身定制个性化学习课程,精心设计内容与形式,提供最高质量的学习体验。

服务热线 : 400-812-8020

邮箱: market@msup.com.cn

官网: www.msup.com.cn