手机版

SQL Server 2008数据挖掘新功能的实现

时间:2021-08-06 来源:互联网 编辑:宝哥软件园 浏览:

类型:数据库类大小:10.5M语言:中文评分:1.4标签:立即下载这个最新版本的Microsoft SQL server analysis services引入了新功能和增强功能。创建维护测试集现在,当您创建挖掘结构时,您可以将挖掘结构中的数据分为训练集和测试集。分区的定义与结构一起存储,因此训练集和测试集可以在任何基于结构的挖掘模型中重用。数据在训练分区和测试分区之间随机划分,但是如果需要重新创建分区,也可以指定创建分区的种子。您可以将测试集的大小指定为总行数的百分比、最大行数或这两个要求的组合。有关如何使用训练和测试数据集的详细信息,请参见将数据划分为训练和测试集(分析服务-数据挖掘)。有关SQL Server 2008中所有模型验证功能的更多信息,请参见验证数据挖掘模型(分析服务-数据挖掘)。过滤模型案例现在,您可以将过滤器附加到挖掘模型,并在培训和测试期间应用它们。对模型应用过滤器可以控制用于训练模型的数据,并且更容易评估模型的数据子集的准确性。例如,您可能想知道具有一定收入水平的客户的目标邮件模型的准确性。在创建提升图表时,可以对挖掘模型的收入列应用筛选器,并且只查看此人口统计的结果。商业智能开发工作室还提供了一个新的过滤器编辑器,帮助您为案例表和嵌套表生成复杂的条件。有关如何为挖掘模型创建筛选器的详细信息,请参见为挖掘模型创建筛选器(analysis services数据挖掘)。有关为挖掘模型测试筛选数据的信息,请参见模型精度图表工具(分析服务-数据挖掘)。多个挖掘模型的交叉验证交叉验证是一种用于评估数据挖掘模型准确性的既定方法。在交叉验证中,可以将挖掘结构的数据重复划分为若干个子集,并生成子集的模型,进而度量每个划分的模型的准确性。通过查看返回的统计信息,我们可以确定挖掘模型的可靠性,并更容易地比较基于相同结构的模型。交叉验证可以在数据挖掘设计器的挖掘准确性图表视图中使用。您还可以使用Analysis Services存储过程来划分挖掘结构、测试多个挖掘模型和生成分析。要在SQL Server 2008中生成交叉验证报告,请指定挖掘结构和可预测属性,然后指定用于拆分案例数据的折叠数。Analysis Services将返回一个表来报告每个分区的概率或均方根误差,以及聚合模型所有度量的平均偏差和标准偏差等统计信息。有关更多信息,请参见交叉验证(分析服务-数据挖掘)。支持Office 2007数据挖掘外接程序使用SQL Server 2008 Office 2007数据挖掘外接程序时,SQL Server 2008支持从Microsoft Excel创建、管理和使用数据挖掘模型。这个流行的免费插件的最新版本通过增加对服务器端培训和测试分区、交叉验证和几个新分析工具(如购物篮分析和可打印预测计算器)的支持得到了增强。您还可以使用文档模型向导轻松地为存储在SQL Server 2008实例中的结构和模型创建文档。有关外接程序的更多信息,请参见office 2007的数据挖掘外接程序。微软时间序列算法的增强功能为了提高时间序列模型中一些预测的准确性和稳定性,在微软时间序列算法中加入了一种新的算法。新算法基于众所周知的ARIMA算法,与Analysis Services使用的ARTxp算法相比,该算法可以提供更好的长期预测。(ARTxp是自动回归树算法,针对单时间段预测或短期预测进行了优化。

默认情况下,微软时间序列算法的新实现使用ARTxp算法训练模型的一个版本,使用ARIMA算法训练另一个版本。然后,算法会权衡两个模型的结果,提供你想要的预测特征。如果不想使用此默认实现,可以指定Microsoft时间序列算法仅使用ARTxp或ARIMA算法。在SQL Server 2008企业版中,您可以为算法指定自定义权重,以便为可变时间范围提供最佳预测。现在,微软时间序列算法还可以在预测期间接受数据,以支持新的业务场景。例如,您可以基于平均交叉产品、区域聚合或一些其他大型数据集创建收入预测模型。然后,应用该模型展示了各种产品的销售时间序列。通过应用常规模型,我们可以利用聚合数据的稳定性和可用性,定制各种产品的预测。您还可以使用多个时间序列来训练数据,然后将模型应用于新数据,以预测“如果”的情况。有关时间序列挖掘模型的更多信息,请参见微软时间序列算法(分析服务-数据挖掘)和预测时间序列(DMX)。钻取结构案例和结构在SQL Server 2008中列出。如果为挖掘结构启用了穿透钻取,则可以查询挖掘结构并返回有关用于培训和测试的案例的详细信息。您可以使用数据挖掘扩展插件(DMX)在结构上创建钻取查询。此外,如果为挖掘模型和相关挖掘结构启用了钻取,则可以创建查询来检索基础挖掘结构中的数据列。如果您想要发现特定节点中案例的详细信息,此功能非常有用。例如,您可以检索特定群集中客户的联系信息。有关更多信息,请参见对挖掘模型和结构使用钻取(分析服务-数据挖掘)。请参见选择自结构。以DMX查询挖掘结构为例。请参见从模型中选择。CASES (DMX)提供了从模型到结构数据的钻探示例。使用挖掘模型列的别名现在,您可以向挖掘模型中的列添加别名,以便了解DMX语句中的列和引用列的内容。例如,如果生成的挖掘结构包含相同数据的连续和离散版本,则可以为这两列指定相同的名称进行比较。有关如何管理和查看别名的更多信息,请参见设置挖掘模型的属性或如何为模型列创建别名。有关如何使用DMX创建列别名的信息,请参见ALTER MINING STRUCTURE (DMX)。查询数据挖掘架构行集在SQL Server 2008中,许多现有的OLE DB数据挖掘架构行集已经公开为一组系统表,可以使用DMX语句轻松查询。因此,更容易检索与模型和结构相关的元数据,从挖掘模型内容中提取详细信息,或者监控Analysis Services实例或服务。有关详细信息,请参见查询数据挖掘架构行集(分析服务-数据挖掘)。新的示例位置联机丛书不再提供SQL Server示例数据库和示例应用程序。这些示例数据库和示例应用程序现在位于SQL Server示例(SQL Server。网站方便用户查找这些例子,还提供了其他与微软SQL Server和商业智能相关的新例子。在SQL Server示例网站上,您可以执行以下操作:-浏览开发人员、用户和Microsoft MVP社区提供的示例。-下载示例数据库和代码项目。-查看或参与论坛,您可以在论坛上报告和提问与各种技术领域的示例相关的问题。并行安装SQL server 2005分析服务现在可以与SQL Server 2005分析服务(ssas)并行安装。有关更多信息,请参见使用SQL Server的多个版本和实例。有关影响分析服务的重要并行安装问题,请参考此版本附带的自述文件。备份和恢复分析服务数据库备份和恢复分析服务数据库的能力得到了增强。

对数据库大小的限制已经减少,备份和恢复操作所需的时间也大大减少。有关更多信息,请参见新增内容(分析服务-多维数据库)。分析服务的其他增强功能如果您使用分析服务创建也用于数据挖掘的OLAP多维数据集,您可能会发现设计维度及其相关的层次结构和属性更容易。维度设计器中提供了一个新的属性关系设计器,它可以帮助您设计属性关系,并确保属性关系遵循最佳实践。

版权声明:SQL Server 2008数据挖掘新功能的实现是由宝哥软件园云端程序自动收集整理而来。如果本文侵犯了你的权益,请联系本站底部QQ或者邮箱删除。