仓酷云

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 1277|回复: 8
打印 上一主题 下一主题

[学习教程] MSSQL网页设计数据发掘概述

[复制链接]
老尸 该用户已被删除
跳转到指定楼层
楼主
发表于 2015-1-16 22:26:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
这里我们讨论用binlog来实现闪回的方案。数据
跟着数据库手艺的不休开展及数据库办理体系的普遍使用,数据库中存储的数据量急剧增年夜,在大批的数据面前埋没着许
多主要的信息,假如能把这些信息从数据库中抽掏出来,将为公司制造良多潜伏的利润,而这类从海量数据库中发掘信息
的手艺,就称之为数据发掘。

数据发掘工具可以对未来的趋向和举动举行展望,从而很好地撑持人们的决议,好比,经由对公司全部数据库体系的
剖析,数据发掘工具能够回覆诸如“哪一个客户对我们公司的邮件倾销举动最有大概作出反响,为何”等相似的成绩。有
些数据发掘工具还可以办理一些很损耗野生工夫的传统成绩,由于它们可以疾速地扫瞄全部数据库,找出一些专家们不容易
发觉的极有效的信息。

下文将对数据发掘的基础手艺作一个复杂的先容。

数据发掘的基本

数据发掘手艺是人们临时对数据库手艺举行研讨和开辟的了局。后来各类贸易数据是存储在盘算机的数据库中的,然
后开展到可对数据库举行查询和会见,进而开展到对数据库的立即遍历。数据发掘使数据库手艺进进了一个更初级的阶
段,它不但能对已往的数据举行查询和遍历,而且可以找出已往数据之间的潜伏接洽,从而增进信息的传送。如今数据挖
掘手艺在贸易使用中已能够即刻投进利用,由于对这类手艺举行撑持的三种基本手艺已开展成熟,他们是:

海量数据汇集
壮大的多处置器盘算机
数据发掘算法

贸易数据库如今正在以一个绝后的速率增加,而且数据堆栈正在普遍地使用于各类行业;对盘算机硬件功能愈来愈高
的请求,也能够用如今已成熟的并行多处置机的手艺来满意;别的数据发掘算法经由了这10多年的开展也已成为一种
成熟,不乱,且易于了解和操纵的手艺。

从贸易数据到贸易信息的退化过程当中,每步行进都是创建在上一步的基本上的。见下表。表中我们能够看到,第四
步退化是反动性的,由于从用户的角度来看,这一阶段的数据库手艺已能够疾速地回覆贸易上的良多成绩了。

退化阶段贸易成绩撑持手艺产物厂家产物特性
数据汇集
(60年月)“已往五年中我的总支出是几?”盘算机、磁带和磁盘IBM,CDC供应汗青性的、静态的数据信息
数据会见
(80年月)“在新英格兰的分部客岁三月的发卖额是几?”干系数据库(RDBMS),布局化查询言语(SQL),ODBC
Oracle、Sybase、Informix、IBM、Microsoft在纪录级供应汗青性的、静态数据信息
数据堆栈;决议撑持
(90年月)“在新英格兰的分部客岁三月的发卖额是几?波士顿据此可得出甚么结论?”联机剖析处置(OLAP)、多维
数据库、数据堆栈Pilot、Comshare、Arbor、Cognos、Microstrategy在各类条理上供应回溯的、静态的数据信息
数据发掘
(正在盛行)“下个月波士顿的发卖会怎样?为何?”初级算法、多处置器盘算机、海量数据库Pilot、
Lockheed、IBM、SGI、其他始创公司供应展望性的信息

表1、数据发掘的退化过程。

数据发掘的中心模块手艺历经了数十年的开展,个中包含数理统计、野生智能、呆板进修。明天,这些成熟的手艺,
加上高功能的干系数据库引擎和普遍的数据集成,让数据发掘手艺在以后的数据堆栈情况中进进了有用的阶段。

数据发掘的局限

“数据发掘”这个名字来历于它有点相似于在山脉中发掘有代价的矿躲。在贸易使用里,它就体现为在年夜型数据库里
面搜刮有代价的贸易信息。这两种历程都必要对巨量的质料举行具体地过滤,而且必要智能且准确地定位潜伏代价的所
在。关于给定了巨细的数据库,数据发掘手艺能够用它以下的超才能发生伟大的贸易时机:

主动趋向展望。数据发掘能主动在年夜型数据库内里找寻潜伏的展望信息。传统上必要良多专家来举行剖析的成绩,现
在能够疾速而间接地从数据两头找到谜底。一个典范的使用数据发掘举行展望的例子就是方针营销。数据发掘工具能够根
据已往邮件倾销中的大批数据找出个中最有大概对未来的邮件倾销作出反响的客户。

主动探测之前未发明的形式。数据发掘工具扫描全部数据库并识别出那些埋没着的形式,好比经由过程剖析批发数据来辨
别出外表上看起来没接洽的产物,实践上有良多情形下是一同被售出的情形。

数据发掘手艺可让现有的软件和硬件加倍主动化,而且能够在晋级的大概新开辟的平台上实行。当数据发掘工具运
行于高功能的并行处置体系上的时分,它能在数分钟内剖析一个超年夜型的数据库。这类更快的处置速率意味着用户有更多
的时机来剖析数据,让剖析的了局加倍正确牢靠,而且易于了解。

数据库能够由此拓展深度和广度

深度上,同意有更多的列存在。以往,在举行较庞大的数据剖析时,专家们限于工夫要素,不能不对列入运算的变量
数目加以限定,可是那些被抛弃而没有列入运算的变量有大概包括着另外一些不为人知的有效信息。如今,高功能的数据挖
掘工具让用户对数据库能举行全盘的深度编历,而且任何大概参选的变量都被思索出来,再不必要选择变量的子集来举行
运算了。

广度上,同意有更多的行存在。更年夜的样本让发生毛病和变更的几率下降,如许用户就可以加倍准确地推导出一些虽小
但很是主要的结论。

比来,GartnerGroup的一次初级手艺查询拜访将数据发掘和野生智能列为“将来三到五年内将对产业发生深远影响的五年夜
关头手艺”之首,而且还将并行处置系统和数据发掘列为将来五年内投资核心的十年夜新兴手艺前两位。依据比来Gartner的
HPC研讨标明,“跟着数据捕捉、传输和存储手艺的疾速开展,年夜型体系用户将更多地必要接纳新手艺来发掘市场之外的价
值,接纳更加宽广的并行处置体系来创立新的贸易增加点。”

在数据发掘中最经常使用的手艺有:

野生神经收集:模仿心理神经收集布局的非线形展望模子,经由过程进修举行形式辨认。

决议树:代表着决议集的树形布局。

遗传算法:基于退化实际,并接纳遗传分离、遗传变异、和天然选择等计划办法的优化手艺。

近邻算法:将数据汇合中每个纪录举行分类的办法。

划定规矩推导:从统计意义上对数据中的“假如-那末”划定规矩举行寻觅和推导。

接纳上述手艺的某些专门的剖析工具已开展了约莫十年的汗青,不外这些工具所面临的数据量一般较小。而如今这
些手艺已被间接集成到很多年夜型的产业尺度的数据堆栈和联机剖析体系中往了。

其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,许多中小型网站为了降低网站总体拥有成本而选择了MySQL作为网站数据库。
若相依 该用户已被删除
沙发
发表于 2015-1-19 12:43:34 | 只看该作者
光写几个SQL实在叫无知。
山那边是海 该用户已被删除
板凳
发表于 2015-1-28 07:05:29 | 只看该作者
学习SQL语言的话如果要学会去做网站就不是很难!但是要做数据库管理的话就有难度了!
变相怪杰 该用户已被删除
地板
发表于 2015-2-5 19:36:43 | 只看该作者
从底层原理到表层引用,书籍多的很。个人认为没有什么那本书好?这样的说法。主要看和个人的学习方法是否适合。
再现理想 该用户已被删除
5#
发表于 2015-2-13 09:22:03 | 只看该作者
呵呵,这就是偶想说的
冷月葬花魂 该用户已被删除
6#
发表于 2015-3-3 19:49:55 | 只看该作者
XML字段类型更好的解决了XML数据的操作。XQuery确实不错,但是个人对其没好感。(CSDN的开发者应该是相当的熟了!)
飘灵儿 该用户已被删除
7#
发表于 2015-3-11 13:19:24 | 只看该作者
索引视图2k就有。但是2005对其效率作了一些改进但是schema.viewname的作用域真是太限制了它的应用面。还有一大堆的环境参数和种种限制都让人对它有点却步。
精灵巫婆 该用户已被删除
8#
发表于 2015-3-18 20:44:10 | 只看该作者
所以你总能得到相应的升级版本,来满足你的需求。
小女巫 该用户已被删除
9#
发表于 2015-3-26 16:18:11 | 只看该作者
不好!如果出了错;不好调试;不好处理!其实web开发将代码分为3层:web层;业务逻辑层和数据访问层;一般对数据库的操作都在数据访问层来做;这样便于调试和维护!而且将来如果是换了数据库的话;你只需要改数据层的代码;其他层的基本可以不变!要是你在jsp中直接调用sql数据库;那么如果换了数据库呢?岂不都要改?如果报了异常呢?怎么做异常处理?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|仓酷云 鄂ICP备14007578号-2

GMT+8, 2024-5-18 00:02

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表