编队, 科学
专业化的研究
任何研究是观察,以澄清和评价这些性能指标之间有意义的关系和互动对象的属性。
专业化包括在它们的性质和以某种方式不同在某些方面是相互关联的对象。 该决定的编程任务开始于学科领域的研究。
专业化 - 这才是真正的世界,这是无限的,同时包含重要和不重要的数据的一部分。 研究者必须能够分配他们的显著部分。 例如,解决贷款问题,将被视为对客户的私人生活的所有相关信息(是否与配偶工作,如果客户带来的未成年子女,客户教育等)。 而为了解决与银行活动的其他任务,这样的数据将是相当可观的。 数据的意义取决于我们选择的主题区。
在研究过程中,你必须创建一个域模型。 来自不同来源的知识应正规化。 专业化是通过任何手段形式化 装置。 基金 可以是非常不同的。 这可以是所访问的或专门的图形符号的文本描述。 随着域模型描述了发生在它的过程,以及研究区域的数据进行了研究。
问题的声明也是我们研究对象的静态和动态行为的描述。 说明静态行为涉及对象及其属性的特性。 在描述的动态行为特征的原因行为的对象。
对象的动态行为通常与静态行为一起描述。
有时域和任务分析相结合一步到位。
确定和分析由数据挖掘所需建模数据的数据要求的步骤。 在这项研究中用户分布的问题; 分析 系统的特性; 必要的分析数据访问问题。
当组织有专业分析更容易,更有效的数据仓库。 然而,并不是所有的企业都有这样的数据仓库。 在这种情况下,原始数据的源是可操作的数据库,参考和归档的材料,即,从现有的IS(信息系统)的数据。
可以从外部和内部人士透露,不同的纸质文件,以及专业知识和/或投票的结果EC头需要更多的信息。
你还必须认识到,在数据准备软件开发过程中必须描述不亚于影响的过程中可能的因素。 可能有一些编码数据。 举例来说,所述客户端的特征之一 - 收入水平,其可以被定义为:非常低,低,中,高,非常高。 在这种情况下,有必要确定收入的灰度级。
在确定数据适量必须考虑到的数据排序。
在他们是有序的情况下,有必要知道是否包括在一组季节性/周期性成分数据。 当他们不下令,即 从数据库中的事件设置未链接到时间线,然后在收集的过程中必须遵守以下规则:
1)在数据库中的一个小的数量的记录可以是建立一个不足模型的原因;
2)模型的精度可通过增加数据的数量来改善;
3)旧的数据被排除在集;
4)用于创建非常大的数据库模型的算法,应该是能够放大。
Similar articles
Trending Now