|
数据污染识别可以暴露被添加到数据库中的不正确的或不合适的数据。数据污染识别包括对数据库中的指定字段进行扫描和检查数据是否遵从你对数据内容和格式的限制规定。通过尽可能早地识别和矫正数据污染,你可以简化数据库维护过程,提高查询与搜索结果的精确度与完整性,提高依赖数据库资源进行工作的员工的信心与效率,防止出现由于不正确或不合法的数据库数据而导致的应用程序功能性问题。
数据污染的产生是由于电脑会识别不同数据的微小差异,而这些差异对于人来说是不存在的。比如说,对于人来讲,"HP",
"Hewlett Packard", 和"Hewlett-Packard" 表示同一个公司。 然而,电脑会将每一个实体识别为一个单独的值;于是,对HP的查询就不会找到被人认为与Hewlett-Packard相关联的个体。数据污染的其他原因包括拼写错误,无效的字符类型,错误信息,设计缺陷,和导致冲突的功能性改变。
See also:
|