当前位置: 首页 > 图文教程 > 数据库 > Oracle > Oracle:教你删除Oracle数据库中重复没用的数据

Oracle
数据库Oracle性能优化可能出现的问题
oracle认证辅导:重访Oracle密码
Oracle认证:修改用户指定的默认表空间
Oracle认证:Oracle的三种Join方法
Oracle认证辅导:教你数据库查询初始化参数
教你查询Oracle中的表空间
利用变量在Linux中给文件命名
oracle的case函数控制结构DECODE()函数
解决Oracle被锁定有妙招
Oracle数据库编写事务 几个需要遵守指导方针
如何解决Oracle被锁定问题
如何控制Oracle虚拟专用数据
Oracle入门基础之参数文件
如何解决Oracle数据库ORA-00257故障
实例解析:用Oracle创建实例的参数需求
对比Caché和Oracle在数据库的应用
风河应用Oracle产品为企业2.0提供动力
Oracle数据库中Insert、Update、Delete操作速度大提速
Oracle11g再创TPC-C基准测试性价比世界纪录
Oracle用户常用数据字典的查询

Oracle:教你删除Oracle数据库中重复没用的数据


出处:互联网   整理: 软晨网(RuanChen.com)   发布: 2009-08-14   浏览: 226 ::
收藏到网摘: n/a

在对数据库进行操作过程中我们可能会碰到这种情况,表中的数据可能重复出现,使我们对数据库的操作过程中带来很多的不便,那么怎么删除这些重复没有用的数据呢?

  重复数据删除技术可以提供更大的备份容量,实现更长时间的数据保留,还能实现备份数据的持续验证,进步数据恢复服务水平,方便实现数据容灾等。 重复的数据可能有这样两种情况,第一种时表中只有某些字段一样,第二种是两行记录完全一样。Oracle数据库重复数据删除技术有如下优势:更大的备份容量、数据能得到持续验证、有更高的数据恢复服务水平、方便实现备份数据的容灾。

  一、删除部分字段重复数据

  先来谈谈如何查询重复的数据吧。

  下面语句可以查询出那些数据是重复的:

  select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1

  将上面的>号改为=号就可以查询出没有重复的数据了。

  想要删除这些重复的数据,可以使用下面语句进行删除

  delete from 表名 a where 字段1,字段2 in

  (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

  上面的语句非常简单,就是将查询到的数据删除掉。不过这种删除执行的效率非常低,对于大数据量来说,可能会将数据库吊死。所以我建议先将查询到的重复的数据插入到一个暂时表中,然后对进行删除,这样,执行删除的时候就不用再进行一次查询了。如下:

  create TABLE 暂时表 AS

  (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)

  上面这句话就是建立了暂时表,并将查询到的数据插入其中。

  下面就可以进行这样的删除操作了:

  delete from 表名 a where 字段1,字段2 in (select 字段1,字段2 from 暂时表);

  这种先建暂时表再进行删除的操作要比直接用一条语句进行删除要高效得多。

  这个时候,大家可能会跳出来说,什么?你叫我们执行这种语句,那不是把所有重复的全都删除吗?而我们想保留重复数据中最新的一条记录啊!大家不要急,下面我就讲一下如何进行这种操作。

  在oracle中,有个隐藏了自动rowid,里面给每条记录一个唯一的rowid,我们假如想保留最新的一条记录,

  我们就可以利用这个字段,保留重复数据中rowid最大的一条记录就可以了。

  下面是查询重复数据的一个例子:

  以下是引用片段:
selecta.rowid,a.*from表名a 
  wherea.rowid!= 
  ( 
  selectmax(b.rowid)from表名b 
  wherea.字段1=b.字段1and 
  a.字段2=b.字段2 
  )

  下面我就来讲解一下,上面括号中的语句是查询出重复数据中rowid最大的一条记录。

  而外面就是查询出除了rowid最大之外的其他重复的数据了。

  由此,我们要删除重复数据,只保留最新的一条数据,就可以这样写了:

deletefrom表名a 
  wherea.rowid!= 
  ( 
  selectmax(b.rowid)from表名b 
  wherea.字段1=b.字段1and 
  a.字段2=b.字段2 
  )

  随便说一下,上面语句的执行效率是很低的,可以考虑建立暂时表,讲需要判定重复的字段、rowid插入暂时表中,然后删除的时候在进行比较。

 createtable暂时表as 
  selecta.字段1,a.字段2,MAX(a.ROWID)dataidfrom正式表aGROUPBYa.字段1,a.字段2; 
  deletefrom表名a 
  wherea.rowid!= 
  ( 
  selectb.dataidfrom暂时表b 
  wherea.字段1=b.字段1and 
  a.字段2=b.字段2 
  ); 
  commit;

二、完全删除重复记录

  对于表中两行记录完全一样的情况,可以用下面语句获取到去掉重复数据后的记录:

  select distinct * from 表名

  可以将查询的记录放到暂时表中,然后再将原来的表记录删除,最初将暂时表的数据导回原来的表中。如下:

createTABLE暂时表AS(selectdistinct*from表名);
  truncatetable正式表;--注:原先由于笔误写成了droptable正式表;,现在已经改正过来
  insertinto正式表(select*from暂时表);
  droptable暂时表;

  假如想删除一个表的重复数据,可以先建一个暂时表,将去掉重复数据后的数据导入到暂时表,然后在从暂时表将数据导入正式表中,如下:

insertINTOt_table_bak 
  selectdistinct*fromt_table;

  三、怎样快速删除oracle数据库

  最快的方法就进入注册表 在运行..里输入regedit.

  依次展开HKEY_LOCAL_MACHINE SOFTWARE

  找到ORACLE节点。删除。

  然后删除ORACLE数据文件,安装的时候选的路径。

  最初删除oracle引导文件,在系统盘符的Program Files 里面删除oracle文件夹。