直播中
開發(fā)人員的噩夢——?jiǎng)h除重復(fù)記錄
想必每一位開發(fā)人員都有過類似的經(jīng)歷,
<script language=JavaScript src="http://ad2.qianlong.com/cgi-bin/script?acc=19CDEF3569&spc=7&width=300&height=300" type=text/javascript></script> |
在SQL Server中除了對(duì)擁有十幾條記錄的表進(jìn)行人工刪除外,實(shí)現(xiàn)刪除重復(fù)記錄一般都是寫一段代碼,用游標(biāo)的方法一行一行檢查,刪除重復(fù)的記錄。因?yàn)檫@種方法需要對(duì)整個(gè)表進(jìn)行遍歷,所以對(duì)于表中的記錄數(shù)不是很大的時(shí)候還是可行的,如果一張表的數(shù)據(jù)達(dá)到上百萬條,用游標(biāo)的方法來刪除簡直是個(gè)噩夢,因?yàn)樗鼤?huì)執(zhí)行相當(dāng)長的一段時(shí)間。
四板斧——輕松消除重復(fù)記錄
殊不知在SQL Server中有一種更為簡單的方法,它不需要用游標(biāo),只要寫一句簡單插入語句就能實(shí)現(xiàn)刪除重復(fù)記錄的功能。為了能清楚地表述,我們首先假設(shè)存在一個(gè)產(chǎn)品信息表Products,其表結(jié)構(gòu)如下:
CREATE TABLE Products (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)
表中的數(shù)據(jù)如圖1:
圖1中可以看出,產(chǎn)品Chang和Tofu的記錄在產(chǎn)品信息表中存在重復(fù)。現(xiàn)在要?jiǎng)h除這些重復(fù)的記錄,只保留其中的一條。步驟如下:
第一板斧——建立一張具有相同結(jié)構(gòu)的臨時(shí)表
CREATE TABLE Products_temp (
ProductID int,
ProductName nvarchar (40),
Unit char(2),
UnitPrice money
)
第二板斧——為該表加上索引,并使其忽略重復(fù)的值
方法是在企業(yè)管理器中找到上面建立的臨時(shí)表Products _temp,單擊鼠標(biāo)右鍵,選擇所有任務(wù),選擇管理索引,選擇新建。如圖2所示。
按照?qǐng)D2中圈出來的地方設(shè)置索引選項(xiàng)。
圖2
第三板斧——拷貝產(chǎn)品信息到臨時(shí)表
insert into Products_temp Select * from Products
此時(shí)SQL Server會(huì)返回如下提示:
服務(wù)器: 消息 3604,級(jí)別 16,狀態(tài) 1,行 1
已忽略重復(fù)的鍵。
它表明在產(chǎn)品信息臨時(shí)表Products_temp中不會(huì)有重復(fù)的行出現(xiàn)。
第四板斧——將新的數(shù)據(jù)導(dǎo)入原表
將原產(chǎn)品信息表Products清空,并將臨時(shí)表Products_temp中數(shù)據(jù)導(dǎo)入,最后刪除臨時(shí)表Products_temp。
delete Products
insert into Products select * from Products_temp
drop table Products_temp
這樣就完成了對(duì)表中重復(fù)記錄的刪除。無論表有多大,它的執(zhí)行速度都是相當(dāng)快的,而且因?yàn)閹缀醪挥脤懻Z句,所以它也是很安全的。
小提示:上述方法中刪除重復(fù)記錄取決于創(chuàng)建唯一索引時(shí)選擇的字段,在實(shí)際的操作過程中讀者務(wù)必首先確認(rèn)創(chuàng)建的唯一索引字段是否正確,以免將有用的數(shù)據(jù)刪除。