ORACLE數(shù)據(jù)庫的統(tǒng)計數(shù)據(jù)及其生成方式
發(fā)布時間:2008-03-29 閱讀數(shù): 次 來源:網(wǎng)樂原科技
ORACLE數(shù)據(jù)庫的PL/SQL語句執(zhí)行的優(yōu)化器,有基于代價的優(yōu)化器(CBO)和基于規(guī)則的優(yōu)化器(RBO)。
RBO的優(yōu)化方式,依賴于一套嚴格的語法規(guī)則,只要按照規(guī)則寫出的語句,不管數(shù)據(jù)表和索引的內(nèi)容是否發(fā)生變化,不會影響PL/SQL語句的"執(zhí)行計劃"。
CBO自O(shè)RACLE 7版被引入,ORACLE自7版以來采用的許多新技術(shù)都是只基于CBO的,如星型連接排列查詢,哈希連接查詢,反向索引,索引表,分區(qū)表和并行查詢等。CBO計算各種可能"執(zhí)行計劃"的"代價",即cost,從中選用cost最低的方案,作為實際運行方案。各"執(zhí)行計劃"的cost的計算根據(jù),依賴于數(shù)據(jù)表中數(shù)據(jù)的統(tǒng)計分布,ORACLE數(shù)據(jù)庫本身對該統(tǒng)計分布是不清楚的,須要分析表和相關(guān)的索引,才能搜集到CBO所需的數(shù)據(jù)。
CBO是ORACLE推薦使用的優(yōu)化方式,要想使用好CBO,使SQL語句發(fā)揮最大效能,必須保證統(tǒng)計數(shù)據(jù)的及時性。
統(tǒng)計信息的生成可以有完全計算法和抽樣估算法。SQL例句如下:
完全計算法: analyze table abc compute statistics;
抽樣估算法(抽樣20%): analyze table abc estimate statistics sample 20 percent;
對表作完全計算所花的時間相當于做全表掃描,抽樣估算法由于采用抽樣,比完全計算法的生成統(tǒng)計速度要快,如果不是要求要有精確數(shù)據(jù)的話,盡量采用抽樣分析法。建議對表分析采用抽樣估算,對索引分析可以采用完全計算。
我們可以采用以下兩種方法,對數(shù)據(jù)庫的表和索引及簇表定期分析生成統(tǒng)計信息,保證應(yīng)用的正常性能。
1. 在系統(tǒng)設(shè)置定時任務(wù),執(zhí)行分析腳本。
在數(shù)據(jù)庫服務(wù)器端,我們以UNIX用戶oracle,運行腳本analyze,在analyze中,我們生成待執(zhí)行sql腳本,并運行。(假設(shè)我們要分析scott用戶下的所有表和索引)
Analyze腳本內(nèi)容如下:
sqlplus scott/tiger << EOF
set pagesize 5000
set heading off
SPOOL ANALYTAB.SQL
SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE STATISTICS SAMPLE 20 PERCENT ;' FROM USER_TABLES;
SPOOL OFF
SPOOL ANALYIND.SQL
SELECT 'ANALYZE TABLE SCOTT.'||TABLE_NAME||' ESTIMATE STATISTICS SAMPLE 20 PERCENT FOR ALL INDEXES;' FROM USER_TABLES;
SPOOL OFF
SPOOL ANALYZE.LOG
@ANALYTAB.SQL
@ANALYIND.SQL
SPOOL OFF
EXIT
在UNIX平臺上crontab加入,以上文件,設(shè)置為每個月或合適的時間段運行。
2. 利用ORACLE提供的程序包(PACKAGE)對相關(guān)的數(shù)據(jù)庫對象進行分析。
有以下的程序包可以對表,索引,簇表進行分析。
包中的存儲過程的相關(guān)參數(shù)解釋如下:
TYPE可以是:TABLE,INDEX,CLUSTER中其一。
SCHEMA為:TABLE,INDEX,CLUSTER的所有者,NULL為當前用戶。
NAME為:相關(guān)對象的名稱。
METHOD是:ESTIMATE,COMPUTE,DELETE中其一,當選用ESTIMATE,
下面兩項,ESTIMATE_ROWS和ESTIMATE_PERCENT不能同
時為空值。
ESTIMATE_ROWS是:估算的抽樣行數(shù)。
ESTIMATE_PERCENT是:估算的抽樣百分比。
METHOD_OPT是:有以下選項,
FOR TABLE /*只統(tǒng)計表*/
[FOR ALL [INDEXED] COLUMNS] [SIZE N] /*只統(tǒng)計有索引的表列*/
FOR ALL INDEXES /*只分析統(tǒng)計相關(guān)索引*/
PARTNAME是:指定要分析的分區(qū)名稱。
1)
DBMS_DDL.ANALYZE_OBJECT(
TYPE VARCHAR2,
SCHEMA VARCHAR2,
NAME VARCHAR2,
METHOD VARCHAR2,
ESTIMATE_ROWS NUMBER DEFAULT NULL,
ESTIMATE_PERCENT NUMBER DEFAULT NULL,
METHOD_OPT VARCHAR2 DEFAULT NULL,
PARTNAME VARCHAR2 DEFAULT NULL ) ;
該存儲過程可對特定的表,索引和簇表進行分析。
例如,對SCOTT用戶的EMP表,進行50%的抽樣分析,參數(shù)如下:
DBMS_DDL.ANALYZE_OBJECT('TABLE', 'SCOTT', 'EMP', 'ESTIMATE', NULL,50);
2)
DBMS_UTILITY.ANALYZE_SCHEMA (
SCHEMA VARCHAR2,
METHOD VARCHAR2,
ESTIMATE_ROWS NUMBER DEFAULT NULL,
ESTIMATE_PERCENT NUMBER DEFAULT NULL,
METHOD_OPT VARCHAR2 DEFAULT NULL ) ;
DBMS_UTILITY.ANALYZE_DATABASE (
METHOD VARCHAR2,
ESTIMATE_ROWS NUMBER DEFAULT NULL,
ESTIMATE_PERCENT NUMBER DEFAULT NULL,
METHOD_OPT VARCHAR2 DEFAULT NULL ) ;
其中,ANALYZE_SCHEMA用于對某個用戶擁有的所有TABLE,INDEX和CLUSTER的分析統(tǒng)計。
ANALYZE_DATABASE用于對整個數(shù)據(jù)庫進行分析統(tǒng)計。
3) DBMS_STATS是在ORACLE8I中新增的程序包,它使統(tǒng)計數(shù)據(jù)的生成和處理更加靈活方便,并且可以并行方式生成統(tǒng)計數(shù)據(jù)。在程序包中的以下過程分別分析統(tǒng)計TABLE,INDEX,SCHEMA,DATABASE級別的信息。
DBMS_STATS.GATHER_TABLE_STATS
DBMS_STATS.GATHER_INDEX_STATS
DBMS_STATS.GATHER_SCHEMA_STATS
DBMS_STATS.GATHER_DATABASE_STATS
在這里,我們以數(shù)據(jù)庫JOB的方式,定時對數(shù)據(jù)庫中SCOTT模式下所有的表和索引進行分析:
在SQL*PLUS下運行:
VARIABLE jobno number;
BEGIN
DBMS_JOBS.SUBMIT ( :jobno ,
' dbms_utility.analyze_schema ( "scott", "estimate", NULL, 20) ; ',
sysdate, 'sysdate+30');
commit;
end;
/
Statement processed.
Print jobno
JOBNO
-------------
16
以上作業(yè),每隔一個月用DBMS_UTILITY.ANALYZE_SCHEMA對用戶SCOTT的所有表,簇表和索引作統(tǒng)計分析