共計 13456 個字符,預計需要花費 34 分鐘才能閱讀完成。
本篇內容主要講解“怎么解決 oracle 丟失的是所有的 redo 日志組問題”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓丸趣 TV 小編來帶大家學習“怎么解決 oracle 丟失的是所有的 redo 日志組問題”吧!
假設丟失的是所有的 redo 日志組,分下列幾種情況分別處理:
1.Oracle 沒開歸檔,一致性關閉數據庫
2.Oracle 沒開歸檔,非一致性關閉數據庫
3.Oracle 開歸檔,一致性關閉數據庫
4.Oracle 開歸檔,非一致性關閉數據庫
一:Oracle 沒開歸檔,一致性關閉數據庫
我做實驗的過程中有一個詭異的情況,我先把 redo 文件從操作系統層面都刪除了,但是數據庫正常創建表,insert 數據,我理解的是當你 commit 的時候,會觸發 lgwr 進程從 redo log buffer 中涮新 redo 到 redo 文件中,但是 redo 文件已經被刪除了,就會報錯,但是他并沒有報錯:
[root@testdb59 /data/u01/app/oracle/oradata/stdb59]# ll
total 13697796
-rw-r—– 1 oracle oinstall 144916480 Apr 5 22:30 control01.ctl
-rw-r—– 1 oracle oinstall 2147491840 Apr 5 22:26 liuwenhe.dbf
-rw-r—– 1 oracle oinstall 52429312 Apr 5 22:26 redo01.log
-rw-r—– 1 oracle oinstall 52429312 Apr 5 22:29 redo03.log
-rw-r—– 1 oracle oinstall 4938801152 Apr 5 22:26 soe3.dbf
-rw-r—– 1 oracle oinstall 2469404672 Apr 5 22:26 soe.dbf
-rw-r—– 1 oracle oinstall 2705334272 Apr 5 22:26 sysaux01.dbf
-rw-r—– 1 oracle oinstall 786440192 Apr 5 22:26 system01.dbf
-rw-r—– 1 oracle oinstall 30416896 Oct 16 12:37 temp01.dbf
-rw-r—– 1 oracle oinstall 1073750016 Apr 5 22:26 temp.dbf
-rw-r—– 1 oracle oinstall 309338112 Apr 5 22:26 undotbs01.dbf
-rw-r—– 1 oracle oinstall 166469632 Apr 5 22:26 users01.dbf
刪除 redo 文件
[root@testdb59 /data/u01/app/oracle/oradata/stdb59]# rm *.log
再次查看,發現確實已經沒有了 redo 文件
[root@testdb59 /data/u01/app/oracle/oradata/stdb59]# ll
total 13595388
-rw-r—– 1 oracle oinstall 144916480 Apr 5 22:50 control01.ctl
-rw-r—– 1 oracle oinstall 2147491840 Apr 5 22:50 liuwenhe.dbf
-rw-r—– 1 oracle oinstall 4938801152 Apr 5 22:50 soe3.dbf
-rw-r—– 1 oracle oinstall 2469404672 Apr 5 22:50 soe.dbf
-rw-r—– 1 oracle oinstall 2705334272 Apr 5 22:50 sysaux01.dbf
-rw-r—– 1 oracle oinstall 786440192 Apr 5 22:50 system01.dbf
-rw-r—– 1 oracle oinstall 30416896 Oct 16 12:37 temp01.dbf
-rw-r—– 1 oracle oinstall 1073750016 Apr 5 22:41 temp.dbf
-rw-r—– 1 oracle oinstall 309338112 Apr 5 22:50 undotbs01.dbf
-rw-r—– 1 oracle oinstall 166469632 Apr 5 22:50 users01.dbf
SQL create table t(int int);
Table created.
SQL insert into t values (100);
1 row created.
SQL commit;
SQL alter system switch logfile;
System altered.
SQL alter system checkpoint;
System altered.
有點理解不了!!!! 問了下老師,才知道原來是打開的文件句柄還在,重啟之后就沒有了! 就會報錯
(體外話:也就是說 rm 這個文件了,但是這個文件實際上還是存在的,先說一下他的工作原理吧,然后我在把試驗分享給大家,工作原理其實也不難,這個工具需要在 ext3 或者 ext4 的文件系統上才可以實現,因為 ext3 文件系統是日志型文件系統,ext3 文件系統儲存信息的時候是由 inode 號和 block 塊存儲的。
神馬? 不知道什么是 inode 號? 和 block 塊? 好吧,在說明白點,比如:一個分區比如一本書,那么 block 塊就是書每頁的內容,而 inode 號 就是書的目錄,系統找文件的時候先找 inode 號 然后根據 inode 號去找硬盤上的 block 快信息,明白了吧!
在說一下刪除的原理吧。當硬盤上的一個文件刪除,其實沒有真正想象中的那樣在硬盤上清除掉的,他是把 inode 號和 block 塊的那個鏈子 斷開,但是真正的數據還是在硬盤上的,有沒有感覺在 windos 上刪除是那么快,沒考慮到這吧,當你在刪除文件的地方重新復制了新文件,那時候才會把之前的文件覆蓋掉,也就是說刪除了沒有關系,千萬不要往那個位置放文件了 )
因為數據庫是一致性關閉的,也就是不需要實例恢復,也就不需要丟失的 redo,所以可以直接刪除重建,當然也可以 recover database 來恢復丟失的 redo, 所以針對這種情況,有兩種恢復方式:
方法一:直接 clear 相應的 redo 日志組! 也就是刪除重新建立!
SQL shutdown immediate #一致性關閉
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL startup mount
ORACLE instance started.
Total System Global Area 1603411968 bytes
Fixed Size 2253664 bytes
Variable Size 1275071648 bytes
Database Buffers 318767104 bytes
Redo Buffers 7319552 bytes
Database mounted.
SQL archive log list;
Database log mode No Archive Mode
Automatic archival Disabled
Archive destination USE_DB_RECOVERY_FILE_DEST
Oldest online log sequence 30641
Current log sequence 30642
清理刪除從新建立或者直接 clear 所有的 redo 日志組,包括當前狀態的和 active 狀態的 redo 日志組!
SQL alter database clear logfile group 1;
Database altered.
SQL alter database clear logfile group 3;
Database altered.
SQL alter database open ;
Database altered.
方法二:recover 的方式恢復重做日志,我的實驗過程中,有的時候這個方法會報錯,如果報錯那么就使用第一種方式恢復!
SQL shutdown immediate
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL startup mount
ORACLE instance started.
Total System Global Area 830930944 bytes
Fixed Size 2257800 bytes
Variable Size 536874104 bytes
Database Buffers 289406976 bytes
Redo Buffers 2392064 bytes
Database mounted.
SQL
### 恢復丟失的 redo 文件,但是需要 open resetlogs 之后才能自動創建上!
SQL recover database until cancel;
Media recovery complete.
SQL alter database open resetlogs;
Database altered.
二:Oracle 沒開歸檔,非一致性關閉數據庫
[root@testdb59 /data/u01/app/oracle/oradata/stdb59]# rm -f *.log
SQL shu abort ### 非一致性關閉數據庫
ORACLE instance shut down.
這個時候嘗試使用前面的 clear 或者 recover database 都會報錯,無法恢復,因為這個時候是需要做實例恢復的,那么什么時候需要實例恢復的判斷依據,請參考另一篇文章 (Oracle 原理 —– 關于 oracle 實例恢復的前滾和回滾的理解),報錯如下:
首先嘗試重建,當你嘗試 clear 當前的日志組的時候,會報錯提示是需要的!!! 因為非一致性關閉確實需要使用丟失的 active 和 current 狀態的 redo 來實例恢復!
首先啟動數據庫到 mount 狀態
SQL alter database clear logfile group 3;
alter database clear logfile group 3
*
ERROR at line 1:
ORA-01624: log 3 needed for crash recovery of instance stdb59 (thread 1)
ORA-00312: online log 3 thread 1:
/data/u01/app/oracle/oradata/stdb59/redo03.log
然后嘗試 recover database, 結果肯定不可以,因為實例恢復需要的 redo 已經丟失!!
SQL recover database until cancel;
ORA-00279: change 21959466 generated at 04/06/2019 21:15:45 needed for thread 1
ORA-00289: suggestion :
/data/u01/app/oracle/fast_recovery_area/STDB59/archivelog/2019_04_06/o1_mf_1_2_%
u_.arc
ORA-00280: change 21959466 for thread 1 is in sequence #2
Specify log: {RET =suggested | filename | AUTO | CANCEL}
CANCEL
ORA-01547: warning: RECOVER succeeded but OPEN RESETLOGS would get error below
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /data/u01/app/oracle/oradata/stdb59/system01.dbf
ORA-01112: media recovery not started
SQL alter database open RESETLOGS;
alter database open RESETLOGS
ERROR at line 1:
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /data/u01/app/oracle/oradata/stdb59/system01.dbf
那么針對這種情況,恢復的方式如下:
使用一個隱含參數_allow_resetlogs_corruption 強制啟動數據庫,設置此參數之后,在數據庫 Open 過程中,Oracle 會跳過某些一致性檢查,從而使數據庫可能跳過不一致狀態,到達 open 數據庫的目的
SQL create pfile= /home/oracle/pfile.ora from spfile;
File created.
然后在 /home/oracle/pfile.ora 添加上
*._allow_resetlogs_corruption=true
SQL startup mount pfile= /home/oracle/pfile.ora
SQL recover database until cancel; #恢復丟失的 redo 文件
ORA-00279: change 21959471 generated at 04/06/2019 22:34:01 needed for thread 1
ORA-00289: suggestion :
/data/u01/app/oracle/fast_recovery_area/STDB59/archivelog/2019_04_06/o1_mf_1_2_%
u_.arc
ORA-00280: change 21959471 for thread 1 is in sequence #2
Specify log: {RET =suggested | filename | AUTO | CANCEL}
CANCEL
ORA-01547: warning: RECOVER succeeded but OPEN RESETLOGS would get error below
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /data/u01/app/oracle/oradata/stdb59/system01.dbf
ORA-01112: media recovery not started
幸運的話就可以直接以 resetlogs 方式 open 數據庫了!
SQL alter database open RESETLOGS;
Database altered.
如果遇到下面的錯誤,那么你就得重建控制文件了:
SQL alter database open RESETLOGS;
alter database open RESETLOGS
*
ERROR at line 1:
ORA-01092: ORACLE instance terminated. Disconnection forced
ORA-00704: bootstrap process failure
ORA-00704: bootstrap process failure
ORA-00600: internal error code, arguments: [2662], [0], [21959484], [0],
[21959877], [4194545], [], [], [], [], [], []
Process ID: 13177
Session ID: 63 Serial number: 5
重建數據庫控制文件
1) 直接使用如下 alter database backup controlfile 這種會報錯
SQL alter database backup controlfile to trace as /data/u01/control_rebuild.trc
alter database backup controlfile to trace as /data/u01/control_rebuild.trc
*
ERROR at line 1:
ORA-16433: The database must be opened in read/write mode.
2) 還可以使用如下特定的格式來重建,
查詢數據庫的 redo 信息:
SQL select GROUP#,MEMBER from v$logfile;
GROUP# MEMBER
3 /data/u01/app/oracle/oradata/stdb59/redo03.log
1 /data/u01/app/oracle/oradata/stdb59/redo01.log
查詢數據庫的 datafile 信息
SQL select MEMBER from v$logfile;
MEMBER
——————————————————————————–
/data/u01/app/oracle/oradata/stdb59/redo03.log
/data/u01/app/oracle/oradata/stdb59/redo01.log
/data/u01/app/oracle/oradata/stdb59/redo04.log
/data/u01/app/oracle/oradata/stdb59/redo05.log
/data/u01/app/oracle/oradata/stdb59/redo06.log
/data/u01/app/oracle/oradata/stdb59/redo07.log
查出數據庫字符集:
SQL select userenv(language) nls_lang from dual;
NLS_LANG
—————————————————-
AMERICAN_AMERICA.AL32UTF8
然后編輯出創建控制文件的腳本:注意這里的的 testdb57 為數據庫 (db_name), 如果是 adg 轉換成的主庫,不要寫 db_unique_name
CREATE CONTROLFILE REUSE DATABASE testdb57 NORESETLOGS ARCHIVELOG
MAXLOGFILES 50
MAXLOGMEMBERS 5
MAXDATAFILES 100
MAXINSTANCES 8
MAXLOGHISTORY 226
LOGFILE
GROUP 3 /data/u01/app/oracle/oradata/stdb59/redo03.log SIZE 50M,
GROUP 1 /data/u01/app/oracle/oradata/stdb59/redo01.log SIZE 50M
DATAFILE
/data/u01/app/oracle/oradata/stdb59/system01.dbf ,
/data/u01/app/oracle/oradata/stdb59/sysaux01.dbf ,
/data/u01/app/oracle/oradata/stdb59/undotbs01.dbf ,
/data/u01/app/oracle/oradata/stdb59/users01.dbf ,
/data/u01/app/oracle/oradata/stdb59/liuwenhe.dbf ,
/data/u01/app/oracle/oradata/stdb59/soe.dbf ,
/data/u01/app/oracle/oradata/stdb59/soe3.dbf
CHARACTER SET AL32UTF8;
然后直接將數據庫啟動到 nomount 狀態,執行創建腳本即可
SQL startup nomount pfile= /home/oracle/pfile.ora
ORACLE instance started.
Total System Global Area 1603411968 bytes
Fixed Size 2253664 bytes
Variable Size 1275071648 bytes
Database Buffers 318767104 bytes
Redo Buffers 7319552 bytes
CREATE CONTROLFILE REUSE DATABASE testdb57 NORESETLOGS ARCHIVELOG
MAXLOGFILES 50
MAXLOGMEMBERS 5
MAXDATAFILES 100
MAXINSTANCES 8
MAXLOGHISTORY 226
LOGFILE
GROUP 3 /data/u01/app/oracle/oradata/stdb59/redo03.log SIZE 50M,
GROUP 1 /data/u01/app/oracle/oradata/stdb59/redo01.log SIZE 50M
DATAFILE
/data/u01/app/oracle/oradata/stdb59/system01.dbf ,
/data/u01/app/oracle/oradata/stdb59/sysaux01.dbf ,
/data/u01/app/oracle/oradata/stdb59/undotbs01.dbf ,
/data/u01/app/oracle/oradata/stdb59/users01.dbf ,
/data/u01/app/oracle/oradata/stdb59/liuwenhe.dbf ,
/data/u01/app/oracle/oradata/stdb59/soe.dbf ,
/data/u01/app/oracle/oradata/stdb59/soe3.dbf
CHARACTER SET AL32UTF8;
Control file created.
然后使用 oradebug 推進內存中 scn 號, 以便于執行后面的 recover 來恢復丟失的 redo 文件,因為 recover 的過程會讀取內存中 scn。注意 alter session set events 10015 trace name adjust_scn level 10 這種方式在 11.2.0.4 已經失效了
(題外話:我們先聊聊 Oracle 的 SCN。在數據庫內部,SCN 是一個單向遞增的數字編號,控制文件、數據文件、在線 Redo 日志、歸檔日志和備份集合中,都包括這個數字編號。在內部文件中,SCN 是通過 Base 和 Wrap 兩個部分進行保存。Base 是 SCN 編號的基礎位,是通過 32 位二進制位進行保存。一旦超過這 32 位長度,系統會自動在 Wrap 進位。也就是說,Wrap 表示的超過 4G 個數的進位次數)
SQL oradebug poke 0x06001AE70 4 0x001B7740
oradebug 推進 scn 號,poke 命令中,第一位參數是對應寫入的內存位數,第二位參數是寫入長度,第三位參數是寫入取值。默認寫入取值是 10 進制,我們在這里指定寫入 16 進制 (0x 開頭),每一個取值段,用 8 個 16 進制對應,對應到數字位數是 4 位
首先查出數據庫的控制文件中的 scn 號
SQL select file#, checkpoint_change# from v$datafile;
FILE# CHECKPOINT_CHANGE#
———- ——————
1 21959486
2 21959486
3 21959486
4 21959486
5 21959486
6 21959486
7 21959486
7 rows selected.
SQL oradebug setmypid
Statement processed.
SQL oradebug DUMPvar SGA kcsgscn_
kcslf kcsgscn_ [06001AE70, 06001AEA0) = 014F14A2 00000001 00000000 00000000 000000EB 00000000 00000000 00000000 00000000 00000000 6001AB50 00000000
SQL oradebug poke 0x06001AE70 4 21959486
BEFORE: [06001AE70, 06001AE74) = 00000000
AFTER: [06001AE70, 06001AE74) = 014F133E
(或者可以把 21959486 轉換成 16 進制,然后再修改
SQL select to_char(21959486, XXXXXXXXXXX) from dual;
TO_CHAR(2195
————
14F133E
SQL oradebug poke 0x06001AE70 4 0x14F133E
BEFORE: [06001AE70, 06001AE74) = 00000000
AFTER: [06001AE70, 06001AE74) = 014F133E)
再次查看確實已經變成了 014F133E(對應 10 進制是 21959486)
SQL oradebug DUMPvar SGA kcsgscn_
kcslf kcsgscn_ [06001AE70, 06001AEA0) = 014F133E 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 6001AB50 00000000
然后執行 recover 進行不完全恢復:
SQL recover database until cancel;
ORA-00279: change 21959486 generated at 04/06/2019 23:52:28 needed for thread 1
ORA-00289: suggestion :
/data/u01/app/oracle/fast_recovery_area/STDB59/archivelog/2019_04_07/o1_mf_1_2_%
u_.arc
ORA-00280: change 21959486 for thread 1 is in sequence #2
Specify log: {RET =suggested | filename | AUTO | CANCEL}
CANCEL
ORA-01547: warning: RECOVER succeeded but OPEN RESETLOGS would get error below
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /data/u01/app/oracle/oradata/stdb59/system01.dbf
ORA-01112: media recovery not started
SQL alter database open resetlogs;
Database altered.
至此恢復成功!
三:oracle 開歸檔,一致性關閉
這種情況是同情況 1,不需要做實例恢復,所以可以直接刪除從新或者 recover 所有的 redo 組即可,
方法一:直接 clear 相應的 redo 日志組! 也就是刪除重新建立!
SQL shutdown immediate #一致性關閉
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL startup mount
ORACLE instance started.
Total System Global Area 1603411968 bytes
Fixed Size 2253664 bytes
Variable Size 1275071648 bytes
Database Buffers 318767104 bytes
Redo Buffers 7319552 bytes
Database mounted.
清理刪除從新建立或者直接 clear 所有的 redo 日志組,包括當前狀態的和 active 狀態的 redo 日志組!
SQL alter database clear logfile group 1;
Database altered.
SQL alter database clear logfile group 3;
Database altered.
SQL alter database open ;
Database altered.
方法二:recover 的方式恢復重做日志,我的實驗過程中,有的時候這個方法會報錯,如果報錯那么就使用第一種方式恢復!
SQL shutdown immediate
Database closed.
Database dismounted.
ORACLE instance shut down.
SQL startup mount
ORACLE instance started.
Total System Global Area 830930944 bytes
Fixed Size 2257800 bytes
Variable Size 536874104 bytes
Database Buffers 289406976 bytes
Redo Buffers 2392064 bytes
Database mounted.
SQL
### 恢復丟失的 redo 文件,但是需要 open resetlogs 之后才能自動創建上!
SQL recover database until cancel;
Media recovery complete.
SQL alter database open resetlogs;
Database altered.
四:開歸檔,非一致性關閉;
這種情況,只能借助歸檔日志做不完全恢復!
SQL select * from v$log;
GROUP# THREAD# SEQUENCE# BYTES BLOCKSIZE MEMBERS ARC
———- ———- ———- ———- ———- ———- —
STATUS FIRST_CHANGE# FIRST_TIM NEXT_CHANGE# NEXT_TIME
—————- ————- ——— ———— ———
1 1 39 52428800 512 1 YES
INACTIVE 4318162327 20-APR-19 4318209770 20-APR-19
3 1 40 52428800 512 1 NO
CURRENT 4318209770 20-APR-19 2.8147E+14
SQL archive log list;
Database log mode Archive Mode
Automatic archival Enabled
Archive destination USE_DB_RECOVERY_FILE_DEST
Oldest online log sequence 39
Next log sequence to archive 40
Current log sequence 40
刪除 redo log 文件
[oracle@testdb59 stdb59]$ rm -f *.log
然后非一致性關閉
SQL shu abort
ORACLE instance shut down.
解決過程:
SQL startup mount
ORACLE instance started.
Total System Global Area 1603411968 bytes
Fixed Size 2253664 bytes
Variable Size 1275071648 bytes
Database Buffers 318767104 bytes
Redo Buffers 7319552 bytes
Database mounted.
### 恢復丟失的 redo 文件,但是需要 open resetlogs 之后才能自動創建上!
SQL recover database until cancel;
Media recovery complete.
嘗試 resetlog 方式打開,如果報錯如下,那么還得借助隱含參數_allow_resetlogs_corruption;
SQL alter database open RESETLOGS;
alter database open RESETLOGS
*
ERROR at line 1:
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: /data/u01/app/oracle/oradata/stdb59/system01.dbf
使用一個隱含參數_allow_resetlogs_corruption 強制啟動數據庫,設置此參數之后,在數據庫 Open 過程中,Oracle 會跳過某些一致性檢查,從而使數據庫可能跳過不一致狀態,到達 open 數據庫的目的
SQL create pfile= /home/oracle/pfile.ora from spfile;
File created.
然后在 /home/oracle/pfile.ora 添加上
*._allow_resetlogs_corruption=true
SQL startup mount pfile= /home/oracle/pfile.ora
SQL alter database open RESETLOGS;
Database altered.
然后一致性關閉數據庫,去掉隱含參數_allow_resetlogs_corruption,重啟數據庫!
到此,相信大家對“怎么解決 oracle 丟失的是所有的 redo 日志組問題”有了更深的了解,不妨來實際操作一番吧!這里是丸趣 TV 網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!