共計 5138 個字符,預計需要花費 13 分鐘才能閱讀完成。
本篇內容主要講解“解決 Oracle 數據庫出現問題時的腳本有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓丸趣 TV 小編來帶大家學習“解決 Oracle 數據庫出現問題時的腳本有哪些”吧!
查看操作系統負載
登上數據庫服務器后,第一個就是通過系統命令確認下 CPU、內存、I/ O 是否異常,每個系統的命令不一樣,常見的有 top、topas、vmstat、iostat。
查看等待事件
第二步就是連到數據庫查看活動的等待事件,這是監控、巡檢、診斷數據庫最基本的手段,通常 81% 的問題都可以通過等待事件初步定為原因,它是數據庫運行情況最直接的體現,如下腳本是查看每個等待事件的個數、等待時長,并排除了一些常見的 IDLE 等待事件。
-- 墨天輪 wait_event
col event for a45
SELECT inst_id,EVENT, SUM(DECODE(WAIT_TIME, 0, 0, 1)) Prev , SUM(DECODE(WAIT_TIME, 0, 1, 0)) Curr , COUNT(*) Tot , sum(SECONDS_IN_WAIT) SECONDS_IN_WAIT
FROM GV$SESSION_WAIT
WHERE event NOT
IN (smon timer , pmon timer , rdbms ipc message , SQL*Net message from client , gcs remote message)
AND event NOT LIKE %idle%
AND event NOT LIKE %Idle%
AND event NOT LIKE %Streams AQ%
GROUP BY inst_id,EVENT
ORDER BY 1,5 desc;
這里就需要掌握一些常見異常等待事件的原因,并形成條件反射,比如 library cache lock、read by other session、row cache lock、buffer busy waits、latch:shared pool、gc buffer busy、cursor: pin S on X、direct path read、log file sync、enq: TX – index contention、PX Deq Credit: send blkd、latch free、enq: TX – row lock contention 等等,如果異常等待事件的個數和等待時間很長,那么排查原因的入口就在這里。
根據等待事件查會話
得到異常等待事件之后,我們就根據等待事件去查會話詳情,也就是查看哪些會話執行哪些 SQL 在等待,另外還查出來用戶名和機器名稱,以及是否被阻塞。另外如下腳本可改寫成根據用戶查會話、根據 SQL_ID 查會話等等。
-- 墨天輪 session_by_event
SELECT /*+rule */ sid, s.serial#, spid, event, sql_id, seconds_in_wait ws, row_wait_obj# obj, s.username, s.machine,
BLOCKING_INSTANCE|| . ||blocking_session b_sess FROM v$session s,
v$process p WHERE event= event_name AND s.paddr = p.addr order by 6;
查詢某個會話詳情
得到會話列表之后,可以根據如下 SQL 查詢某個會話的詳細信息,如上次個執行的 SQL_ID,登錄時間等,該 SQL 也可改寫成多個。
-- 墨天輪 session_by_sid
SELECT s.sid, s.serial#, spid, event, sql_id, PREV_SQL_ID,
seconds_in_wait ws, row_wait_obj# obj, s.username, s.machine,
module,blocking_session b_sess,logon_time FROM v$session s, v$process p WHERE sid = sid AND s.paddr = p.addr;
查詢對象信息
從前面兩個 SQL 都可以看到會話等待的對象 ID,可以通過如下 SQL 查詢對象的詳細信息。
-- 墨天輪 obj_info
col OBJECT_NAME for a30
select owner,object_name,subobject_name,object_type from dba_objects where
object_id= oid;
查詢 SQL 語句
根據 SQL_ID、HASH_VALUE 查詢 SQL 語句。如果 v$sqlarea 中查不到,可以嘗試 DBA_HIST_SQLTEXT 視圖中查詢。
-- 墨天輪 sql_text
select sql_id,SQL_fullTEXT from v$sqlarea where (sql_id= sqlid or
hash_value=to_number(hashvale) ) and rownum
關于 SQL 語句的執行計劃、對象的統計信息、性能診斷、跟蹤 SQL 等這里就不展開,后面計劃出一個類似的系列,敬請關注。
查詢會話阻塞情況
通過如下 SQL 查詢某個會話阻塞了多少個會話。
-- 墨天輪 blocking_sess
select count(*),blocking_session from v$session where blocking_session
is not null group by blocking_session;
查詢數據庫的鎖
通過如下 SQL 查詢某個會話的鎖,有哪些 TM、TX 鎖,以及會話和鎖關聯查詢的 SQL,注意這里指定了 ctime 大于 100 秒,30% 的情況是人為誤操作鎖表,導致應用 SQL 被阻塞,無法運行。
-- 墨天輪 lock
set linesize 180
col username for a15
col owner for a15
col OBJECT_NAME for a30
col SPID for a10
-- 查詢某個會話的鎖
select /*+rule*/SESSION_ID,OBJECT_ID,ORACLE_USERNAME,OS_USER_NAME,PROCESS,
LOCKED_MODE from gv$locked_object where session_id= sid;
-- 查詢 TM、TX 鎖
select /*+rule*/* from v$lock where ctime 100 and type in (TX , TM) order by 3,9;
-- 查詢數據庫中的鎖
select /*+rule*/s.sid,p.spid,l.type,round(max(l.ctime)/60,0)
lock_min,s.sql_id,s.USERNAME,b.owner,b.object_type,b.object_name from
v$session s, v$process p,v$lock l,v$locked_object o,dba_objects b
where o.SESSION_ID=s.sid and s.sid=l.sid and o.OBJECT_ID=b.OBJECT_ID
and s.paddr = p.addr and l.ctime 100 and l.type in (TX , TM , FB)
group by
s.sid,p.spid,l.type,s.sql_id,s.USERNAME,b.owner,b.object_type,b.object_name
order by 9,1,3
保留現場證據
有的問題可能需要分析很長時間,或者是需要外部人員協助分析,那么保留現場證據就非常重要了,下面腳本是 systemstate dump 和 hanganalyze 步驟,如果有 sqlplus 無法登陸的情況,可以加 -prelim 參數。
--systemstate dump
sqlplus -prelim / as sysdba
oradebug setmypid
oradebug unlimit;
oradebug dump systemstate 266;
--wait for 1 min
oradebug dump systemstate 266;
--wait for 1 min
oradebug dump systemstate 266;
oradebug tracefile_name;
--hanganalyze
oradebug setmypid
oradebug unlimit;
oradebug dump hanganalyze 3
--wait for 1 min
oradebug dump hanganalyze 3
--wait for 1 min
oradebug dump hanganalyze 3
oradebug tracefile_name
殺會話
通常情況下,初步定為問題后為了快速恢復業務,需要去殺掉某些會話,特別是批量殺會話,有時還會直接 kill 所有 LOCAL=NO 的進程,再殺會話時一定要檢查確認,更不能在別的節點或者別的服務器上執行。
- 墨天輪 kill_sess
set line 199
col event format a35
-- 殺某個 SID 會話
SELECT /*+ rule */ sid, s.serial#, kill -9 ||spid, event,
blocking_session b_sess FROM v$session s, v$process p WHERE sid= sid AND s.paddr = p.addr order by 1;
-- 根據 SQL_ID 殺會話
SELECT /*+ rule */ sid, s.serial#, kill -9 ||spid, event,
blocking_session b_sess FROM v$session s, v$process p WHERE sql_id= sql_id AND s.paddr = p.addr order by 1;
-- 根據等待事件殺會話
SELECT /*+ rule */ sid, s.serial#, kill -9 ||spid, event,
blocking_session b_sess FROM v$session s, v$process p WHERE event= event AND s.paddr = p.addr order by 1;
-- 根據用戶殺會話
SELECT /*+ rule */ sid, s.serial#, kill -9 ||spid, event,
blocking_session b_sess FROM v$session s, v$process p WHERE username= username AND s.paddr = p.addr order by 1;
--kill 所有 LOCAL=NO 進程
ps -ef|grep LOCAL=NO|grep $ORACLE_SID|grep -v grep|awk {print $2} |xargs ki
重啟方法
tail -f alert_.log
alter system checkpoint;
alter system switch logfile;
shutdown immediate;
startu
如需要修改靜態參數、內存等問題,需要重啟數據庫,(不要覺得重啟很 LOW,在很多情況下為了快速恢復業務經常使用這個從網吧里傳出來的絕招),記住千萬不要在這個時候死磕問題原因、當作課題研究,我們的首要任務是恢復業務。
CRT 按鈕小技巧
另外介紹一個小技巧,就是把常用的腳本整理到 SecureCRT 的 Button Bar 中,只需要點一下設置好的 button,就相當于直接執行相應的 SQL 語句,這樣就不用每次粘貼復制執行,或者是把腳本上傳到每個服務器上。不過不要設置 DDL 等操作性的 button,以免誤點。
到此,相信大家對“解決 Oracle 數據庫出現問題時的腳本有哪些”有了更深的了解,不妨來實際操作一番吧!這里是丸趣 TV 網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!