系統城裝機大師 - 唯一官網:www.farandoo.com!

當前位置:首頁 > 數據庫 > MsSql > 詳細頁面

SQL語句執行超時引發網站首頁訪問故障問題

時間:2020-02-05來源:系統城作者:電腦系統城

非常抱歉,今天早上 6:37~8:15 期間,由于獲取網站首頁博文列表的 SQL 語句出現突發的查詢超時問題,造成訪問網站首頁時出現 500 錯誤,由此給您帶來麻煩,請您諒解。

故障的情況是這樣的。

故障期間日志中記錄了大量下面的錯誤。


 
  1. 2020-02-03 06:37:24.635 [Error] An unhandled exception has occurred while executing the request./Microsoft.AspNetCore.Diagnostics.ExceptionHandlerMiddlewareSystem.Data.SqlClient.SqlException(0x80131904): Timeout expired. The timeout period elapsed prior to completion of the operation or the server is not responding. ---> System.ComponentModel.Win32Exception(258): Unknown error 258 at System.Data.SqlClient.SqlCommand.<>c.<ExecuteDbDataReaderAsync>b__126_0(Task`1 result)

數據庫服務器(阿里云 RDS SQL Server 2016 實例)的 CPU 消耗突增。

SQL語句執行超時引發網站首頁訪問故障問題

數據庫服務器的 IOPS 暴增。

SQL語句執行超時引發網站首頁訪問故障問題

通過阿里云 RDS 控制臺的 CloudDBA 可以查看到故障期間獲取首頁博文的 SQL 語句被執行了3萬多次,執行這么多次是由于查詢超時,無法建立緩存,每次請求都要訪問數據庫。

SQL語句執行超時引發網站首頁訪問故障問題

發現故障后,我們通過阿里云 RDS 的主備切換恢復了正常。

經過對故障的排查分析,鎖定的最大嫌疑對象是 SQL Server 參數嗅探(詳見園子里的博文 什么是 SQL Server 參數嗅探)。

對于這種因為重用他人生成的執行計劃而導致的水土不服現象,SQL Server 有一個專有名詞,叫“參數嗅探 parameter sniffing”。

而且我們找到了引發 SQL Server 參數嗅探問題的條件。

在我們的 open api 中提供了獲取首頁博文列表的 web api ,但沒有限制可以獲取的最大博文數,也就是下面的 ItemCount 參數(除了 open api ,其他地方調用時 ItemCount 值都是 20 )。

SELECT TOP (@ItemCount)

假如有人調用 open api 時給 ItemCount 傳了一個很大的值,比如 20000 ,雖然調用的是同樣的 SQL 語句,但由于 ItemCount 的值不同, SQL Server 可能會生成相差很大的執行計劃,對于 ItemCount 20000 性能比較好的執行計劃,對于 ItemCount 20 可能性能極差。如果查詢 ItemCount 20000 時生成的執行計劃被緩存下來,查詢 ItemCount 20 時繼續使用這個執行計劃,就會出現本來好好的 SQL 查詢突然變得性能極差。我們今天遇到的故障很可能就是這個原因,而且故障時就一個 SQL 語句出現問題(正好就這個 SQL 查詢緩存了水土不服的執行計劃),其他都正常,也驗證了這個猜測。

通過這次故障,我們吸取的教訓是一定要在代碼中對 ItemCount 與 PageSize 的最大值進行限制,它不僅僅是帶來不必要的低性能查詢,而且可能會因為 SQL Server 參數嗅探問題拖垮整個數據庫。

總結

以上所述是小編給大家介紹的SQL語句執行超時引發網站首頁訪問故障問題,希望對大家有所幫助!

分享到:

相關信息

系統教程欄目

欄目熱門教程

人氣教程排行

站長推薦

熱門系統下載

jlzzjlzz亚洲乱熟在线播放