119a title

通訊課程2(專業課程):實證護理新趨勢:GRADE的變革與新證據金字塔(The New Evidence Pyramid)

實證護理臨床應用

陳可欣 臺北市立萬芳醫院護理部副主任
蔣立琦 國防醫學院護理學系暨研究所教授

我要考試


實證護理新趨勢:GRADE的變革與新證據金字塔(The New Evidence Pyramid)

  實證護理包括五大步驟(5A):包括形成一個可回答的臨床問題 (Ask)、搜尋最佳證據(Acquire)、進行嚴格的文獻評讀(Appraise)、應用以解決病人的健康問題(Apply)、及評估執行成效(Audit)(Sackett, 1997)。透過文獻評讀的過程,臨床健康照護者能更深入地檢視研究設計及執行的過程是否產生偏差,而導致結果被誇大或低估,避免做出錯誤的臨床決策。實證醫學的證據等級在GRADE (The Grading of Recommendations Assessment, Development and Evaluation) 評分系統提出之後,證據金字塔也進行了大幅修正,本文將分享新的證據金字塔及證據評等新趨勢,期望護理人員在引用及評定實證文獻時,更能與時俱進,促進臨床實證健康照護之實踐。

傳統的證據金字塔及證據等級(Level of Evidence, LOE)

  早在90年代,美國健康照護政策與研究機構(Agency For Healthcare Research And Quality, AHCPR) 就提出證據等級的分類方法,這個架構主要是依據研究設計之方法學來分級。例如,針對治療型文獻,以系統性文獻回顧/統合分析視為最高的證據等級,其次是隨機對照試驗、觀察性研究(世代研究、個案對照研究)、病例序列研究,個案報告等則在證據金字塔的最底層(圖一,A)。當該研究方法產生的偏誤風險越少,其證據等級之評等則較高(Grimes & Schulz, 2002)。英國牛津大學實證醫學中心(Oxford University EBM Center) 2011年更新的證據等級,隨機對照試驗不再是解決所有臨床問題證據等級的黃金標準。例如:針對預後型的臨床問題,納入世代研究彙整之系統性回顧則較隨機對照試驗佳;而針對診斷型臨床問題,則以該診斷/檢驗項目結果、與現今黃金準則結果一致之橫斷性研究的系統性文獻回顧文獻為最高文獻等級。這套證據等級曾一度成為實證護理教學及實證健康照護中公認的黃金標準,也是目前最廣泛被引用的標準之一。

  傳統的證據金字塔專注於研究設計,英國牛津大學實證醫學中心之證據等級在研究設計的基礎上,考慮了精確性和一致性,並依據研究設計及執行過程的優劣、納入個案數是否足夠、介入措施的效果是否顯著、文獻中PICO與臨床問題是否有差異、各篇文獻是否呈現一致的結果…等,來判定該文獻的證據應被降級(downgrade)或升級(upgrade)。雖然在實證護理的教學上提供了快速的判斷,且大部分情況下可能是正確的。然而,在實際進行臨床決策時,僅針對單一文獻、並僅依據其研究方法學進行證據等級評等、直接對應臨床建議的強度,不但沒有考量臨床情境,且未充分將研究的間接性、發表偏差或觀察性研究的升級等因素列入考慮,在臨床實際的應用上仍缺乏全面性(陳等,2008 及 陳等,2013)。

GRADE評分系統

  2000年,由來自19個國家及國際組織的60多名研究人員、實證醫學及臨床指引制定之方法學專家、臨床專家和期刊編輯,成立了具代表性的GRADE工作小組(GRADE Working Group, 2015),藉由合作及實證方式制定出國際統一的證據等級和建議強度系統,GRADE評分系統已於2004年正式推出。由於其更加科學合理、過程透明、適用性強,目前包括世界衛生組織和考科藍合作組織等90多個國際組織、協會和學會已經採納GRADE標準,可預見其將是未來證據評等的主流趨勢(GRADE Working Group, 2015)。

  GRADE評分系統是針對通過系統性文獻回顧的方式獲得的證據體(evidence body)所包含的研究結果進行分級,而不是針對單個研究或單篇系統性文獻回顧進行分級,因此,不能將其與對單個研究的品質評價工具混淆。GRADE評分系統清楚闡述了證據品質和臨床建議強度的定義,即證據品質是指對觀察值的真實性有多大把握;建議強度指建議被實施後帶來的利益及風險。GRADE評分系統將證據品質分為高、中、低、極低四個等級,建議強度分為強、弱兩個等級(表一)。和傳統的證據等級系統一樣,GRADE評分系統對證據品質的判斷也始於研究設計。一般情況下,隨機對照試驗起始的證據等級評為「高」,但有五個降級因素;而觀察性研究起始的證據等級評為「低」,但有三個升級因素(表二) (Brożek et al., 2009; Guyatt et al., 2008; Terracciano, Brozek, Compalati, & Schünemann, 2010)。因為所有的研究設計本身均可能因研究執行過程的偏差或限制而存在缺陷,因此,隨機對照試驗和觀察性研究,均可以進行降級。在使用GRADE評分系統時,由於隨機對照試驗本身就是最高等級,重點考慮降級,且在一般情況下,不考慮升級;對於觀察性研究,若有符合條件的升級因素,則可考慮升級(陳等,2013)。

004

005

新的證據金字塔(The New Evidence Pyramid)

  2014年,系統性文獻回顧及統合分析使用者指南(User, s Guide on systematic reviews and meta-analysis) 重新定位評估證據等級的兩個步驟:首先,進行系統性文獻回顧及統合分析,之後再依據GRADE工作小組的建議方法(Murad et al., 2014),進行證據的升級及降級。也就是說,當我們要回答一個臨床問題時,必須先進行系統性文獻回顧或統合分析,並在嚴格評讀文獻、考量其升級或降級因素後,才能評定文獻的證據等級(Guyatt et al., 2008; Murad, Alsawas, Asi, & Alahdab, 2015)。這一演進,挑戰了傳統的證據金字塔只考量研究設計的概念。2015年,新的證據金字塔在GRADE評分系統提出之後,也進行了劃時代的修改(圖一,B)。

  新的證據金字塔強調兩個概念:(1)將證據金字塔不同研究設計的線條改為波浪形,證據等級不全然以研究設計作為判斷標準,以反映出使用GRADE評分方法之升級及降級概念;及(2)將系統性文獻回顧從證據金字塔的最頂端「砍掉」,當我們想要回答一個臨床問題時,都需先進行系統性文獻回顧,透過系統性文獻回顧這個「透鏡」(lens) ,再針對證據體進行證據等級的評定及後續的臨床應用(Murad et al., 2015)。

006

圖一 新的證據金字塔(Murad et al., 2015)

(本圖取得原作者Hassan Murad教授授權刊登,原圖刊載於http://www.isehc.net/wp-content/uploads/2011/12/October-2015.pdf)

結語

  臨床護理人員常面臨病人問題的健康決策,錯誤的解讀數據或判斷證據等級,可能誤導臨床決策的判斷,對病人健康的影響不容忽視。GRADE的優勢在於提供了一個系統化、結構化及透明化的分級方法,對於證據的升級及降級都有明確的標準,證據金字塔也據此進行了修正。然而,在使用GRADE評分系統時,可能因為研究者人數、其對評分系統了解的程度、客觀性、是否接受過相關的訓練、以及納入文獻的複雜程度等,使得所評出來的證據等級結果不完全一致(陳等,2008 及 陳等,2013)。因此,未來在實證護理的教育上,規劃系統性文獻回顧、統合分析及GRADE評分系統之相關課程及實作,使健康照護者更熟悉納入文獻證據體之升級及降級因素,能以更嚴謹的方式了解證據的全貌、並提出適當的臨床建議等級,形成兼具照護效果、效益及病人價值觀的照護決策,將有助於提升護理專業之發展、並促進民眾福祉。

參考文獻

  • Akobeng, A. K. (2005). Principles of evidence based medicine. Arch Dis Child, 90(8), 837-840. doi: 10.1136/adc.2005.071761
  • Brożek, J. L., Akl, E. A., Alonso-Coello, P., Lang, D., Jaeschke, R., Williams, J. W., . . . for the, G. W. G. (2009). Grading quality of evidence and strength of recommendations in clinical practice guidelines. Allergy, 64(5), 669-677. doi: 10.1111/j.1398-9995.2009.01973.x
  • Glasziou , P., Mar C, & Salisbury, J. (2007). Evidence-based practice workbook: BMJ Books.
  • GRADE Working Group. (2015). Organizations that have endorsed or that are using GRADE.   Retrieved 12/11, 2015, from http://www.gradeworkinggroup.org/society/index.htm
  • Grimes, D. A., & Schulz, K. F. (2002). An overview of clinical research: the lay of the land. Lancet, 359(9300), 57-61. doi: 10.1016/s0140-6736(02)07283-5
  • Guyatt, G. H., Oxman, A. D., Kunz, R., Vist, G. E., Falck-Ytter, Y., & Schünemann, H. J. (2008). What is “quality of evidence” and why is it important to clinicians? BMJ, 336(7651), 995-998. doi: 10.1136/bmj.39490.551019.BE
  • Guyatt, G. H., Oxman, A. D., Vist, G. E., Kunz, R., Falck-Ytter, Y., Alonso-Coello, P., . . . Group, G. W. (2008). GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ, 336(7650), 924-926. doi: 10.1136/bmj.39489.470347.AD
  • Higgins, J. P., Green, S. (editors) (2011). Cochrane Handbook for Systematic Reviews of Interventions Version 5.1.0. [updated March 2011]  Retrieved 11/30, 2015, from http://community.cochrane.org/handbook
  • Murad, M. H., Alsawas, M., Asi, N., & Alahdab, F. (2015). The New Evidence Pyramid. Newsletter of the International Society for Evidence-Based Health Care, 21, 8-9.
  • Murad, M. H., Montori, V. M., Ioannidis, J. P., Jaeschke, R., Devereaux, P. J., Prasad, K., . . . Guyatt, G. (2014). How to read a systematic review and meta-analysis and apply the results to patient care: users, guides to the medical literature. JAMA, 312(2), 171-179. doi: 10.1001/jama.2014.5559
  • Sackett, D. L., Straus, S. E., Richardson, W. S., Rosenberg, W., Haynes, R. B. (1997). Evidence-based medicine: How to practice and teach EBM. New York: Churchill Livingstone.
  • Terracciano, L., Brozek, J., Compalati, E., & Schünemann, H. (2010). GRADE system: new paradigm. Current Opinion in Allergy and Clinical Immunology, 10(4), 377-383. doi: 10.1097/ACI.0b013e32833c148b
  • 陳耀龍、李幼平、杜亮、王莉、文進、楊曉妍. (2008). 醫學研究中證據分級和推薦強度的演進. 中國實證醫學雜誌, 8, 127-133.
  • 陳耀龍、楊克虎、姚亮、田金徽、拜爭剛、馬彬、李秀霞. (2013). GRADE系統方法學進展. 中國循證兒科雜誌, 8, 64-65.

通訊考題 (選擇題,共10題)

  1. 根據英國牛津大學實證醫學中心(Oxford University EBM Center)2011年更新的證據等級,所有臨床問題證據等級的黃金標準為隨機對照試驗?(A) 是。(B)否。
  2. GRADE (The Grading of Recommendations Assessment, Development and Evaluation) 評分系統將證據品質分為:(A)高、中、低、極低四個等級。(B)(A)、(B)、(C)、(D) 四個等級。(C)(I)、(II)、(III)、(IV) 四個等級。(D)(1++) ~ (4) 八個等級。
  3. GRADE評分系統將建議強度分為:(A)強、弱,兩個等級。(B)強、中、弱,三個等級。(C)強、中、弱、未評等,四個等級。(D)  (A)、(B)、(C)、(D) ,四個等級。
  4. 下列何者不是GRADE評分系統中,影響證據品質的升級因素?(A)結果顯著(Large effect size)。(B)干擾因素是否可能改變效果(All plausible confounding would reduce a demonstrated effect)。(C)證據顯示存在劑量-效應關係(Dose-response gradient)。(D)以上皆是。
  5. 下列何者不是GRADE評分系統中,影響證據品質的降級因素?(A)偏差風險(Risk of bias)。(B)一致性(Consistence)。(C)間接性(Indirectness)。(D)發表偏差(Publication bias)。
  6. 對於觀察性研究,若其方法學嚴謹、顯示療效顯著且結果一致時,其證據等級評定可能需要升級或降級?(A)升級。(B)降級。
  7. 對於隨機對照試驗,若研究過程未正確隨機分組、未實施盲法或研究失訪過多,其證據等級評定可能需要升級或降級?(A)升級。(B)降級。
  8. 在GRADE評分系統中,關於隨機對照試驗和觀察性研究之證據等級及升降級原則,下列敘述何者為是?(A)隨機對照試驗起始的證據等級評為「高」,但有五個降級因素。(B)觀察性研究起始的證據等級評為「低」,但有三個升級因素。(C) 以上皆是。(D) 以上皆非。
  9. 在GRADE評分系統的降級因素中,「當研究納入的病人和觀察事件相對較少、而使得信賴區間較寬」,是反應出那一個降級因素?(A)偏差風險(Risk of bias)。(B)間接性(Indirectness)。(C)不精確性(Imprecision)。(D)發表偏差(Publication bias)。
  10. 根據Murad et al (2015)提出之新的證據金字塔,下列敘述何者為非?(A)將區分不同研究設計的線條改為波浪形。(B)證據等級以研究設計作為判斷標準。(C)當我們想要回答一個臨床問題時,需先進行系統性文獻回顧。(D)納入GRADE評分方法之升級及降級的概念。

中華民國護理師護士公會全國聯合會
Taiwan Union of Nurses Association (TUNA)
會址:10355 台北市承德路1段70之1號14樓
電話:(02)2550-2283     傳真:(02)2550-2249     電子信箱:nurse@nurse.org.tw