摘要:目的:梳理醫(yī)學人工智能時代的移動健康終端在質(zhì)量控制方面的要求和問題。方法:查閱國內(nèi)外監(jiān)管政策文獻,從國外公開的醫(yī)療器械審批資料中查詢帶有移動健康終端的智能化醫(yī)療器械在驗證與確認環(huán)節(jié)開展的具體評價工作。結果:移動健康終端的質(zhì)量評價要求在國內(nèi)外存在差異,國內(nèi)在電氣安全方面主要參考醫(yī)用電氣設備,而美國可執(zhí)行其他標準。結論:本文討論了移動健康終端對人工智能醫(yī)療器械的影響,明晰了移動健康終端的質(zhì)量評價思路,更好地保證基于移動健康終端的人工智能醫(yī)療器械的有效性和安全性。
近年來,在深度學習算法[1]的推動下,人工智能醫(yī)療器械發(fā)展迅速,預期用途多種多樣,在輔助診斷[2-3]、輔助檢測[4-5]、輔助分診[6]、臨床輔助決策[7]等領域的研究不斷取得突破,在國外已有一批產(chǎn)品獲批上市。隨著人工智能芯片的發(fā)展與移動終端產(chǎn)品硬件配置的提高,人工智能算法在移動健康終端上的部署和應用成為現(xiàn)實,使人工智能醫(yī)療器械的應用領域擴展到院外和家庭,處理對象擴展到非醫(yī)療條件下的個人健康數(shù)據(jù),而這給人工智能醫(yī)療器械的質(zhì)量控制帶來新的挑戰(zhàn)。
由于人工智能算法的性能與數(shù)據(jù)質(zhì)量的關系緊密,人工智能醫(yī)療器械的質(zhì)量控制應當綜合考慮硬件、軟件、數(shù)據(jù)集等多種因素。由于移動健康終端產(chǎn)品尚未完全納入醫(yī)療器械監(jiān)管范疇,在質(zhì)量標準、技術要求、合規(guī)性等方面的強制要求不同于醫(yī)療器械。當移動健康終端成為人工智能醫(yī)療器械的數(shù)據(jù)來源或運行平臺時,終端本身的質(zhì)量風險可能影響該類醫(yī)療器械的有效性與安全性。
為加強人工智能時代基于移動健康終端的醫(yī)療器械的質(zhì)量控制,本文對國內(nèi)外移動健康終端產(chǎn)品監(jiān)管思路[8-10]進行了回顧,對基于移動健康終端的醫(yī)療器械產(chǎn)品進行了案例分析,對移動健康終端的質(zhì)量風險進行了討論,對加強質(zhì)控工作、更好地保障相關人工智能醫(yī)療器械的有效性和安全性提出了建議。
1 移動健康終端產(chǎn)品監(jiān)管思路回顧
簡單地說,移動健康終端產(chǎn)品與醫(yī)療器械之間的界定主要由預期用途決定。當移動健康終端產(chǎn)品的預期用途符合醫(yī)療器械定義時,應作為醫(yī)療器械進行監(jiān)管。在具體實施方面,國內(nèi)外思路有所差別。
1.1 國外監(jiān)管思路
美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)對移動健康產(chǎn)品發(fā)布了兩個指導原則[8-9],分別解釋了低風險通用健康產(chǎn)品[8](Low Risk General Wellness Product)和移動醫(yī)療應用[9](Mobile Medical Application)的監(jiān)管要求,體現(xiàn)了移動健康終端的監(jiān)管思路。
前者提出了通用健康產(chǎn)品的概念,明確通用健康產(chǎn)品不作為醫(yī)療器械進行監(jiān)管。通用健康產(chǎn)品的定義包含兩個要素:1)僅用于通用健康目的;2)使用者的安全風險較低。符合定義的預期用途包括對健康狀態(tài)的維持、對健康活動的鼓勵、對健康生活方式的鼓勵、心理壓力緩解等。具體表現(xiàn)形式包括體重管理、飲食管理、運動管理、精神鼓勵,以及用于降低慢性疾病(比如糖尿病、高血壓等)風險的生活方式調(diào)整等。其中,用于運動狀態(tài)監(jiān)控的心率測量功能也被列入通用健康產(chǎn)品行列,這意味著日常生活中常見的能測量心率的手環(huán)、手表等產(chǎn)品屬于通用健康產(chǎn)品,可以不作為醫(yī)療器械監(jiān)管。
后者提出了移動計算平臺和移動醫(yī)療應用的概念。根據(jù)相應指導原則[9],日常生活中的智能手機、平板電腦、智能手表等移動終端都屬于移動計算平臺,不按照醫(yī)療器械監(jiān)管。部署在這些平臺上的APP符合醫(yī)療器械定義時,稱之為移動醫(yī)療應用。移動醫(yī)療應用的預期用途有兩種:1)用于成為其他醫(yī)療器械的組件;2)把移動計算平臺轉化為醫(yī)療器械。第二種預期用途尤其值得關注,它的意義在于當移動計算平臺成為移動醫(yī)療應用的載體時,應當按照醫(yī)療器械進行評價,而不是繼續(xù)游離于醫(yī)療器械監(jiān)管之外。
1.2 國內(nèi)監(jiān)管思路
我國的監(jiān)管思路同樣從預期用途出發(fā)[10],發(fā)布過《移動醫(yī)療器械注冊技術審查指導原則》,其中規(guī)定符合醫(yī)療器械定義的移動計算設備或軟件屬于移動醫(yī)療器械,具體包括移動醫(yī)療設備、移動獨立軟件和移動醫(yī)療附件等形式。與美國類似,預期用于健康人群的健康管理、生活方式管理、基于移動計算平臺的健康信息統(tǒng)計等功能不屬于醫(yī)療器械,而預期用于醫(yī)護人員的疾病狀態(tài)管理、對醫(yī)療器械的控制和數(shù)據(jù)交換等功能屬于醫(yī)療器械。從硬件角度,對移動醫(yī)療設備的監(jiān)管,除考慮其等效的傳統(tǒng)醫(yī)療器械的要求之外,還需綜合考慮移動計算技術的特點和風險[10],比如顯示屏、電池、數(shù)據(jù)傳輸?shù)葐栴},以及網(wǎng)絡安全、云計算、大數(shù)據(jù)等合規(guī)性要求。從軟件角度,移動獨立軟件的風險管理應考慮傳統(tǒng)獨立軟件和移動計算平臺的特殊風險。移動醫(yī)療附件需遵照移動醫(yī)療器械整體的申報要求。
相對于美國,我國對移動醫(yī)療器械用到的移動健康終端的考量更嚴格,不僅明確了移動醫(yī)療設備應滿足等效的傳統(tǒng)醫(yī)療器械要求,還增加了顯示屏、電池、數(shù)據(jù)傳輸?shù)忍厥庖蟆jP于移動醫(yī)療器械終端產(chǎn)品的質(zhì)控研究也在推進[11-12]。
2 基于移動健康終端的智能化醫(yī)療器械案例與問題分析
隨著人工智能算法的發(fā)展,基于移動健康終端的智能化醫(yī)療器械在美國已有多款產(chǎn)品獲批上市,其公開資料為研究移動健康終端的質(zhì)控要求提供了有益的參考,因此本文列舉近年來的若干案例進行分析,并討論了智能化移動健康終端的特殊質(zhì)控問題。
2.1 軟硬件結合案例
軟硬件結合案例見表 1。
表 1 軟硬件結合的智能化醫(yī)療器械
表 1所示為3個有代表性的、軟硬件結合的智能化醫(yī)療器械,每一行描述同一個產(chǎn)品的信息。其共同特征是產(chǎn)品組成既包含移動APP(以及智能算法),又包含硬件組件;產(chǎn)品的評價均參照了傳統(tǒng)醫(yī)療器械的要求,涉及軟件特性、硬件性能與安全、臨床試驗等環(huán)節(jié),涉及的具體標準都是醫(yī)療器械領域的常見標準,表 1列出了筆者建議關注的部分內(nèi)容。其中DIP.IO的比色板、Embrace的傳感器和Kardia Band的表帶等硬件組件都進行了上市前的驗證與確認,而DIP.IO的尿液分析試劑條屬于已批準的醫(yī)療器械,不再重復驗證。
從硬件的質(zhì)控角度來看,Embrace和Kardia Band相對全面,而DIP.IO存在一定的薄弱,問題在于尿液分析環(huán)節(jié)需要使用手機對試紙和比色板進行拍照,但并未對手機進行單獨考量,而是把手機、試紙、比色板和算法作為一個整體進行性能評價。從光學角度和算法性能角度看,手機光源的色溫、顯色指數(shù)、照度、圖像質(zhì)量等因素對于最終的尿液分析結果可能有重要影響,不同品牌、不同使用年限、不同狀態(tài)的手機可能帶來結果的變化。這可能是制造商規(guī)定手機型號的原因之一。從全生命周期的角度看,手機的軟硬件更新、電磁兼容等問題都有可能影響預期用途的實現(xiàn),有必要加強質(zhì)控。
2.2 獨立軟件/APP案例
獨立軟件/APP案例見表 2。
表 2 獨立的移動醫(yī)療應用
表 2所示為3個有代表性的智能化移動醫(yī)療應用,每一行描述同一個產(chǎn)品的信息。它們都作為獨立軟件獲得批準,其評價要求都包括了對算法的評價(使用數(shù)據(jù)集)、軟件特性評價、臨床確認。與傳統(tǒng)醫(yī)療器械獨立軟件不同,它們的申報資料中還包含對相關硬件進行的評價,但評價方式與角度不同,表 2列出了筆者建議關注的部分內(nèi)容。
EMurmur ID和CardioLogs ECG Analysis Platform各自使用了FDA已批準的醫(yī)療器械進行數(shù)據(jù)采集,但在申報資料中仍然體現(xiàn)了對硬件的評價。前者的申報資料中明確了電氣安全、電磁兼容、無線共存的符合性,也對性能進行了評價。后者的申報資料體現(xiàn)了心電圖機電氣安全IEC 60601-2-25、心電性能與安全標準IEC 60601-2-47,但并未考慮電磁兼容和無線共存。出現(xiàn)這種差異的原因可能是EMurmur ID配合指定型號的醫(yī)療器械硬件,有條件進行全部試驗,而CardioLogs ECG Analysis Platform未指定硬件,在電磁兼容和無線共存方面難以選擇典型性的型號開展試驗。
ECG App使用Apple Watch進行數(shù)據(jù)采集和數(shù)據(jù)分析,Apple Watch本身并不屬于醫(yī)療器械。在申報資料中,電氣安全的評價使用了音視頻、信息與通訊設備的電氣安全標準IEC 62368-1,未執(zhí)行醫(yī)用電氣設備的IEC 60601-1標準,反映了與醫(yī)療器械硬件的差別。但另一方面,對心電采集功能的評價遵循了心電性能與安全專標IEC 60601-2-47,電磁兼容也使用了IEC 60601-1-2標準,說明從數(shù)據(jù)采集功能、電磁抗擾性的角度,Apple Watch仍然按照醫(yī)療器械的要求進行評價。在這個案例當中,ECG App實質(zhì)上把移動健康終端Apple Watch變成了移動醫(yī)療設備,根據(jù)國內(nèi)的監(jiān)管思路,應當按照其等效的傳統(tǒng)醫(yī)療器械進行評價,意味著在電氣安全等方面的要求與國外不同。
2.3 智能化移動健康終端特殊質(zhì)控問題分析
隨著人工智能芯片的發(fā)展,傳統(tǒng)的通用移動健康終端與人工智能算法進一步融合,形成智能化移動健康終端,對產(chǎn)品質(zhì)量評價帶來一些新的問題。
第一是算力問題。移動健康終端一般體積較小,由電池供電,自身功率和續(xù)航能力對人工智能芯片的功耗提出了較大的限制,因而人工智能芯片在設計時強調(diào)性能功耗比,但其算力難以達到深度學習服務器的水平。這要求質(zhì)量控制工作關注效率、最大吞吐量、最大并發(fā)數(shù)等指標,充分驗證移動健康終端的算力能否滿足設計輸入。
第二是數(shù)據(jù)問題。智能化移動健康終端容易植入預處理算法,在進行產(chǎn)品檢驗時,需關注原始數(shù)據(jù)和預處理數(shù)據(jù)的區(qū)別,尤其是性能測試和電磁抗擾測試試驗結果的比對,以充分評估預處理算法對于數(shù)據(jù)質(zhì)量、產(chǎn)品抗擾性能的影響和對人工智能算法性能的影響。
第三是算法評價問題。移動終端的人工智能算法運行環(huán)境與服務器端或云端不同,較多采用移動平臺專有的框架,以硬件底層編程的形式實現(xiàn),算法的可解釋性、可用性差異較大。因此,對智能化移動健康終端算法的評價有別于人工智能醫(yī)療器械獨立軟件,需要開發(fā)特殊的方法和測試用例。
3 對加強移動健康終端質(zhì)控的建議
從以上案例可以看出,對基于移動健康終端的智能化醫(yī)療器械,無論是軟硬件結合的設備,還是獨立軟件或APP,其質(zhì)量評價都把智能算法、移動醫(yī)療應用、傳感器和計算平臺考慮在內(nèi),但不同產(chǎn)品的具體評價方面存在一定的差異和薄弱。產(chǎn)品組成中不屬于醫(yī)療器械的部分尤其值得關注,涉及到是否進行評價、是否依據(jù)醫(yī)療器械標準進行評價等關鍵問題的判斷,影響質(zhì)量評價的完整性、科學性,有必要建立明確、統(tǒng)一的思路。
由于移動健康終端在這一類醫(yī)療器械中主要扮演數(shù)據(jù)采集、數(shù)據(jù)處理的角色,是人工智能算法的數(shù)據(jù)來源和算法運行的平臺。其質(zhì)量不僅影響到當前算法的性能表現(xiàn),也影響算法的研發(fā)、訓練與測試,以及產(chǎn)品上市后的后續(xù)表現(xiàn)與不良事件。從全生命周期質(zhì)量控制的角度看,預期用于醫(yī)學人工智能的移動健康終端,即使自身不作為醫(yī)療器械監(jiān)管,也應當在性能方面進行全面的評價,以揭示和預防移動健康終端的質(zhì)量風險對數(shù)據(jù)質(zhì)量、移動醫(yī)療器械的最終性能與安全的影響,并提倡在復雜的環(huán)境下觀測和加強智能算法的魯棒性。同時,有必要在產(chǎn)品質(zhì)量標準方面開展比對研究,分析通用健康產(chǎn)品的研發(fā)標準與醫(yī)療器械標準的區(qū)別,確定符合行業(yè)實際的技術要求,兼顧監(jiān)管尺度的靈活性。
4 結論
在醫(yī)學人工智能蓬勃發(fā)展的今天,移動健康終端作為人工智能算法硬件載體的可能性越來越大,對人工智能醫(yī)療器械質(zhì)量的影響也越來越重要。在以往的監(jiān)管思路中,移動健康終端與移動醫(yī)療器械的界定較為模糊。從已批準的相關醫(yī)療器械申報資料來看,即使按照醫(yī)療器械進行評價,移動健康終端的質(zhì)量控制仍然缺乏明確而統(tǒng)一的要求。本文建議從全生命周期質(zhì)量控制的角度,對移動健康終端開展全面的質(zhì)量評價,并積極探索合理的評價尺度,以促進行業(yè)健康快速發(fā)展。
參考文獻
[1] Lecun Y, Bengio Y, Hinton G. Deep Learning[J]. Nature, 2015, 521(7553): 436. DOI:10.1038/nature14539
[2] Tufail A, Rudisill C, Egan C, et al. Automated Diabetic Retinopathy Image Assessment Software:Diagnostic Accuracy and Cost-Effectiveness Compared with Human Graders[J]. Ophthalmology, 2017, 124(3): 343-351. DOI:10.1016/j.ophtha.2016.11.014
[3] Becker A S, Marcon M, Ghafoor S, et al. Deep Learning in Mammography:Diagnostic Accuracy of a Multipurpose Image Analysis Software in the Detection of Breast Cancer[J]. Investigative Radiology, 2017, 52(7): 434. DOI:10.1097/RLI.0000000000000358
[4] Misawa M, Kudo S E, Mori Y, et al. Artificial Intelligence-assisted Polyp Detection for Colonoscopy:Initial Experience[J]. Gastroenterology, 2018, S0016508518304153.
[5] Yamada Y, Shiomi E, Hashimoto M, et al. Value of a Computer-aided Detection System Based on Chest Tomosynthesis Imaging for the Detection of Pulmonary Nodules[J]. Radiology, 2017, 287(1): 333-339.
[6] Kwon J, Lee Y, Lee Y, et al. Validation of Deeplearning-based Triage and Acuity Score Using a Large National Dataset[J]. PLOS ONE, 2018, 13(10): 1-10.
[7] Barbieri C, Molina M, Ponce P, et al. An International Observational Study Suggests That Artificial Intelligence for Clinical Decision Support Optimizes Anemia Management in Hemodialysis Patients[J]. Kidney International, 2016, 90(2): 422-429. DOI:10.1016/j.kint.2016.03.036
[8] Center for Devices and Radiological Health. Guidance for Industry and Food and Drug Administration Staff: General Wellness: Policy for Low Risk Devices[S]. Washington DC: Food and Drug Administration, 2016.
[9] Center for Devices and Radiological Health. Guidance for Industry and Food and Drug Administration Staff: Mobile Medical Applications[S]. Washington DC: Food and Drug Administration, 2015.
[10] 國家食品藥品監(jiān)督管理總局.移動醫(yī)療器械注冊技術審查指導原則[S]. 2017.
[11] 李澍, 王浩, 羅維娜, 等. 基于預期用途的移動健康產(chǎn)品監(jiān)管分類要求[J]. 中國醫(yī)療設備, 2017, 32(6): 6-8, 19. DOI:10.3969/j.issn.1674-1633.2017.06.002
[12] 王浩, 李澍, 王晨希, 等. 移動醫(yī)療器械終端產(chǎn)品質(zhì)控技術研究[J]. 中國醫(yī)療設備, 2017, 32(6): 9-11, 19. DOI:10.3969/j.issn.1674-1633.2017.06.003
[13] Center for Devices and Radiological Health. Premarket Approval(510k)Summary K173327[S]. Washington DC: Food and Drug Administration, 2018.
[14] Center for Devices and Radiological Health. Premarket Approval(510k)Summary K172935[S]. Washington DC: Food and Drug Administration, 2017.
[15] TC 62/SC 62A-Common Aspects of Electrical Equipment Used in Medical Practice. IEC 60601-1: 2005 Medical Electrical Equipment-Part 1: General Requirements for Basic Safety and Essential Performance[S]. Geneva: International Electrotechnical Commission, 2005.
[16] TC 62/SC 62A-Common Aspects of Electrical Equipment Used in Medical Practice. IEC 60601-1-2: 2014 Medical Electrical Equipment-Part 1-2: General Requirements for Basic Safety and Essential Performance-Collateral Standard: Electromagnetic Disturbances-Requirements and Tests[S]. Geneva: International Electrotechnical Commission, 2014.
[17] Center for Devices and Radiological Health. Premarket Approval(510k)Summary K171816[S]. Washington DC: Food and Drug Administration, 2017.
[18] TC 62/SC 62D-Electromedical Equipment. IEC 60601-2-47 Medical Electrical Equipment-Part 2-47: Particular Requirements for the Basic Safety and Essential Performance of Ambulatory Electrocardiographic Systems[S]. Geneva: International Electrotechnical Commission, 2012.
[19] Center for Devices and Radiological Health. De Novo Summary DEN180044[S]. Washington DC: Food and Drug Administration, 2018.
[20] TC 108-Safety of Electronic Equipment within the Field of Audio/video, Information Technology and Communication Technology. IEC 62368-1 Audio/video, Information and Communication Technology Equipment-Part 1: Safety Requirements[S]. Geneva: International Electrotechnical Commission, 2018.
[21] Center for Devices and Radiological Health. Premarket Approval(510k)Summary K181988[S]. Washington DC: Food and Drug Administration, 2019.
[22] Center for Devices and Radiological Health. Premarket Approval(510k)Summary K170568[S]. Washington DC: Food and Drug Administration, 2017.
[23] TC 62/SC 62A-Common Aspects of Electrical Equipment Used in Medical Practice. IEC 62304 Medical Device Software-Software Life Cycle Processes[S]. Geneva: International Electrotechnical Commission, 2006.
[24] TC 62/SC 62D-Electromedical Equipment. IEC 60601-2-25 Medical Electrical Equipment-Part 2-25: Particular Requirements for the Basic Safety and Essential Performance of Electrocardiographs[S]. Geneva: International Electrotechnical Commission, 2011.