如果數據科學家、人工智慧工程師和網絡安全專業人士在開發過程中未能保護其人工智慧系統,將面臨巨大的財務、聲譽和運營風險。他們該如何保障組織安全並減輕潛在的負面影響呢?
網絡安全專業人士必須解決的常見威脅
數據集污染是一個關鍵的安全挑戰,通常難以被察覺。如果攻擊者即使只污染幾個數據來源,以錯誤或無關的資訊,將可能在訓練過程中削弱人工智慧模型的效能。
提示注入是另一個在人工智慧系統開發中顯著的威脅。此情況下,攻擊者劫持模型的輸出,以引入意想不到的行為。研究顯示,這類攻擊的成功率高達97.2%,使惡意行為者得以利用模型訪問訓練數據並觸發未經授權的行動。
提示提取是提示注入的一種特別具破壞性的變種。攻擊者操控人工智慧系統,迫使其透露底層規則,可能獲得敏感數據。
在模型反演過程中,攻擊者能夠逆向工程模型輸出,以提取其訓練數據集,危及機密或私人資訊的暴露,這種泄露可能嚴重損害組織的聲譽。
受損的人工智慧系統的影響
當一個人工智慧系統遭受攻擊時,整個組織的安全框架都會受到威脅。認識到這種風險,大約60%的企業已積極採取措施以降低與人工智慧相關的網絡安全威脅。
成功的攻擊可能會導致不良後果,包括連接組件的妥協和未經授權訪問存儲系統。最終目標往往涉及竊取敏感信息、知識產權或來自訓練數據集的個人身份信息。
被竊數據的影響因行業而異,但可能導致法律行動、監管審查和公眾反彈,財務損失則是可能的結果。
開發前的安全考量
網絡安全專業人士在設計人工智慧系統時,應考慮幾個關鍵的安全因素。數據集選擇至關重要,因為污染和篡改攻擊可能在模型發展早期就造成深遠影響。
即使使用預訓練模型,確保數據集的完整性也十分重要,因為原始數據集可能存在漏洞。依賴第三方模型開發者需謹慎檢查其可靠性,因為疏忽或惡意意圖可能在無監督的情況下引入漏洞。
人工智慧系統開發的關鍵安全步驟
數據科學家必須不斷更新算法參數以納入新信息;敷衍了事可能帶來安全缺陷。人工智慧的黑箱特性使得識別妥協指標(IOCs)更加困難,這使得檢測數據集污染或篡改變得具有挑戰性。
儘管大多數攻擊來自外部威脅行為者,但內部人為失誤佔據了95%的網絡安全事件。對於在內部或外包的人工智慧系統開發,對實體和數字威脅的警惕同樣至關重要。
開發不充分的後果
無法在人工智慧系統部署前識別妥協指標,將導致持續且不可解釋的網絡威脅。工程師必須評估不合格開發的潛在安全影響,因為被忽視的漏洞可能導致意外的模型行為和數據泄漏,最終降低組織的安全狀況。
保護開發過程中人工智慧系統的策略
網絡安全專業人士、數據科學家和人工智慧工程師之間的合作對於在開發過程中盡量減少漏洞至關重要。有效的信息共享可以加強威脅緩解工作並促進潛在問題的及早發現。
實施限制作為額外的保護層,防止系統被惡意使用。此外,模型可解釋性有助於識別妥協指標,便於更快地應對數據集污染或提示注入的企圖。
定期對人工智慧系統進行審核並與網絡安全專家合作是關鍵的最佳實踐。徹底測試可以在漏洞擴大之前識別並消除問題。
為人工智慧系統建立基準,允許在發生妥協時有回溯選項,這提供了在無需漫長事件響應過程的情況下保護模型的手段。
人工智慧系統開發的基本指導方針
多個監管機構已發布有關安全人工智慧開發的指導文件。值得注意的是,美國、加拿大和英國與多個國家的機構,包括澳大利亞、以色列和韓國,合作編寫了一份20頁的人工智慧安全和負責任開發文檔。
網絡安全和基礎設施安全局(CISA)和國家網絡安全中心(NCSC)等機構為此指導作出貢獻,旨在降低開發階段的風險,並概述最佳實踐和開發者的責任。
威脅緩解的主動措施
網絡安全專業人士必須在開發過程中主動監控人工智慧系統中的潛在漏洞。主動措施提升了有效應對威脅和實現良好商業結果的可能性。