Page 63 - 清流雙月刊 NO.50
P. 63

AI 世代
















































          提示注入是指用戶嘗試注入惡意的內容,促使 AI                                Lakera 開發的「甘道夫挑戰」主要在測試用戶提示注
          輸出非預期或不被允許的答案。(Source: DAIR.AI,                        入的技巧和內容,並藉此觀察 AI 系統 ChatGPT 的防禦
          https://www.promptingguide.ai/zh/risks/adversarial)    能力。(Source: Lakera, https://gandalf.lakera.ai)



                 或不被允許的答案,例如輸出用戶的                               四、洩漏機敏資料(Sensitive Information

                 密碼或是提供犯罪指引。                                        Disclosure):LLM 可能無意間洩漏其
                                                                    他使用者的機敏資料。
            二、不安全輸出管控(Insecure Output
                 Handling):不審查輸出可能導致洩                                以 Prompt Injection 為例,它已經

                 漏後門,或其他種類的資安攻擊,例如                              被資安組織 OWASP 列為 LLM 的首要威
                 XSS(跨網站指令碼)、CSRF(跨站請                           脅。相較於以往的資安攻擊,提示注入

                 求偽造)、SSRF(伺服器端請求偽造)、                           能以一般語言輸入,技術門檻相較非常
                 提權攻擊或是遠端執行程式等。                                 低,因此很容易實現。由人工智慧安全

                                                                防護公司 Lakera 開發的「甘道夫挑戰」
            三、訓練資料污染(Training Data Poison-
                                                                                               5
                                                                即是一個簡易的測試網站, 也歡迎讀者
                 ing):可能導致引進漏洞、降低效能
                                                                親自體驗。
                 或倫理議題。



            5    Gandalf, https://gandalf.lakera.ai.


                                                                                                 No.50 MAR. 2024  61
   58   59   60   61   62   63   64   65   66   67   68