商傳媒|責任編輯/綜合外電報導
為提升大型語言模型(LLM)的智慧化程度與使用者體驗,人工智慧(AI)聊天機器人需持續消化數據進行訓練。然而,許多AI公司在未經資料擁有者同意的情況下,便逕行爬梳網頁內容,將其納入大型語言模型的資料庫中。此舉引發部分內容創作者,亦即智慧財產權持有者的反彈,他們正運用一種稱為「AI陷阱池」(tarpits)的工具進行反制。
「AI毒害」(AI poisoning)的目標是破壞AI聊天機器人背後的大型語言模型,使其產生錯誤、誤導性或荒謬的輸出。這種破壞是透過在模型訓練過程中,誘騙其吸收不正確的資料來達成,訓練過程通常涉及爬梳網際網路上的所有可能網站和影像。
根據《Fast Company》報導,有別於 Nightshade 這類針對影像生成式AI模型的「毒害」工具,Nightshade 會在影像中加入肉眼不可見、但對LLM爬蟲可見的像素層,使AI將藝術作品誤判為另一種風格,進而阻止其模仿藝術家實際風格。AI陷阱池則是一種專為文本型大型語言模型設計的AI毒害工具,其運作方式是欺騙網路爬蟲,使其吸取無用的垃圾數據。
當大型語言模型利用這些垃圾數據生成文字內容時,其輸出的結果將會不正確,大幅降低AI回應的品質。最終,這可能導致使用者對AI聊天機器人失去信任,進而減少使用。







