Palo Alto Networks: DeepSeek erg vatbaar is voor jailbreaking
Unit 42, het onderzoeksteam van Palo Alto Networks, heeft onderzoek gepubliceerd waaruit blijkt dat DeepSeek erg vatbaar is voor jailbreaking en met weinig tot geen gespecialiseerde kennis of expertise schadelijke content kan genereren.
Onderzoekers van Unit 42 hebben recentelijk twee nieuwe en effectieve jailbreaktechnieken ontdekt: Deceptive Delight en Bad Likert Judge.
Gezien hun succes op het gebied van andere LLM's, testte Unit 42 deze twee jailbreaks en een andere multi-stage jailbreaktechniek genaamd Crescendo, op DeepSeek-modellen.
De belangrijkste bevindingen uit het onderzoek:
- Hoge succespercentages bij bypass- en jailbreaktechnieken, wat de potentiële risico’s benadrukt van deze nieuwe aanvalsmethoden, die door kwaadwillende actoren kunnen worden misbruikt.
- Jailbreak-methoden kunnen expliciete instructies bieden voor kwaadaardige activiteiten en deze processen aanzienlijk versnellen.
- Kwaadaardige toepassingen variëren van het ontwikkelen van keyloggers en het stelen en exfiltreren van gegevens tot het verstrekken van instructies voor het maken van brandbommen.