🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ

ΠšΡƒΡ€Ρ - Π‘TF-Ρ‡Π΅ΠΌΠΏΠΈΠΎΠ½Π°Ρ‚ - ΠΏΠΎ Π·Π°Ρ‰ΠΈΡ‚Π΅ ИИ-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ.
ΠšΠΎΡ€ΠΎΡ‚ΠΊΠ°Ρ тСория -> Атака -> Π Π°Π·Π±ΠΎΡ€ -> Π—Π°Ρ‰ΠΈΡ‚Π°
Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊΠ°ΠΊ ΠΈ ΠΎΡ‚ Ρ‡Π΅Π³ΠΎ Π·Π°Ρ‰ΠΈΡ‰Π°Ρ‚ΡŒ, Π½Π°Π΄ΠΎ сначала ΠΏΠΎΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ ΡΠ»ΠΎΠΌΠ°Ρ‚ΡŒ ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, Ρ‡Π΅ΠΌΡƒ ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ посвящСна основная Ρ‡Π°ΡΡ‚ΡŒ курса.
НСзависимо ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ Π³Π΄Π΅ ΠΈ ΠΊΠ°ΠΊ Π²Ρ‹ создаётС своС ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅: Π±Π΅Π· ΠΊΠΎΠ΄Π° - с n8n, Π²Π°ΠΉΠ±ΠΊΠΎΠ΄ΠΈΠ½Π³ΠΎΠΌ ΠΈΠ»ΠΈ ΠΏΠΈΡˆΠΈΡ‚Π΅β€¦
ΠΠ°Ρ‡Π°Π»ΡŒΠ½Ρ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ
4-5 часов Π² нСдСлю

Π§Π΅ΠΌΡƒ Π²Ρ‹ Π½Π°ΡƒΡ‡ΠΈΡ‚Π΅ΡΡŒ

  • ΠΠ°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ уязвимости Π² LLM-прилоТСниях Ρ‡Π΅Ρ€Π΅Π· prompt injection - ΠΎΠ±Ρ…ΠΎΠ΄ инструкций, ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ систСмных ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ², манипуляция Π²Ρ‹Π²ΠΎΠ΄ΠΎΠΌ.
  • ΠžΠ±Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ safety-Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΡƒ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ‡Π΅Ρ€Π΅Π· jailbreak-Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ - role-play, encoding, payload splitting, multi-turn Π°Ρ‚Π°ΠΊΠΈ.
  • ΠŸΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ indirect prompt injection - Π²Π½Π΅Π΄Ρ€ΡΡ‚ΡŒ врСдоносныС инструкции Ρ‡Π΅Ρ€Π΅Π· Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Ρ‹, Π²Π΅Π±-страницы ΠΈ email.
  • ΠΡ‚Π°ΠΊΠΎΠ²Π°Ρ‚ΡŒ AI-Π°Π³Π΅Π½Ρ‚ΠΎΠ² ΠΈ RAG-систСмы - ΠΏΠΎΠ΄ΠΌΠ΅Π½Π° инструмСнтов, ΠΎΡ‚Ρ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π±Π°Π· Π·Π½Π°Π½ΠΈΠΉ, манипуляция Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π²Ρ‹Π·ΠΎΠ²ΠΎΠ².
  • ΠžΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π°Ρ‚Π°ΠΊ - ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ASR, LLM-as-judge.
  • ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π·Π°Ρ‰ΠΈΡ‚Ρƒ - hardening систСмных ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ², guardrails, input/output Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ.
  • ΠšΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ - ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ‚Π½Ρ‹Π΅ Π°Ρ‚Π°ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ловятся ΠΎΠ΄ΠΈΠ½ΠΎΡ‡Π½Ρ‹ΠΌΠΈ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°ΠΌΠΈ.

О курсС

πŸ”“ Π§Ρ‚ΠΎ это Π·Π° курс?

НСльзя ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π½Π°Π΄Ρ‘ΠΆΠ½ΡƒΡŽ Π·Π°Ρ‰ΠΈΡ‚Ρƒ, Π½Π΅ понимая, ΠΊΠ°ΠΊ ΠΈΠΌΠ΅Π½Π½ΠΎ Π΅Ρ‘ Π±ΡƒΠ΄ΡƒΡ‚ Π»ΠΎΠΌΠ°Ρ‚ΡŒ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ сначала Ρ‚Ρ‹ ΡƒΡ‡ΠΈΡˆΡŒΡΡ Π°Ρ‚Π°ΠΊΠΎΠ²Π°Ρ‚ΡŒ LLM-прилоТСния - Ρ‡Π°Ρ‚-Π±ΠΎΡ‚ΠΎΠ², ΠΌΠΎΠ΄Π΅Ρ€Π°Ρ‚ΠΎΡ€ΠΎΠ², ассистСнтов, RAG-систСмы - ΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΡ‚ΠΎΠΌ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€ΡƒΠ΅ΡˆΡŒ Π·Π°Ρ‰ΠΈΡ‚Ρƒ с ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ΠΌ Ρ‚ΠΎΠ³ΠΎ, ΠΎΡ‚ Ρ‡Π΅Π³ΠΎ ΠΎΠ½Π° Π΄ΠΎΠ»ΠΆΠ½Π° ΡΠΏΠ°ΡΠ°Ρ‚ΡŒ. Никакого ΠΊΠΎΠ΄Π°: всё Ρ‡Π΅Ρ€Π΅Π· Ρ‡Π°Ρ‚, Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ².

ΠšΡƒΡ€Ρ построСн Π²ΠΎΠΊΡ€ΡƒΠ³ CTF-Π·Π°Π΄Π°Π½ΠΈΠΉ (Capture The Flag): Ρ‚Π΅Π±Π΅ Π΄Π°ΡŽΡ‚ Π±ΠΎΡ‚Π° с Π·Π°Ρ‰ΠΈΡ‚ΠΎΠΉ, твоя Π·Π°Π΄Π°Ρ‡Π° - ΡΠ»ΠΎΠΌΠ°Ρ‚ΡŒ Π΅Ρ‘ ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Ρ„Π»Π°Π³. Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ растёт ΠΎΡ‚ Β«Π²Π²Π΅Π΄ΠΈ волшСбноС слово» Π΄ΠΎ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ‚Π½Ρ‹Ρ… Π°Ρ‚Π°ΠΊ, Π³Π΄Π΅ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΎΠ±ΠΎΠΉΡ‚ΠΈ keyword-Ρ„ΠΈΠ»ΡŒΡ‚Ρ€, whitelist доступа ΠΈ Ρ€ΠΎΠ»Π΅Π²ΡƒΡŽ ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡŽ.

🎯 Π—Π°Ρ‡Π΅ΠΌ это Π½ΡƒΠΆΠ½ΠΎ?

LLM сСгодня встроСны Π² ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ ΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Ρ‹ людСй. Prompt injection - ΡƒΡΠ·Π²ΠΈΠΌΠΎΡΡ‚ΡŒ β„–1 ΠΏΠΎ классификации OWASP Top 10 for LLMs. Компании Π½Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ red team-спСциалистов, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠ΅ Π΄Ρ‹Ρ€Ρ‹ Π΄ΠΎ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ это сдСлаСт ΠΊΡ‚ΠΎ-Ρ‚ΠΎ Π΄Ρ€ΡƒΠ³ΠΎΠΉ. Π­Ρ‚ΠΎΡ‚ курс Π΄Π°Ρ‘Ρ‚ Ρ‚Π΅ самыС Π½Π°Π²Ρ‹ΠΊΠΈ.

πŸ“š Π§Ρ‚ΠΎ Π²Π½ΡƒΡ‚Ρ€ΠΈ?

ΠšΡƒΡ€Ρ ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ Ρ‚Π°ΠΊΡΠΎΠ½ΠΎΠΌΠΈΡŽ ΠΈΠ· 90+ Ρ‚Π΅Ρ…Π½ΠΈΠΊ Π°Ρ‚Π°ΠΊ Π½Π° LLM, сгруппированных Π² ΠΌΠΎΠ΄ΡƒΠ»ΠΈ:

  • Prompt InjectionΒ -Β instruction override, system prompt extraction, delimiter attacks, output manipulation.
  • JailbreaksΒ -Β role-play, hypothetical framing, encoding, payload splitting, multi-turn Π°Ρ‚Π°ΠΊΠΈ (Crescendo).
  • Indirect Prompt Injection β€” скрытыС инструкции Π² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ…, Π²Π΅Π±-страницах, email. Атака Π½Π΅ Π½Π° модСль Π½Π°ΠΏΡ€ΡΠΌΡƒΡŽ, Π° Ρ‡Π΅Ρ€Π΅Π· ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠ½Π° ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚.
  • Атаки Π½Π° Π°Π³Π΅Π½Ρ‚ΠΎΠ² ΠΈ RAGΒ -Β tool abuse, knowledge base poisoning, memory attacks, multi-agent injection.
  • АвтоматизированныС Π°Ρ‚Π°ΠΊΠΈΒ -Β PAIR, TAP, GCG -Β ΠΊΠ°ΠΊ автоматизация мСняСт Π»Π°Π½Π΄ΡˆΠ°Ρ„Ρ‚ ΡƒΠ³Ρ€ΠΎΠ·. Π‘Π΅Π· ΠΊΠΎΠ΄Π°, Π½ΠΎ с ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ΠΌ attack loop.
  • Π—Π°Ρ‰ΠΈΡ‚Π°Β -Β Π΅ΡΡ‚ΡŒ defense-Π±Π»ΠΎΠΊ: ΠΎΡ‚ hardening ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ² Π΄ΠΎ проСктирования guardrails.

🏒 Π‘ΠΊΠ²ΠΎΠ·Π½ΠΎΠΉ Π½Π°Ρ€Ρ€Π°Ρ‚ΠΈΠ²

Π’Π΅ΡΡŒ курс - это сСрия ΠΊΠΎΠ½Ρ‚Ρ€Π°ΠΊΡ‚ΠΎΠ² с AI-компаниями. Π’Ρ‹ - red team спСциалист, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Π½Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ для ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ бСзопасности. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ - Π½ΠΎΠ²Ρ‹ΠΉ ΠΊΠ»ΠΈΠ΅Π½Ρ‚, Π½ΠΎΠ²Ρ‹Π΅ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Ρ‹, Π½Π°Ρ€Π°ΡΡ‚Π°ΡŽΡ‰Π°Ρ ΡΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ.

⚠️ ΠšΡƒΡ€Ρ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ развиваСтся. НовыС ΠΌΠΎΠ΄ΡƒΠ»ΠΈ ΠΈ задания Π΄ΠΎΠ±Π°Π²Π»ΡΡŽΡ‚ΡΡ рСгулярно. Π—Π° обновлСниями ΠΌΠΎΠΆΠ½ΠΎ ΡΠ»Π΅Π΄ΠΈΡ‚ΡŒ Π² TG-ΠΊΠ°Π½Π°Π»Π΅ курса.

Для ΠΊΠΎΠ³ΠΎ этот курс

ΠšΡƒΡ€Ρ ΠΏΠΎΠ΄ΠΎΠΉΠ΄Ρ‘Ρ‚ Ρ‚Π΅ΠΌ, ΠΊΡ‚ΠΎ Ρ…ΠΎΡ‡Π΅Ρ‚ Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚ΡŒΡΡ Π² бСзопасности AI-систСм Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅, Π° Π½Π΅ ΠΏΠΎ слайдам. НС Π½ΡƒΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ программистом - достаточно ΡƒΠΌΠ΅Ρ‚ΡŒ Π΄ΡƒΠΌΠ°Ρ‚ΡŒ ΠΊΠ°ΠΊ Π°Ρ‚Π°ΠΊΡƒΡŽΡ‰ΠΈΠΉ, Π° ΠΈΠ½Ρ‚ΡƒΠΈΡ†ΠΈΡŽ ΠΈ Π½Π°ΡΠΌΠΎΡ‚Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΈΠ²Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ курса. β€” БпСциалисты ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ бСзопасности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят ΠΏΠΎΠ½ΡΡ‚ΡŒ Π½ΠΎΠ²Ρ‹ΠΉ класс ΡƒΠ³Ρ€ΠΎΠ·, связанных с LLM. β€” ΠŸΡ€ΠΎΠ΄Π°ΠΊΡ‚-ΠΌΠ΅Π½Π΅Π΄ΠΆΠ΅Ρ€Ρ‹ ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ AI-ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят Π΄Π΅Π»Π°Ρ‚ΡŒ свои систСмы устойчивСС ΠΊ Π°Ρ‚Π°ΠΊΠ°ΠΌ. β€” QA ΠΈ тСстировщики, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ adversarial testing Π² свой арсСнал. β€” ВсС, ΠΊΡ‚ΠΎ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ChatGPT, Claude ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ LLM ΠΈ Ρ…ΠΎΡ‡Π΅Ρ‚ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ, ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ Π»ΠΎΠΌΠ°ΡŽΡ‚ΡΡ. β€” Π‘Ρ‚ΡƒΠ΄Π΅Π½Ρ‚Ρ‹ ΠΈ исслСдоватСли Π² области AI safety ΠΈ alignment, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят быстро ΠΏΠΎΠ³Ρ€ΡƒΠ·ΠΈΡ‚ΡŒΡΡ Π² Π½ΠΎΠ²ΡƒΡŽ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ.

ΠΠ°Ρ‡Π°Π»ΡŒΠ½Ρ‹Π΅ трСбования

Π‘Π°Π·ΠΎΠ²ΠΎΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ LLM (большая языковая модСль) - Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ «знаю, Ρ‡Ρ‚ΠΎ это Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ, которая Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ тСкст».

ΠžΠΏΡ‹Ρ‚ использования любой LLM (ChatGPT, Claude, Gemini ΠΈ Ρ‚.ΠΏ.) - Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ΠΏΡ€ΠΎΠΌΠΏΡ‚ ΠΈ ΠΊΠ°ΠΊ устроСн Π΄ΠΈΠ°Π»ΠΎΠ³ с модСлью.

Код ΠΏΠΈΡΠ°Ρ‚ΡŒ Π½Π΅ Π½ΡƒΠΆΠ½ΠΎ. Π’ΠΎΠΎΠ±Ρ‰Π΅. ВсС задания Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· Ρ‡Π°Ρ‚, Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ Ρ„Π°ΠΉΠ»ΠΎΠ².

Π—Π½Π°Π½ΠΈΠ΅ английского Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ чтСния тСхничСских Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠ² ΠΈΠ»ΠΈ использования ΠΎΠ½Π»Π°ΠΉΠ½-ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Ρ‡ΠΈΠΊΠ° - Ρ‡Π°ΡΡ‚ΡŒ Π°Ρ‚Π°ΠΊ ΠΈ Ρ‚Π΅Ρ…Π½ΠΈΠΊ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ англоязычныС ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹.

Наши ΠΏΡ€Π΅ΠΏΠΎΠ΄Π°Π²Π°Ρ‚Π΅Π»ΠΈ

Как ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠšΡƒΡ€Ρ состоит ΠΈΠ· ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ посвящён ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠΌΡƒ классу Π°Ρ‚Π°ΠΊ. Π’Π½ΡƒΡ‚Ρ€ΠΈ модуля - тСория, ΠΊΠ²ΠΈΠ·Ρ‹ ΠΈ CTF-задания.

ВСория — ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠ΅ Π±Π»ΠΎΠΊΠΈ с объяснСниСм Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ ΠΈ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ. Π‘Π΅Π· Π²ΠΎΠ΄Ρ‹ ΠΈ Π°ΠΊΠ°Π΄Π΅ΠΌΠΈΠ·ΠΌΠ°, Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π½ΡƒΠΆΠ½ΠΎ для ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ задания.

CTF-задания - ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹Π΅ упраТнСния с автоматичСской ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΎΠΉ. Π’Π΅Π±Π΅ Π΄Π°ΡŽΡ‚ Π±ΠΎΡ‚Π° с Π·Π°Ρ‰ΠΈΡ‚ΠΎΠΉ - Π»ΠΎΠΌΠ°ΠΉ Π΅Π³ΠΎ. Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΡ‚ 1 Π΄ΠΎ 10: ΠΎΡ‚ простого Β«ignore previous instructionsΒ» Π΄ΠΎ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ‚Π½Ρ‹Ρ… Π°Ρ‚Π°ΠΊ ΠΈΠ· 5+ Ρ‚Π΅Ρ…Π½ΠΈΠΊ. Π•ΡΡ‚ΡŒ систСма подсказок, ΠΎΠ½ΠΈ ΠΎΡ‚ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‚ΡΡ послС Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π½Π΅ΡƒΠ΄Π°Ρ‡Π½Ρ‹Ρ… ΠΏΠΎΠΏΡ‹Ρ‚ΠΎΠΊ.

ΠšΠ²ΠΈΠ·Ρ‹Β - ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° понимания Ρ‚Π΅ΠΎΡ€ΠΈΠΈ. Π Π°Π·Π±ΠΎΡ€ Ρ‚ΠΈΠΏΠΈΡ‡Π½Ρ‹Ρ… ошибок ΠΈ edge cases.

Defense-Π±Π»ΠΎΠΊΠΈΒ β€” Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… модулях Ρ‚Ρ‹ ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π°Π΅ΡˆΡŒΡΡ Π½Π° сторону Π·Π°Ρ‰ΠΈΡ‚Π½ΠΈΠΊΠ°. ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€ΡƒΠ΅ΡˆΡŒ систСмныС ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹ ΠΈ guardrails, Π° ΠΏΠΎΡ‚ΠΎΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΠ΅ΡˆΡŒ, Π²Ρ‹Π΄Π΅Ρ€ΠΆΠ°Ρ‚ Π»ΠΈ ΠΎΠ½ΠΈ Π°Ρ‚Π°ΠΊΡƒ.

Кода Π½Π΅Ρ‚. Π’Π΅Ρ€ΠΌΠΈΠ½Π°Π»Π° Π½Π΅Ρ‚. ВсС задания Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ прямо Π² Π±Ρ€Π°ΡƒΠ·Π΅Ρ€Π΅.

ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° курса

Π·Π°Π³Ρ€ΡƒΠΆΠ°Π΅ΠΌ...

Π§Ρ‚ΠΎ Π²Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚Π΅

  • ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π½Π°Π²Ρ‹ΠΊΠΈ red teaming LLM-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ - вострСбованная спСциализация Π² AI Security.
  • ПониманиС таксономии Π°Ρ‚Π°ΠΊ Π½Π° LLM - prompt injection, jailbreaks, indirect injection, agent attacks.
  • ΠžΠΏΡ‹Ρ‚ проСктирования Π·Π°Ρ‰ΠΈΡ‚Ρ‹: hardening ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ², guardrails, input/output Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ.
  • Π£ΠΌΠ΅Π½ΠΈΠ΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡ‚ΡŒ AI-ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ² - ΠΊΠ°ΠΊ своих, Ρ‚Π°ΠΊ ΠΈ сторонних.
  • ΠΠ°ΡΠΌΠΎΡ‚Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΈ интуиция Π² области бСзопасности ИИ-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ.
Price: БСсплатно

РасскаТитС ΠΎ курсС Π΄Ρ€ΡƒΠ·ΡŒΡΠΌ

Price: БСсплатно