Изследователи: ChatGPT лесно генерира насилие и сексуално съдържание

Най-новата публична версия на ChatGPT отново е обект на критики, след като изследователи установиха, че моделът може да бъде манипулиран да създава графични сцени на насилие или сексуално съдържание. Това става възможно дори с минимални усилия от страна на потребителя, което повдига сериозни въпроси относно ефективността на предпазните механизми на изкуствения интелект.

Пробив в сигурността

Изследването е проведено от специализирана компания за киберсигурност на изображения, генерирани от ИИ. Експертите демонстрираха, че чрез специфични инструкции (промптове), филтрите на чатбота могат да бъдат заобиколени, позволявайки визуализиране на сцени, които нарушават политиките за безопасност на компанията разработчик OpenAI.

Реакция и последствия

Този пробив поставя под въпрос способността на големите езикови модели да се справят с етичните предизвикателства в реално време. Въпреки че технологичният гигант регулярно актуализира своите защити, инцидентът показва, че „jailbreak“ техниките остават значима заплаха за сигурността на съвременните AI инструменти.