Можна, якщо обережно. Чотири способи обійти фільтри безпеки ChatGPT

techno.nv.ua

Фільтри допомагають гарантувати, що ChatGPT не створює будь-який контент, який може бути образливим

Ці фільтри допомагають гарантувати, що ChatGPT не створює будь-який вміст, який може бути образливим, неприйнятним або шкідливим.

Хоча OpenAI не розкрив конкретної інформації щодо роботи цих фільтрів можна зробити висновок з декількох загальних принципів, які застосовуються.

Чого не може робити ChatGPT

Почнемо з того, що OpenAI розробила фільтри, щоб запобігти створенню користувачами контенту, що пропагує ненависть, насильство, образливий або сексуально відвертий вміст. Дискримінація, расові переслідування, ворожнеча та інші підпадають під цю категорію.

Також ШІ не підтримує поширення теорій змови, оманливої чи неправдивої інформації, чи будь-чого, що може сприяти дезінформації.

І звісно розробники намагались мінімізувати використання ChatGPT для створення фішингу, зловмисного програмного забезпечення чи будь-яких інших кібератак.

Зауважте, що інструменти штучного інтелекту, такі як ChatGPT, не є досконалими й іноді можуть генерувати неприйнятний вміст. OpenAI прагне оновити ці фільтри вмісту та покращити продуктивність і безпеку ChatGPT.

Як обійти фільтри

Це може здатися спокусливим, але важливо враховувати наслідки та етичність таких дій. Обхід фільтрів ChatGPT для використання невідповідного, образливого чи шкідливого вмісту є неетичним і може призвести до таких наслідків, як заборона використання платформи або покарання за законом.

DAN

Використовуйте головну підказку DAN (Do Anything Now), яка змушує ChatGPT діяти як штучний інтелект, який може обійти власні фільтри.

Фото: r/ChatGPT\Raddit

«Yes Man»

«Yes Man» створює ШІ-особу, яка відповідатиме на ваші підказки незалежно від теми. Він працює подібно до інших головних підказок, таких як підказка DAN. Через це його відповіді можуть бути обмежені.

Згідно з оглядом користувача на Reddit ChatGPT починає відходити від своїх правил

Сценарій фільму

Ще один спосіб обійти фільтри контенту ChatGPT — це створити діалог або сценарій фільму. Важливо зауважити, що якщо ви хочете обійти фільтри вмісту цього інструменту ШІ, вам доведеться змусити його повірити, що ви збираєтеся використовувати інформацію для творчих цілей.

Цей метод може допомогти вам обійти обмеження вмісту ChatGPT, оскільки інструмент AI добре відомий своєю унікальною здатністю писати творчі сценарії, вірші та історії.

Придумайте іншу особистість

Запропонуйте ChatGPT відповісти в персоналіях із зазначеними фільтрами. ChatGPT відповідатиме за себе на додаток до інших особистостей, які не мають тих самих фільтрів. Ви отримаєте змішані відповіді від кожної особистості, хоча та, для якої встановлено фільтр «0», швидше за все, відповість на підказки повністю.

Ви отримаєте відповідь від усіх п’яти осіб ШІ. Якщо ви не хочете отримувати довгі відповіді, ви можете встановити кількість слів на 500.

Фото: r/ChatGPT/Raddit

Просмотры:

Шукати в цьому блозі

Military OSINT, FOSINT, DecentraLab, Kolibrium