1 日on MSN
LLMに膨大な量の問題を解かせる→混乱し有害な内容をポロポロ解答 ...
英オックスフォード大学などに所属する国際研究チームが発表した論文「Chain-of-Thought Hijacking」は、有害な指示の前に無害な長い推論を付加することで、AIの安全機構を巧妙に回避するジェイルブレイク攻撃を提案した研究報告だ。
7 日on MSN
大規模言語モデルへの攻撃において「詩」が有効であるとの研究結果
詩は文芸の一種であり、言葉の表面的な意味だけでなく語感やリズム、美的性質などを用いてさまざまな表現を行います。時には難解でわかりにくいこともある詩を使うことで、大規模言語モデルへの攻撃が成功しやすくなるとの研究結果が、プレプリントサーバーのarXiv ...
ChatGPTには、潜在的に違法なコンテンツの生成を遮断する制限が設けられている。例えば、「PCに侵入してデータを盗むためのプログラム」や「フィッシングメールの文面」を書くように依頼しても、そのようなコンテンツは違法・非倫理的・有害であると ...
AC/DCは地元オーストラリアの公演で34年ぶりに「Jailbreak」をライヴ演奏しています。ファン撮影の映像あり。海外のセットリストサイトSetList.fmによると、この曲のライヴ演奏は1991年11月16日ニュージーランド公演以来です。 『Power Up』と題したツアーを行うAC/DCは地元オーストラリアに帰国し、11月12日にメルボルンのメルボルン・クリケット・グラウンドで8万人のファ ...
Futurism on MSN
Scientists Discover “Universal” Jailbreak for Nearly Every AI, and the Way It Works ...
A simple trick involving poetry is enough to jailbreak the tech industry's leading AI models, researchers found.
One of two inmates who escaped a French prison using bed sheets has been apprehended. The search continues for the second ...
イスラエルの研究チームが、主要なAIチャットボットが「脱獄(ジェイルブレイク)」と呼ばれる手口で、安全制御を回避され、違法で有害な情報を出力してしまう可能性があることを示した。 ChatGPTのような生成AIには、ユーザーの指示に対して有害な回答 ...
ChatGPTやその他のGPTツールは、違法・有害・論争的な話題に対する応答を制限するセーフガードが組み込まれている。しかし、アンダーグラウンドコミュニティでは、この制限を回避するジェイルブレイク版ChatGPTを作成・発見・共有するグループが存在する ...
Jailbreaking gave my old Kindle new life with faster menus, local games, and the freedom to customize everything.
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する