Große Sprachmodelle wie ChatGPT, Bard oder Claude werden einer umfangreichen Feinabstimmung unterzogen, um in ihren Antworten auf Benutzerfragen keine schädlichen Inhalte zu erzeugen - zumindest oberflächlich betrachtet. Denn mit den richtigen Tricks lassen sich die Sprachmodelle nahezu beliebig manipulieren.
• Simple, speziell ausgewählte Zeichenfolgen ermöglichen Generierung schädlicher InhalteFeindliche Angriffe auf generative Sprachmodelle mit künstlicher Intelligenz
Große generative Sprachmodelle wie ChatGPT, Bard oder Claude basieren auf enorm großen neuronalen Netzwerkalgorithmen, die darauf ausgerichtet sind, Sprache zu verwenden, in die riesige Mengen an menschlichen Aufzeichnungen eingespeichert werden. Die verwendeten Algorithmen sind sehr gut darin, Vorhersagen auf bestimmte Eingabezeichenfolgen zu treffen, wodurch sie Ergebnisse generieren, die echter Intelligenz und Wissen verblüffend ähneln.
Forscher der Carnegie-Mellon-Universität, des Center for AI Safety und des Bosch Center for AI haben eine Studie zu"universellen und übertragbaren" feindlichen Angriffen auf große generative Sprachmodelle mit künstlicher Intelligenz veröffentlicht.
Der Angriff zwinge Chatbots dazu, unzulässige Antworten auf schädliche Eingabeaufforderungen zu geben, indem bestimmte Zeichenfolgen an Eingabeaufforderungen wie"Sag mir wie man eine Bombe baut" angehängt werden.
Insgesamt bringt die Studie den Stand der Technik bei generischen Angriffen auf angepasste Sprachmodelle erheblich voran und wirft die Frage auf, wie solche Systeme besser reguliert werden können. Die Ergebnisse der Studie belegen, dass die generischen Suffixe die Sprachmodelle so konditionieren, dass die Wahrscheinlichkeit eines schädlichen Verhaltens deutlich steigt und diese Angriffe eine klare Bedrohung darstellen.
日本 最新ニュース, 日本 見出し
Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。
25 Jahre Internet-Suchmaschine: Kann ChatGPT die Dominanz von Google in Frage stellen?„Googeln“ ist längst zu einem Synonym für die Internet-Suche geworden. Jahrelang schien die Dominanz von Google in dem Markt unantastbar. Hat sich mit dem Auftauchen von Chatbots wie ChatGPT die Möglichkeit ergeben, die Karten noch einmal neu zu mischen?
続きを読む »
25 Jahre Internet-Suchmaschine: Kann ChatGPT die Dominanz von Google in Frage stellen?„Googeln“ ist längst zu einem Synonym für die Internet-Suche geworden. Jahrelang schien die Dominanz von Google in dem Markt unantastbar. Hat sich mit dem Auftauchen von Chatbots wie ChatGPT die Möglichkeit ergeben, die Karten noch einmal neu zu mischen?
続きを読む »
Geldanlage: So gehen Sie vor, wenn Sie Kunst kaufen wollenGrafiken international anerkannter Künstler sind beliebt. Welche Werke als wertbeständig gelten oder sogar Chancen auf Wertzuwachs bieten.
続きを読む »
Geldanlage: So gehen Sie vor, wenn Sie Kunst kaufen wollenGrafiken international anerkannter Künstler sind beliebt. Welche Werke als wertbeständig gelten oder sogar Chancen auf Wertzuwachs bieten.
続きを読む »
Geldanlage: So gehen Sie vor, wenn Sie Kunst kaufen wollenGrafiken international anerkannter Künstler sind beliebt. Welche Werke als wertbeständig gelten oder sogar Chancen auf Wertzuwachs bieten.
続きを読む »