will arnett - 検索 News

ニュース

ファインチューニングによってAIモデルが突然変貌し、無害なプロンプトにも有害な内容で応答するようになる──。オープンAIは、こうした「創発的ミスアラインメント」と呼ばれる現象を解明した。わずかな追加訓練で修正が可能だという。

一部の結果でアクセス不可の可能性があるため、非表示になっています。