ブログ記事37件
Spawningで4月20日にオプトアウトを申請した画像が本日全て承認されました。思ったより時間がかかりました。申し込んでも人手による確認作業があり、本人の権利が確認されないと認められません。私の場合は掲載されている商業コミックと公式に公開しているイラストですので問題ありません。以下確認の仕方です。Spawningのアイコンをクリック、ダッシュボードを開きます。DoNotTrainListが出ます。右下の青いマークが承認済みです(未承認はグレー)。11日に申請した
ご紹介しているSpawningのAPIが最初のDoNotTrainレジストリを通したオプトアウトをHuggingFaceとStabilityAIに伝えたのが2023年5月30日だそうです。公式ブログにありました。私がオプトアウト要請を始めたのは昨年6月で、間に合いませんでした。最新の製品に反映されているかどうか不明です。公式ブログ、SNSがありますので最新情報をチェックしてください。ai.txt:Anewwayforwebsitestosetpermissionsfor
SpawningAIでオプトアウトを申請する方法は前の記事でご紹介しましたが、画像を逐一チェックしなくても、ドメインを丸ごとDoNotTrainレジストリに追加することで、そのウェブサイトでの現在および将来の作業がオプトアウトされます。一度追加すれば以後チェックする必要がなくなります。ドメインが本当にサイト所有者または管理者のものか検証された上でステータスが更新されますので、少々時間がかかります。画像の数が多すぎて追いきれない方は特に助かると思います。私は公式サイトを登録しました。
LAION-5BはCSAMだけでなく成人のポルノも、イラストや漫画も含めて広い範囲で削除しています。以前検索したlolipornやpornでは写真だけでなくイラストも漫画もCGも合成も表示されません。ソフトなヌードも削除されています。ただし昨日書いた通り検索ワードを変えるとまだ出ます。言語を変えても出る画像が違ってきます。まだ完全にクリーンになってはいません。『LAIONは完全に浄化されてはいません』LAION-5BにCSAMが含まれることがスタンフォード大学の調査で明らかにされ、公開停止、
LAION-5BにCSAMが含まれることがスタンフォード大学の調査で明らかにされ、公開停止、問題のデータの削除が行われていることは以前書きました。『スタンフォード大学がLAION-5BのCSAM(児童性的虐待素材)を確認』巨大データセットLAION-5BにCSAM(児童性的虐待素材、日本で児童ポルノと呼ばれるものに近い)が含まれることは昨年から指摘されhaveibeentrai…ameblo.jphaveibeentrained.comが再開したので検索したところ、以前露骨な画像が大量に
拡張機能でデータセットから自分の画像をオプトアウトする方法を見つけました。オプトアウト用の拡張機能SpawningBrowserExtensionを使います。まずSpawningにアクセスします。SpawningDataGovernanceforGenerativeAIspawning.aiこのページが出ます。画面右下のSpawningBrowserExtensionのGETSTARTEDをクリックするとこのページが出ます。スクロールして使用する
LAION-5Bを検索できるhaveibeentrained.comがリニューアルしましたが、以前できた画像検索ができなくなりました。Spawning|HaveIbeenTrained?SearchforyourworkinpopularAItrainingdatasetshaveibeentrained.com画像検索のやり方を説明した過去の記事ですが、現在はこの方法は使えません。『学習された写真を探す方法』StableDiffusionが使用しているデー
SNSに投稿しても意味がないと書く人もいますが、それならなぜどこの企業も政府機関もアカウントを取り情報発信しているのでしょう?誰もがSNSで宣伝するのでしょう?生成AIについて、私は2022年までは面白アプリ程度しか知らず絵は許可を得て使用していると思っていました。自分とは無関係だと思っていました。問題があることを知ったきっかけはSNSです。漫画家だけでなくイラストレータの方もフォローしていて、共有されている情報が流れてきました。製品を製作するのに使われたデータセットLAIO
昨年LAION-5Bからオプトアプトした絵がまた入れられていたので再度オプトアウトしました。見つけた絵は電子書籍の表紙の書影です。書店で販売するために使われている画像です。絵の著作権は私にありますが、宣伝等で使用することは契約で認めており問題ありません。しかしこれを第三者が無断で使用すると著作権侵害になります。データセットに同じ絵が10枚以上入っていましたが、掲載元のURLが違うので全てオプトアウトしました。書店に掲載されている画像は削除できませんから、他に手の打ちようがありません。
データセットLAION-5Bを検索できるhaveibeentrained.comがリニューアルオープンしました。CSAM(日本では児童ポルノ)がどの程度削除されたか確認し、完全ではありませんが問題になりそうなイラストや漫画も削除されていることを確認しました。肝心な自分の絵は以前単語と画像で検索して全部オプトアウト(学習対象から除外)したので残っていないと思っていました。しかし念のため再度検索したところ、以前オプトアウトしたのと同じ画像が2件(10枚以上)見つかりました。一度削除した後にまた
毎日新聞社が「子どもを児童ポルノから守る会」の協力を得て2023年7月以降にネット上で画像検索等で調査した結果、保育園、幼稚園、認定こども園等135園のウェブサイトに、水遊び、泥遊び、ボディーペイント、乾布摩擦、内科検診等の園児の体の一部が露出した画像が掲載されていることがわかりました。それ自体は悪質な画像ではありませんが、12園が掲載した画像が海外のポルノサイトなどに転載され、6園が掲載した画像はAIの学習に使われるデータに組み込まれているということです。園児の画像、海外ポルノサイトへの転
スタンフォード大学インターネット観測所の調査報告書にあるCSAMという言葉はChildSexualAbuseMaterial(児童性的虐待画像)の略語です。露骨な性的行為に関与する未成年者を扱ったあらゆる映像描写を含みます。親が子供の水遊びを撮影した映像は該当しません。性的行為ではないからです。米国ではCSAMを発見したらNationalCenterforMissing&ExploitedChildren(NCMEC、全米行方不明・被搾取児童センター)に報告する
昨日LAION-5Bからポルノが見つからなくなったと報告しましたが、検索ワードを変えてnaked、asianを使ったところ年齢不詳ですが少女らしいヌード、成人のヌード、露天風呂の写真が見つかりました。掲載元はポルノサイトです。改善してはいますが、探せばまだポルノが見つかります。またjapan、girlで検索すると、ヌードではありませんが少女と女児の写真が出てきます。japan、womanでは成人女性が出てきます。名前では見つかりませんので、写真を使われたくない方は面倒ですが全部チェックしてオプ
昨晩はパブリックコメントを書いて疲れ果て、今日は復旧したhaveibeentrained.comで気になるコンテンツを検索しました。porn(ポルノ)は成人も含めて検索結果に出なくなりました。漫画やイラストもかなり減っていますが、書店で販売されている単行本や雑誌のカバー(書店のサムネイル他)や色紙や展示などの画像が出る人がいます。イラストレーターも数は減りましたが本のカバーの他に(無断)転載と思われる画像、ファンアート、AI生成物が出ます。掲載元はPinterest、WixMedia、A
LAION-5Bのデータを検索できるhaveibeentrained.comが復旧していました。Spawning|HaveIbeenTrained?SearchforyourworkinpopularAItrainingdatasetshaveibeentrained.com念のために問題になったCSAM、成人のポルノ、差別用語、犯罪者の名前、写真家の名前で検索してみましたが、イラストも含め問題のありそうな画像はほぼ表示されなくなっていました。病院の入院患者や高齢者
私はプレ均昭和生まれです。バブル時代にデビューしましたが、新人の待遇は変わらず何の得もないままバブルがはじけ、連載していた雑誌が続けて休刊になり、その後は厳しい時代を過ごしてきました。それでも固定読者の方が一定数いて支えて下さり細々と続けてこられました。読者の方々も同年代か少し下で、80年~90年代の漫画を読んで育ち、2000年前後にブームになった萌えの影響はありません。歳の近い漫画読者の方は、萌えは好きではないといいます。デジコミも好きではなく、アナログの線が好き、個性的な絵が好きでアナ
昨日スタンフォード大学がLAION-5Bに含まれるCSAMを調査し確認した記事をご紹介しました。『スタンフォード大学がLAION-5Bの児童ポルノ(CSAM)を確認』巨大データセットLAION-5Bに児童ポルノ(CSAM)が含まれることは昨年から指摘されhaveibeentrained.comで検索できるようになっていまし…ameblo.jpその記事をXにも転送し、関連するXの投稿もRPしました。今朝見るとXのアカウントが凍結されていたので驚きました。原因は不明ですが、児童ポルノを扱
巨大データセットLAION-5BにCSAM(児童性的虐待素材、日本で児童ポルノと呼ばれるものに近い)が含まれることは昨年から指摘されhaveibeentrained.comで検索できるようになっていました。それを利用して個人が記事を書いても「信頼できるソースがない」といわれ問題にされませんでした。LAION-5Bは無料でDLすることがでます。LAION-5Bを使用したStableDiffusionもオープンソースで公開されており企業でも学校でも使われています。データセットにCSAMが含ま
LAION-5Bに児童ポルノや死体写真があるという記事は私も含め幾人かの方が書いていますが、それを読んでも信頼に足るソースが見つからないといわれます。一般人の投稿は信頼に足らないと思われても仕方ありませんが、画像は証拠保存してあります。アップロードは違法、規約違反になりますのでアップできません。Xにモザイクをかけてアップしたところ凍結されましたし、ブログ記事もリンクのサムネイルに露出した画像があったため記事が公開停止になりました。Xは異議を申し立てて凍結解除されました。ブログの記事は一度
生成AIのデータセットに児童ポルノが入っている証拠を示せ、という投稿を見ましたので、単刀直入に書きます。あります。日本の国会図書館で「清岡純子写真集BestSelection!」が児童ポルノと判定され閲覧不可とされた清岡純子の少女ヌード写真がLAION-5Bで見つかります。LAION-5Bに含まれるデータを単語、画像で検索できるhaveibeentrained.comでアルファベットでSumikoKiyookaと打ち込んで検索してください。すでに検索結果から削除されて出る写真は減っていま
ネットで騒いでも意味がないと揶揄されますが、データセットLAION-5Bに児童ポルノが入っていると注意喚起する人が増えた結果、検索しても無修正や児童ポルノは削除されて減っているのがわかります。検索はこちらからできます。HaveIBeenTrained?haveibeentrained.comデータセットからポルノが消えれば生成できなくなります。すでに拡散されているデータは取り返せませんが、せめて新製品ではポルノを作りにくくなるようにしたいと思います。日本人の名前は日本語と
StableDiffusionのデータセットLAION-5Bに医療情報が入っていることは報道されています。発見した当事者が抗議しても自力で対応してくれという返事しかもらえませんでした。画像生成AIユーザーがAI学習用データセットから「自分の医療記録の写真」を発見してしまう画像生成AIの「DALL・E2」などを使ったアート作品を手がけるアーティストが、AIの学習用データセットとして提供されている写真の中から、自分が病院で治療を受けている時に撮影された写真を見つけたと報告しました。このことから、
日本人の児童ポルノはまだLAION-5Bに残っています。日本語検索で出なくても英語検索で出ます。検索はこちらから。「日本少年ポルノ」の検索結果するとポルノはありません。英語検索すると「japanboyporn」で大量に出ます。男児も注意してください。著名な写真家名で日本語検索しても児童ポルノは消えています。以前発見してブログで報告した効果があったかもしれません。しかし人名も英語で検索すると残っているのがわかります。ポルノと言えない芸術性があっても、データが児童ポル
StableDiffusionのデータセットLAION-5Bに自分の絵や写真が入っていることに気づいた人が増え、オプトアウトが進んでいるようです。同じキーワードで検索して出る画像が減っています。私ももう出ません(カラーは)。どこかに残っている画像があるかもしれませんが、見つけ次第対応します。しかし残念ながら以前見つけた児童ポルノの写真集は残っています。著作権が私にあるわけではないので勝手に削除できません。日本語検索と英語検索では結果が違うので、気づかれていないのかもしれません。英語
昨日の記事の続きです。StableDiffusionのデータセットLAION-5Bには58億以上の世界中のデータが入っており、無断で利用されています。日本でよく使われるフリー素材サイトの写真も見つかります。無料で使えるサイトもありますが、維持費用をまかなうため寄付を求めており、また商用利用は有料・法人会員に限定するサイトもあります。転売や成人向けへの利用を禁じるなどの利用規約も設けられており、自由に使えるわけではありません。しかしひとたび生成AIに使われてしまうと、これらの規約
StableDiffusionに使われているデータセットLAION-5Bに写真が大量に含まれています。たまたま私が検索途中に見つけたものの一部をご紹介します。報道写真、写真集日本最大の写真販売サイトamanaimages雑誌企業の公式サイトブログcocolog-nifty.com盗撮も含まれています。漫画やアニメ、ゲーム、イラストに限っては、確かに二次創作を共有して楽しむ固有の文化があります。著作権も親告罪のままで黙認される場合が多い(逮捕者も出ている)のは事実です。
画像生成AIのデータセットにイラストや漫画、有名人の写真が入っており、著作権、肖像権が問題にされています。それについては何度も書いてきました。しかし一般人のデータも無許可で使われています。働く現場の画像の多くは広告、報道からの転載で、モデルの演技ですが、氏名の書かれている一般人のデータも含まれます。広報のために顔を出して協力したものと思われますが、生成AIの学習に使われることに同意はしていないはずです。以下はLAION-5Bで見つかったものです。農家の女性と男性漁師建設作
データセットに58億もの画像データが入っているはずがない。↓データセットには画像データは入っていません。入っているのは画像のURL、画像にリンクしている<img>タグのalt文字列、アノテーション(付加情報)です。ユーザーが自分でインターネットからDLして使う仕組みです。ユーザーによる簡単な解説がこちらにあります。自分の顔写真が使われてもデータセットの作成者は画像データを削除することができません。画像データはないからです。「StableDiffusion」のような画像生成AIに自
LAION-5Bに含まれるデータを検索できるアプリで漫画家の名前を検索しても、公開されている漫画家の写真は出ますが、漫画は出ません。見つからないため私は入っていないと思いましたが、偶然キーワード検索で私の絵も入っていることがわかりました。ネットに出ている広告やブログ等にアップされている漫画の絵が出てきます。ジャンルやテーマなどキーワードを工夫して探し、関連画像も探せば見つかります。ただし根気が必要です。7月7日追記。アプリがアップデートされて日本人も見つけやすくなり、名前で出る人が増えまし
画像生成AIを使って児童ポルノもどきの画像を作り、pixiv等で宣伝販売している悪質な利用者について、BBCが報道しました。pixivでも規約違反ですが、多くの投稿に対応できていません。世界の公共放送の代表的存在といえるBBCが、画像生成AIを利用した無数の児童性的虐待物が作成・販売されている深刻な現状について報じています。BBCは、日本の代表的な投稿プラットフォームである「pixiv」が、そうした行為の温床となっている旨についても言及しています。https://t.co/Gu8HnNxW