ブログ記事6件
昨日記事を書いた米国のリーチサイトDanbooruには無断で転載された数百万のイラスト、中には漫画も入っています。日本人の絵が目立ちますが中国や米国他の作家の作品もあります。作家や作品を検索するタグにofficialart、logoがあります。公式のイラスト、ロゴが入っています。OfficialArt|DanbooruSeeover267thousandOfficialArtimagesonDanbooru.Artworkthatismadebyth
主にアニメ風のイラストを集めたデータセットDanbooru2022はcc0(著作権放棄)で公開されていますが日本人が著作権を持つイラストも多数入っています。animelover/danbooru2022·DatasetsatHuggingFaceWe’reonajourneytoadvanceanddemocratizeartificialintelligencethroughopensourceandopenscience.huggingface.co
生成AIをブログで活用する人も多いようですが、実は一般利用者の使用は個人的、家庭内に制限される見通しです。内閣府が5月28日に発表した「『AI時代の知的財産権検討会』の中間とりまとめ」によると、事業者と一般利用者は別扱いになっており、一般利用者は「AI生成物の使用を個人、家庭内の利用」に制限されます。これはCDの複製は個人、家庭内での利用に限って認められ、不特定多数への配布、販売は禁止されているのと同じと理解できます。著作権法で認められている私的利用のための複製の範囲です。公衆送信(ネット
米国のリーチサイトDanbooruにpixiv他のコンテンツが大量に投稿されています。日本ではリーチサイトにも有罪の判例があるため海賊版といわれますが、米国のサイトですから放置されています。さらにDanbooruの投稿からスクレイピングしたデータセットが公開され、Danbooru2017~2024まで更新されています。うちDanbooru2022はcc0(著作権放棄)で公開されています。animelover/danbooru2022·DatasetsatHuggingFace
米国のリーチサイトDanbooruに日本のpixivの大量のコンテンツが投稿され、そこからスクレイピングされたデータセットDanbooru2022がcc0(著作権放棄)で公開されていることを、昨日の記事で書きました。実際に一部DLして中身を確認しました。予想通りpixivからDanbooru経由で大量に取られていました。解像度は120dpi、サイズはまちまちですが上げたサンプルを100%に戻した大きさです。データセットの画像(30%、72dpiに縮小)テキスト学習元pixiv
私は23年にpixivを退会していますので今はそこから画像を取られる心配はありませんが、Danbooruという米国のリーチサイトにpixivのコンテンツが大量に投稿されています。画像が上げられているのではなく、URLが貼り付けられているだけです。リーチサイトは日本では実質的に海賊版として使われているため20年10月から規制されていますが、米国には規制がないことを利用しています。その上cc0(著作権放棄)のデータセットとして公開されているのには驚きました。日本の著作権法の権利制限規定のよう