無断学習単語

1件

ムダンガクシュウ

4.6千文字の記事

掲示板へ

記事編集

無断学習とは、無断で学習すること。

概要

多くの場合、「何らかのデータについて、作成者や権利者に無断で、AI（人工知能）に学習させるためのデータとして利用すること」を指して使用されることが多い言葉である。

なお、AIにおいて「無断学習」という言葉で問題視する際には、「大規模な事前学習によってAI モデルを開発する」という場面での無断学習と、「そういった既存のAI モデルについて、特定の対象を模倣するために個別チューニングさせる」という場面での無断学習、双方に対して用いられる。

同じ「無断学習」ではあるが、この2つには共通しない点も多いため、混同すると話がややこしくなる。できるだけ切り分けて考えたい。

ただし「どこまでを『大規模な事前学習』と捉えてどこまでを『個別チューニング』と捉えるか」について明確に線引きできないケースもあるかと思われるが。

大規模な無断学習

「Sta ble Dif fusion」は、その画像生成AIの開発に「LAION」(Large-scale Art if ic ial Intelligence Open Network)という非常に大規模な画像データセットを利用している。この画像データセットは、インターネット上で公開されている画像をコンピューターによる自動的なクローリングで大量に採取したものである。

「LAION」にどのような画像データが含まれているのか？については、「Have I Been Trained?」というサイトを利用すると確認できる（NSFW フィルターがかかっているが完全ではなく、R-18やR-18Gの画像が表示される場合もあるので注意）。例えば「Hatsune Miku」というキーワードで検索してみると、初音ミクのイラストやコスプレ写真が大量に含まれていることがわかる。

Have I Been Trained?　（キーワードを「Hatsune Miku」に設定したURL）

これらのイラストを描いた絵師たちや、コスプレ写真の被写体らや撮影者らが「画像データに含まれて、AIの学習に使われてもよいですよ」と同意しているわけもない。すなわち無断学習である。

さらに、「NovelAI」や「Waifu Diffusion」といった画像生成AI モデルは、フリーで公開されている「Sta ble Dif fusion」をベースにしつつ、「Da nbooru」（ダンボール）という画像サイト内にアップロードされている大量のイラストをファインチューニングに用いたものである。

「Da nbooru」側は「NovelAI」の学習に協力したわけではないことを明言しており、おそらく「Waifu Diffusion」の学習に対しても同様であろう。つまり、こちらも自動クローリングによる無断での収集、学習であったとみられる。

「われわれはNovelAIと関係ない」──海外のイラストサイト「Danbooru」が日本語で声明 - ITmedia NEWS

個別の無断学習

2021年にマイクロソフトの研究者らから発表されていた「LoRA」（Low-Rank Ada ptation）という機械学習に関連する技法がある。要約して言えば、割と少数のお手本を用いて、しかも少ない計算量で、既存のAI モデルをチューニングすることができる……という手法であった。

この「LoRA」はそもそもは主に自然言語処理に関する技術であった。だがこれを応用して、画像生成AIのチューニングに使える、しかも個人が行えるレベルで扱える簡便な方法が生み出されてしまい、2022年 12月ごろに世間に知れ渡った。

そして、それ以後は「任意のイラストレーターの画風を真似たイラストをAIに生成させる」ことは、こういった手法に関する知識と技術を習得することができる人物ならば誰でも行えるようになってしまった。

実際に「イラストを無断学習され、画風を似せたAI モデルが配布されてしまった」というイラストレーターも既に存在しているようだ。後述する「mimic」騒動のときには結果的に杞憂・冤罪だった「AIを使って、第三者に絵柄が勝手に模倣されてしまう」という懸念が、現実のものとなっているのである。

さらには音声データなどにもこういった手法は応用できるため、「アニメの特定のキャラクターの声で学習させ、そのキャラクターの声や語調で話せる、歌えるボイスチェンジャー」が作成されて販売される、といった事例までもが起きている。

ツイートを読み込み中です
 https://twitter.com/miyamoyame/status/1658879014973628419

合法性

「他人の著作物をAIに無断で学習させるようなことは違法ではないのか？」

誰しもが疑問に思う点であろうかと思われる。

現在のところ、「少なくとも2023年現在の日本の著作権法の第三十条の四に照らせば、著作権者の利益を不当に害することがない限りは合法である」と解釈されることが多いようである。

（著作物に表現された思想又は感情の享受を目的としない利用）
第三十条の四　著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
　一　著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
　二　情報解析（多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。）の用に供する場合
　三　前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用（プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。）に供する場合

Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 | STORIA法律事務所

逆に言えば、「著作権者の利益が不当に害された」と司法に判断されれば違法となりうる、ということにもなるが。

言葉としての出現時期

日本での利用者が非常に多い短文コミュニケーションウェブサービス「Twitter」で「無断学習」という言葉を検索すると、2023年 5月20日に検索して見つけることができるツイートに限れば、2021年 3月までは計4回しか使用されたことがないマイナーな言葉であったし、AIとは無関係の文脈であった。

"無断学習" until:2021-3-31 - Twitter検索 / Twitter

"無断学習" since:2021-4-1 until:2022-7-31 - Twitter検索 / Twitter

そして、AIの創作物の中でも「イラストを出力するAI」（いわゆる「AIイラスト」）の文脈で、「無断学習」といったような言葉がメジャーとなるのではないか……と予想する投稿が2022年 8月1日になされている。これはその後の流れから考えると、実に的を射た未来予測であったと言える。

ツイートを読み込み中です
 https://twitter.com/7j543/status/1554098033331417088

この少し前の同年7月に、画像生成AI「Mi djourney」がオープンベータとして公開されており、そこから推測したものか。

そして同年8月22日、高性能な画像生成AI「Sta ble Dif fusion」がネット上でフリーで公開された。これはかなりのインパクトのある出来事であった。

ツイートを読み込み中です
 https://twitter.com/fladdict/status/1561406014540640256

ツイートを読み込み中です
 https://twitter.com/Jin115/status/1562047274058149888

ツイートを読み込み中です
 https://twitter.com/ui_nyan/status/1562027631159427072

そして「無断学習」という言葉が一気に使用されるになったきっかけは、「AIに自分のイラストの絵柄を学習させ、模倣したイラストを描くことができるAIを作成できる」と謳うウェブサービス「mimic」が同年8月29日にベータ版をリリースしたことであったようである。

ツイートを読み込み中です
 https://twitter.com/illustmimic/status/1564081818441109505

このリリース以後、「本人以外が絵柄を無断学習するようなことがあればイラストレーターにとって感情的にも実害的にも致命的ではないか」という危惧が噴出し、「無断学習」という言葉も多用されるようになったのである。

"無断学習" since:2022-8-29 until:2022-9-29 - Twitter検索 / Twitter

このウェブサービス「mimic」はそういった悪用がされないような安全策を何重にも採ったものとなった（詳細は「mimic」の記事を参照）ため結果的には「mimicに関しては」冤罪・杞憂であったとも言える。

だが、「自分の絵を無断学習されて、自分の画風で絵を描くAIを勝手に作成されてしまう」という恐れられていた事態は、前述の「LoRA」などの手法の普及によって（「mimic」とは離れたところで）現実に起きてしまうのであった。

ニコニ広告で宣伝された記事

☆くろさや☆ (単) 記事と一緒に動画もおすすめ！

提供：奥沢美咲

19587000pt

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

無断学習

無断学習の記事へ戻る

« 前へ 1- 31- 61- 91-

88 ななしのよっしん非表示 2024/05/05(日) 02:49:59 ID: 40Pq9c+QJs レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 「やめて」と明言してる絵師の絵を食わせるのは倫理観がだいぶうんちに近いと思うけど現行法で合法な以上やめさせる強制力がない; 👍
高評価

6
👎
低評価

2
89 ななしのよっしん非表示 2024/05/05(日) 10:34:20 ID: eMOQUWDafC レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: あと平然と泥棒とか盗人扱いするの止めなよ…犯罪者呼びは普通に名誉棄損だよ。; 👍
高評価

5
👎
低評価

4
90 ななしのよっしん非表示 2024/05/05(日) 10:36:51 ID: D5JcDisge9 レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 絵柄割れ厨が被害者面してるのウケるんだけど
盗人猛々しい; 👍
高評価

4
👎
低評価

7
91 ななしのよっしん非表示 2024/05/05(日) 10:43:38 ID: D5JcDisge9 レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 無断学習を擁護する詭弁が無理矢理すぎて、こんな奴らが社会に出て迷惑かけてるのか…と戦慄する
コンプラ違反がありふれてるのもさもありなん; 👍
高評価

1
👎
低評価

12
92 ななしのよっしん非表示 2024/05/06(月) 00:45:07 ID: PO1ZLYhCf6 レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: >>80
解説助かる、なんか互いの論争見てると分かりやすい単語に考え無しに飛びつくのよく見るよな; 👍
高評価

0
👎
低評価

0
93 ななしのよっしん非表示 2024/05/06(月) 18:35:17 ID: eMOQUWDafC レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: ほらすぐ"盗人"扱い、だから裁判で負けるんだよな(´・ω・｀); 👍
高評価

9
👎
低評価

1
94 ななしのよっしん非表示 2024/05/07(火) 19:25:07 ID: 21SX0XHpFR レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: >>91
法治社会に住んでいてその主張を通したいなら、その「詭弁」「迷惑」「コンプラ違反」などが非合法であることを裁判で証明してくれ
（法の下では非合法と非倫理的は違う）; 👍
高評価

7
👎
低評価

0
95 ななしのよっしん非表示 2024/05/07(火) 22:25:15 ID: MCc2TMj1QB レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: 「無断学習」とやらを法律違反でなく「コンプラ違反」と呼んで叩いてるあたり
叩いてる本人も「無断学習」の違法性を確信できてなさそう; 👍
高評価

5
👎
低評価

0
96 ななしのよっしん非表示 2024/05/12(日) 08:50:20 ID: UZVKs+3eXm レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: ハラスメントにしても
法的な合・違法性と自分の主観的な文化による善悪が区別できがない人が未だにいるからコンプラ違反が起きてるんですよ
言ってしまえばエ◯バの証人が輸血は悪っていうのを世間一般の認識だと勘違いしてるのに等しい; 👍
高評価

2
👎
低評価

0
97 ななしのよっしん非表示 2024/05/12(日) 11:25:26 ID: x4TCm+gJl6 レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: で？君らは許可得て学習しているの？で終わる話。; 👍
高評価

3
👎
低評価

0

無断学習の記事へ戻る

« 前へ 1- 31- 61- 91-

無断学習単語

概要

大規模な無断学習

個別の無断学習

合法性

言葉としての出現時期

関連動画

関連項目

ニコニ広告で宣伝された記事

この記事の掲示板に最近描かれたお絵カキコ

この記事の掲示板に最近投稿されたピコカキコ

無断学習

急上昇ワード改

おすすめトレンド

ニコニコニューストピックス

無断学習単語

概要

大規模な無断学習

個別の無断学習

合法性

言葉としての出現時期

関連動画

関連項目

この記事をもとに新規記事を作成

ニコニ広告で宣伝された記事

この記事の掲示板に最近描かれたお絵カキコ

この記事の掲示板に最近投稿されたピコカキコ

無断学習

急上昇ワード改

おすすめトレンド

ニコニコニューストピックス