日本の生成AIについての政策の分岐点:著作権法30条の4ではなぜだめなのか?
地域:日本
業務分野:知財一般
カテゴリー:法令、その他
生成AIと著作権の問題は、文化庁の文化審議会著作権分科会等で議論がなされており、日本の生成AIについての政策は分岐点を迎えているといえる。
著作権法第30条の4は、世界で初めて導入された独創的な社会イノベーションであり、このような独創的な社会イノベーションは、日本の将来にとって極めて重要である。著作権30条の4の作成に尽力された人々は、とても素晴らしく、このように、世界初の独創的な制度を導入することは、今後も引き続き極めて重要となると考える。 しかし、人工知能の発展の速度はあまりにも速く、著作権30条の4をもってしても、十分な対応ができない時代になっており、改正などのさらなる対応が必要と思われる。 生成AIと著作権の議論は、一般的には、(1)AI開発・学習段階と、(2)生成・利用段階に分けて議論されている。このような区分も、生成AIを、現在の姿(画像生成AI、大規模言語モデル、音声生成AIなど)をベースに捉えるものであり、2~3年後には時代遅れになってしまうかもしれない。生成AIは、マルチモーダル化し、他のシステムと組み合わされ、異なる議論となってしまうかもしれない。 しかし、ここでは、暫定的に現時点での分類にしたがって、なぜ著作権法30条の4ではだめなのかを検討する。 1.AI開発・学習段階 この段階は、著作権法第30条の4が検討の対象となる。 (著作物に表現された思想又は感情の享受を目的としない利用) 一見すると、この規定は、AI開発を大きく促進するように思われる。しかし、開発者からは、著作権法30条の4があっても、大丈夫なのかという不安がたえないであろう。 著作権法30条の4は、開発者や研究者が読むには難しいものであり、また、判例も固まっておらず、法的な解釈も明確でない。「著作権者の利益を不当に害することとなる場合」、「必要と認められる限度」などの解釈の明確化も問題となるが、それよりも大きな問題は利用規約の問題であろう。 結局、著作権法30条の4を制定しても、AI学習用のデータが、一箇所にまとまってできるわけではない。AI学習用のデータは、色々なところに断片的にあり、公開されていない場合もあり、利用には著作権者等との交渉が必要なものも多く、利用可能でない場合もある。利用可能である場合も、利用規約等があり、開発者は、利用規約等をいちいち検討しなければならない。 利用規約等はフォーマットが定まっておらず、色々なものがあり、表現も必ずしも明確ではない。準拠法が日本法とも限らない。利用規約は、利用させる側の立場の強さから、かなり不利なことが書かれていることも多く、大丈夫なのかというAIの開発者の不安は、おさまることがないであろう。 法律家が読んでも、理解が難しく、解釈が不明確なものがあるのであるから、開発者が多種多様な利用規約を読まなければならないのでは、開発が円滑に進まないであろう。 しかし、著作権法第30条の4があれば、これに反する利用規約は無効となり、利用規約を読まなくても自由に利用できるという解釈は一般的とはいえないであろう。著作権法30条の4と利用規約との関係については、たとえ立法技術的に困難であっても、法律で明確化をすることが必要と思われる。 このように、AI開発・学習段階においては、著作権法第30条の4は非常に有益ではあるが、やはり現在のAIの時代にふさわしいものであるかは疑問が残る。 2.生成・利用段階 著作権法第30条の4は、この段階をカバーしておらず、大きな問題となる。 生成されたものについて、既存の著作物との類似性、依拠性が認められれば、著作権侵害になるとされており、著作権法30条の4は、この段階での助けにならない。この点で、著作権法30条の4は、根本的に不十分といえる。 生成AIが生成するものについては、データ量は莫大であり、利用者の行動にも依存し、開発者においても、予測がつかないことが多いであろう。開発者も、生成されるものがどのようなものかをすべて予測することはできないため、生成されるものについて、著作権侵害を主張されるのではないかという不安は、とどまるところがないであろう。 生成AIの出力段階において、著作権侵害のおそれのあるものを判断し、出力から除外することが技術的に可能かという点は、検討に値する。しかし、過去の裁判例から学習しようとしても、裁判例などのデータが圧倒的に足りない。もっとも、元裁判官や法律家等の協力を得て、大規模なデータを作ることは考えられる。たとえば、10人一組の元裁判官や法律家に、侵害になるかどうか判断しにくいデータを多数決で判定してもらい、データセットを作る。1分間に1個判断をすると仮定すると、累計1億時間で60億個のデータセットができる。一部のデータセットで学習させ、より判断しにくいデータを追加で判断してもらうなど、色々な工夫をすることも可能かもしれない。著作権侵害判定AIについては、技術的に可能かどうかを含めて、検討が必要であろう。 しかし、原理的な問題として、裁判における裁判所の判断自体にばらつきがあり、正確な予測は不可能という限界があると思われる。裁判所の判断自体をAIで置き換える(AI裁判官)という極論をとらない限り、正確な予測は難しいであろう。 将来は、著作権侵害判定AIを裁判所に備え付け、最終的な判断は裁判官がするとしても、基本的には著作権侵害判定AIの判断を尊重するという時代が来るかもしれない。 しかし、著作権侵害判定AIの判定を巧みにすり抜けるが、裁判官が侵害と感じる場合は、必ず生じうる。意図的にそのようなものが作られることも考えられる。この場合に、具体的な妥当性から裁判官が判断するのか、予測可能性の担保の観点から著作権侵害判定AIの判断を尊重するのかなど、難しい問題が生ずる。前者では予測可能性が犠牲になり、後者では裁判官をAI裁判官に置き換えるのと同様になってしまう。 このように、著作権侵害判定AIの問題は原理的な難点を抱えており、著作権の政策的な議論においては、この問題が将来的に簡単にAI技術で解決すると考えない方がよいであろう。 そうすると、著作権侵害判定AIを開発しても、完全なものは作ることができず、生成AIの出力が、たまたま既存著作物と類似してしまい、著作権侵害を主張されるという開発者の不安は、解消されないことになる。 一つのアプローチとして、生成AIに関する依拠性について、新しい考え方をとる可能性はありうる。学習データの中に入っている既存著作物に偶然似ていても、生成AIの処理の仕方によっては、直ちに依拠性は認めず、一定の場合にのみ依拠性を認めるという考え方はありうると思われる。 たとえば、将来的には脳のフルセットの機能を有し、意識を有するAIが出現するかもしれないが、現時点では、たとえば多くの画像生成AIは、脳の視覚野に相当する情報処理を行なっているわけではなく、絵画のデータを処理していても、無意識の処理であり、絵画が見えているとはいえない。 また、生成AIといっても、その情報処理は千差万別であり、生成AIとひとくくりに議論するのがよいのか疑問がある。たとえば、絵画のデータから、学習に用いたどの絵画にも似ていない高次元空間上のデータを作成し、高次元空間上で、既存の絵画のデータと十分距離を取っているはずの画像を出力したが、なぜか人間の目には類似する画像が、偶然生成されてしまうような場合に、依拠性を認めるのかという問題もありうる。 しかし、生成AIが既存著作物に類似するものを出力してしまった場合、著作権者側が納得するか疑問である。生成AIの内部で何をしているかは著作権者側にはわからないため、生成AIの形式を取っているが、実際には既存著作物の類似物を出力していることなどを疑って、訴訟等をする事例も出てくる可能性がある。 このように、著作権法30条の4は、生成・利用段階をカバーしておらず、根本的に不十分なものである。 3.解決方法 結局のところ、生成AIについて、著作権法30条の4は不十分なものと言わざるを得ない。著作権者側も、AIの時代の恩恵を受けられず、この点でも不十分であろう。 著作権の問題のないAI学習用の大規模なデータが、一箇所にまとまっていることが重要となる(実際に記憶されるサーバは分散していても、利用窓口が明確なことが重要となる)。利用規約は、法律を知らない開発者でも容易に理解できる1つだけとし、誰もが簡単にデータを使えるようにすることが重要であろう。1つの利用規約だけを覚えれば、著作権法の難しい解釈問題に立ち入らなくても、自由に開発ができるような体制を整えるのが望ましい。 そのためには、著作権者やデータの作成者が、AI学習用データとして利用することを許可し、データを登録した場合に、毎年の定期的な収入など、データインカム(DI)を与え、著作権の問題のないAI学習用データの大規模なデータベースを作ることが重要となろう。これは、AI学習用データによる収入(データインカム(Data Income (DI))の実現として、重要となると思われる。 著作権者が、AI学習用データとして許可をしたデータに、十分な金額のデータインカム(DI)を与えることにより、著作権者側も生成AIの進歩から利益が得られるようになり、生成AIに協力的になり、データ蓄積が促進されるであろう。 また、著作権のないデータについても、データインカム(DI)を与えて、作成と登録を促進することが、データベースを充実させ、AIの発展にとって重要であろう。著作物ではない有益なデータは多いため、データインカム(DI)の制度は重要となる。 著作権者が、AI学習用データとして許可をし、生成AIの出力がたまたま自分の著作物に似てしまっても、自分の著作物を狙い撃ちにしたような非常識な利用以外は、訴訟を起こさないことを条件に、毎年データインカム(DI)が払い込まれる仕組みが必要であろう。定期的な収入となるほか、データ登録者としての社会貢献も可能となる。高齢者も、身の回りの有益なデータを登録することができ、超高齢化社会を迎える日本の将来にも役立つ。 データインカム(DI)の給付の対象となるデータの登録に際しては、提供されたデータに個人情報が含まれないかなど、著作権以外の点も審査をして、著作権以外の問題もクリアをしたデータベースを作ると使いやすいであろう。 このようにして、著作権の問題のない(著作隣接権、著作者人格権、個人情報保護法、プライバシーなどの問題もない)、クリーンなデータの巨大データベースが出来上がり、これをみんなで使うことで、日本の未来が拓けてくるであろう。 生成AIは、現在の生成AIのイメージで捉えている人が多いが、これは表面的な見方にすぎない。AIが進歩をしていくと、人間の労働を代替できるものになりうる。 たとえば、現在の大規模言語モデルを日本語版で使っているとわかりにくいが、大量の学習データを利用できる英語版では、既に医師国家試験、司法試験の双方に合格したものもあり、人間の能力を一部越えている。現状の日本語版でも、相対性理論、量子力学、東洋美術、西洋哲学、マクロ経済学など、ありとあらゆる話題に一応の会話ができ、長文を短時間で要約し、プログラミングも即時にできるのは、通常の人間の能力を、一部超えているともいえる。今後もAIが進歩していき、人間の能力を超える部分が拡大していくことは間違いないであろう。 将来的には、GDPの1%程度はAIが生産できるようになり、その割合は年とともに増加するであろう。人間の労働はゼロにはならないであろうが、仮に人間の労働が30%残ったと仮定しても、人工知能(AI)がGDPの70%を生み出すことになりうる。この場合、著作権の問題が解決されていなければ、GDPの大半を失うことになりうる。 著作権の問題のないデータのみを学習に使った生成AIの生成物は、著作権侵害にならないことを、法律を制定して制度的に保障し、万が一著作権上の問題のあるデータが混入していたなどの場合も、保険のような仕組みで解決をするようにすれば、人工知能(AI)が人間の労働を代替する作業をするたびに、著作権侵害を主張されるおそれがあるという問題を防ぐことができるであろう。 人間の労働が人工知能(AI)により代替される社会における、ベーシックインカム(BI)の実現が議論されているが、従来の議論では財源が問題となる。しかし、人工知能の生産力に応じて、無理のない少額からベーシックインカム(BI)を始めることにより、財源の問題を解決することができる。他の制度を変える必要はなく、もちろん、憲法上の権利(憲法第25条)があるので、生活保護は並存することになるであろう。 筆者は、人工知能(AI)の次世代社会のための法的インフラとして、人工知能の発展に協力する行為について与えられる協力インカム(CI)と、人工知能の学習用データによる収入であるデータインカム(DI)の概念を、ベーシックインカム(BI)を補完する制度として、提案している。 人工知能(AI)の生産力に応じたベーシックインカム(BI)の実現において、人工知能の生産力を増大させるために、協力インカム(CI)、データインカム(DI)を総合的に導入することが有用と思われる(AI、BI、CI、DI構想)。 |
執筆者
法律部アソシエイト 弁護士
岡本 義則 おかもと よしのり
[業務分野]
不正競争防止法 著作権法 企業法務 国際法務 知財一般 特許 意匠
知財一般分野の他の法律情報
お電話でのお問合せ
03-3270-6641(代表)