关于AI训练数据侵权的碎碎念

时间：2024-04-05 11:11:24浏览次数：19

　　从ChatGPT开始对于AI使用的训练数据是否侵权就一直争论不休，经常能看到xx行业联合抵制的新闻。尽管我个人认为是“侵权”的，但也知道大概率这并不违反任何现行法律（可能违法的是爬取训练数据这个过程），等到相关法律出台的时候互联网上的优质数据大概都已经被收集完成了，所以除了感慨一句快速变革的时期总是有漏子可钻之外也没多想。
　　结果今天看到音乐人抵制Suno AI的帖子，顺藤摸瓜看了看知乎上相关的问题和回答，震惊于居然有如此多的人认为不应该算侵权，甚至大力支持，我实在是有些不敢苟同，于是写下了这些碎碎念。
　　讨论这个问题之前，需要先界定一下“侵权”的概念。就我了解到的情况，“爬取公开数据训练AI”这件事应该是不违背现行的著作权法或专利法之类的法律，所以自然不构成现行法律意义上的侵权。我所说的“侵权”是一种我构想中的应然而非实然。为了避免概念过于宽泛可能导致的诸多问题，我姑且只针对这个问题将“权”定义为“作品创作人可以拒绝公开发表的作品被拿来训练AI”的权力。
　　认为爬取公开数据训练AI不算侵权的人最多复述的一个观点就是，人和AI的学习过程没有任何差别。这类观点大意如下：即便你的作品表明了不能商用，你也无法避免“一个人看了你的作品，学习到了一些东西，然后基于此创作一些不违反现行法律的作品并进行商用”，而显然没有创作者因此控告自己被侵权了。把这个表述中的人换成AI，依旧成立，如果人这么做不算侵权，为什么AI就算？
　　从我的观点来看，人这么做其实也侵权了，只不过被侵权者没有追究，或者ta们认为这种侵权是自己可以接受的（当然客观上也没有能力追究或不接受）；或者从创作者的角度出发，ta们授权了人们可以这么做，不然完全可以跟卖课一样，只有交钱了才能看且不得作他用。这属于某种在特定时代进程下的约定俗成：现行法律已经能比较好的维护创作者的权利，因此一些“侵权”行为已经被默许或者授权了。而“训练AI”这件事，在我看来属于尚没有被法律约束而又没有被默许或者授权的“侵权”行为，属于由于生产力发展新产生的灰色地带。随着时代发展，这个灰色地带一定会越来越小，只是会偏向哪侧并不好说。我个人当然是倾向被法律约束，但从实操层面也确实存在诸多困难，因为授权问题将其一刀砍死也多少有些因噎废食（这也是一部分人认为不应该侵权的理由）。

标签：训练,AI,侵权,法律,数据,碎念,现行
From： https://www.cnblogs.com/qiangliang/p/18115574

AI大模型与网球运动结合的应用场景及案例分析
AI大模型与网球运动结合的未来前景是广阔的，它不仅能够提升运动员的训练和比赛表现，还能改善教练的策略制定、增强观众的观赛体验以及优化网球赛事的管理。以下是几个具体的应用场景：1.运动员技能和表现分析 AI大模型可以通过分析高速摄像头捕......
如何使用AI生成短视频脚本
短视频作为目前最火热的创作方式，很多人都想拍短视频来表达自己的想法，但是却不知道如何下手，今天教大家如何快速生成短视频文案。打开智游剪辑（官网:zyjj.cc），搜索抖音文案生成然后我们就只需要输入视频主题即可帮你自动生成视频文案了主题是可以任意的，比如我们可以生成......
AI大模型开发基础篇之OpenAI大模型生态
文章目录前言一、语⾔类⼤模型二、图像大模型三、语音识别模型四、语音合成模型五、文本向量化模型六、审查模型七、编程大模型八、API命名规范总结前言在讨论OpenAI的大模型时，大家耳熟能详的通常是ChatGPT3.5和ChatGPT4；然而实际上远不止于此，OpenAI公司在自然语言处......
AI大模型应用开发篇之Embeddings向量化
文章目录前言环境准备一、Embedding介绍二、WordEmbedding技术三、Embedding应用价值四、Embedding开发实践4.1本地数据集Embedding4.2本地知识库检索前言随着AI大模型的不断发展，AI大模型应用开发这门技术也越来越重要，很多人都开启了学习AIGC，本文介绍了AI大模型......
【漏洞复现】宏景人力资源信息管理系统 showmediainfo SQL注入漏洞
免责声明：文章来源互联网收集整理，文章仅供参考，此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者......
Higgsfield AI: 对飙Sora打造个性化视频新浪潮，重塑社交媒体内容创作
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://......
langchain + azure chatgpt组合配置并运行
首先默认你已经有了azure的账号。最重要的是选择gpt-35-turbo-instruct模型、api_version：2023-05-15，就这两个参数谷歌我尝试了很久才成功。我们打开https://portal.azure.com/#home，点击更多服务：我们点击AzureOpenAI：再点击创建： azure访问有点慢，我们等一会后会......
信息传播的AI时代：机器学习赋能新闻出版业的数字化之旅
......
AI 的语言：探索 ChatGPT 提示词
原文：TheLanguageofAI:ExploringthePowerofChatGPT译者：飞龙协议：CCBY-NC-SA4.0第一章：ChatGPT简介ChatGPT是一种人工智能语言模型，具有处理和生成类似人类文本的能力。它是自然语言处理（NLP）和机器学习最新突破的产物，使其成为迄今为止最先进的语言模型之一。ChatGPT......
OpenAI推出VoiceEngine语音引擎技术：让声音更逼真，更富情感
继openAIGPT3.5免登录后，OpenAI最近推出了一款名为VoiceEngine的语音引擎技术，这技术能通过简单的文本输入和15秒的音频样本，就能生成跟原始说话者声音一模一样的语音，不仅逼真，还充满了情感。这VoiceEngine技术，是在2022年末由OpenAI的大佬们开发出来的。现在，它已经运用到了Ope......

关于AI训练数据侵权的碎碎念

相关文章

赞助商

阅读排行