روز رستاخیز قانونی برای ChatGPT AI مولد در صورت سرقت ادبی یا نقض قوانین، به اخلاق AI و قانون هوش مصنوعی هشدار می دهد

آیا هوش مصنوعی مولد مانند ChatGPT وب سایت ها و محتوای ابداع شده انسان را از بین می برد؟ آگاه باش، باش [+] ناراحت، آماده باش

گیتی

در جایی که اعتبار دارد اعتبار بدهید.

این کمی حکمت حکیمانه ای است که شاید شما به گونه ای بزرگ شده اید که به آن اعتقاد راسخ داشته باشید. در واقع، فرد تصور می کند یا تصور می کند که ممکن است همه ما تا حدودی به طور منطقی موافق باشیم که این یک قانون سرانگشتی منصفانه و معقول در زندگی است. وقتی کسی کاری را انجام می دهد که شایسته قدردانی است، مطمئن شوید که به رسمیت شناخته شده است.

دیدگاه مخالف بسیار کمتر قانع کننده به نظر می رسد.

اگر کسی راه می رفت و اصرار داشت که اعتبار باید نه در زمان سررسید اعتبار شناخته شود، خوب، شما ممکن است ادعا کنید که چنین اعتقادی غیر مودبانه و احتمالاً پنهان است. ما اغلب خود را به شدت آشفته می‌بینیم که از کسی که کاری قابل‌توجه انجام داده است، اعتبار فریب داده می‌شود. به جرأت می توانم بگویم که ما به خصوص وقتی دیگران به دروغ اعتبار کار دیگران را می گیرند، بدشان می آید. این یک ضربه دوگانه ناراحت کننده است. کسی که باید اعتبار می گرفت از لحظه حضور در آفتاب محروم می شود. علاوه بر این، فریبکار از کانون توجه لذت می برد، اگرچه آنها به اشتباه ما را فریب می دهند تا از محبت های مطلوب ما سوء استفاده کنیم.

چرا این همه گفتمان در مورد کسب اعتبار از صحیح ترین راه ها و جلوگیری از راه های نادرست و حقیر؟

زیرا به نظر می رسد در مورد جدیدترین فناوری هوش مصنوعی (AI) با مشکل مشابهی روبرو هستیم.

بله، ادعاها حاکی از آن است که این امر به طور قابل اثباتی از طریق نوعی هوش مصنوعی به نام شناخته می شود هوش مصنوعی مولد. دست نوشته‌های زیادی وجود دارد که هوش مصنوعی Generative، داغ‌ترین هوش مصنوعی در اخبار این روزها، قبلاً اعتباری را برای آنچه که شایسته گرفتن اعتبار نیست، به خود اختصاص داده است. و این احتمالا بدتر می شود زیرا هوش مصنوعی مولد به طور فزاینده ای گسترش یافته و مورد استفاده قرار می گیرد. اعتبار هر چه بیشتر به هوش مصنوعی مولد نفوذ می کند، در حالی که متأسفانه آنهایی که به شدت مستحق اعتبار واقعی هستند در گرد و غبار رها می شوند.

راه پیشنهادی من برای بیان واضح این پدیده ادعا شده از طریق دو عبارت جذاب است:

1) سرقت ادبی در مقیاس
2) نقض حق نسخه برداری در مقیاس

من فرض می‌کنم ممکن است به دلیل یک برنامه هوش مصنوعی بسیار محبوب به نام ChatGPT که در نوامبر توسط OpenAI منتشر شد، از هوش مصنوعی آگاه باشید. من به طور لحظه ای در مورد هوش مصنوعی و ChatGPT مولد بیشتر خواهم گفت. در آنجا بمان

بیایید فوراً به اصل موضوع برسیم که انگار بزهای مردم را می گیرد.

برخی به شدت شکایت کرده‌اند که هوش مصنوعی مولد به طور بالقوه انسان‌هایی را که محتوا تولید کرده‌اند از بین می‌برد. ببینید، بیشتر برنامه‌های هوش مصنوعی مولد داده‌هایی هستند که با بررسی داده‌های موجود در اینترنت آموزش داده می‌شوند. بر اساس این داده‌ها، الگوریتم‌ها می‌توانند یک شبکه تطبیق الگوی داخلی گسترده در برنامه هوش مصنوعی ایجاد کنند که متعاقباً می‌تواند محتوای به ظاهر جدیدی تولید کند که به‌طور شگفت‌انگیزی به نظر می‌رسد که به‌جای یک قطعه اتوماسیون توسط دست انسان ابداع شده است.

این شاهکار قابل توجه تا حد زیادی به دلیل استفاده از محتوای اسکن شده اینترنتی است. بدون حجم و غنای محتوای اینترنتی به عنوان منبعی برای آموزش داده، هوش مصنوعی مولد تقریباً خالی خواهد بود و برای استفاده کم یا اصلاً علاقه ای به آن نخواهد داشت. با واداشتن هوش مصنوعی به بررسی میلیون‌ها میلیون سند و متن آنلاین، همراه با انواع محتوای مرتبط، تطبیق الگو به تدریج برای تلاش و تقلید از محتوای تولید شده توسط انسان ایجاد می‌شود.

هرچه محتوای بیشتر مورد بررسی قرار گیرد، احتمال این وجود دارد که تطبیق الگو به میزان قابل توجهی تقویت شود و در تقلید حتی بهتر شود، همه چیز برابر است.

پس این سوال هزار دلاری است:

سوال بزرگ: اگر شما یا دیگران محتوایی در اینترنت دارید که برخی از برنامه‌های هوش مصنوعی مولد بر روی آن آموزش دیده‌اند، احتمالاً بدون اجازه مستقیم شما و شاید کاملاً بدون آگاهی شما این کار را انجام دهند، آیا می‌توانید در مورد هر ارزشی که از آن ناشی می‌شود، بخشی از کیک را دریافت کنید. آن آموزش داده های هوش مصنوعی مولد؟

برخی به شدت استدلال می کنند که تنها پاسخ مناسب این است بله، به ویژه اینکه آن تولیدکنندگان محتوای انسانی واقعاً سزاوار اقدام خود هستند. مسئله این است که شما به سختی می توانید کسی را پیدا کنید که سهم منصفانه خود را به دست آورده باشد، و بدتر از آن، تقریباً هیچ کس هیچ سهمی را به دست نیاورده است. تولیدکنندگان محتوای اینترنتی که ناخواسته و ناآگاهانه مشارکت داشته اند اساساً از اعتبار واقعی خود محروم می شوند.

این ممکن است به عنوان وحشیانه و ظالمانه توصیف شود. ما فقط به بازگشایی حکمت حکیم پرداختیم که باید در جایی که اعتبار است اعتبار داده شود. در مورد هوش مصنوعی مولد، ظاهرا اینطور نیست. به نظر می رسد که قاعده سرانگشتی دیرینه و با فضیلت در مورد اعتبار به طور جدی نقض شده است.

اوه، پاسخ می‌گوید، شما کاملاً اغراق می‌کنید و وضعیت را تحریف می‌کنید. مطمئناً، هوش مصنوعی مولد محتوا را در اینترنت بررسی کرد. مطمئناً، این به‌عنوان بخشی از آموزش داده‌های هوش مصنوعی مولد بسیار مفید بود. مسلماً، اپلیکیشن های مولد چشمگیر هوش مصنوعی امروزی بدون این رویکرد در نظر گرفته شده چندان چشمگیر نخواهند بود. اما وقتی می گویید که به سازندگان محتوا باید اعتبار خاصی داده شود، خیلی زیاده روی کرده اید.

منطق به شرح زیر است. انسان‌ها به اینترنت می‌روند و چیزهایی را از اینترنت یاد می‌گیرند، این کار را به‌طور معمول و بدون هیچ سر و صدایی فی نفسه انجام می‌دهند. شخصی که وبلاگ‌هایی درباره لوله‌کشی می‌خواند و سپس ویدیوهای رایگان در دسترس را برای تعمیر لوله‌کشی تماشا می‌کند، ممکن است روز بعد بیرون برود و به عنوان لوله‌کش کار کند. آیا آنها باید بخشی از حواله مربوط به لوله کشی خود را به وبلاگ نویسی که در مورد نحوه لوله کشی سینک نوشته است، بدهند؟ آیا آنها باید هزینه ای را به وبلاگ نویسی که ویدیوی مراحل تعمیر وان نشتی را به نمایش گذاشته است بپردازند؟

تقریباً قطعاً اینگونه نیست.

آموزش داده های هوش مصنوعی مولد صرفاً وسیله ای برای توسعه الگوها است. تا زمانی که خروجی‌های هوش مصنوعی مولد صرفاً بازگرداندن دقیقاً آنچه مورد بررسی قرار گرفته است نباشد، می‌توانید قانع‌کننده استدلال کنید که آنها «یاد گرفته‌اند» و بنابراین مشمول اعطای اعتبار خاصی به منبع خاصی نیستند. مگر اینکه بتوانید هوش مصنوعی مولد را در انجام یک بازگشت دقیق دستگیر کنید، نشانه ها حاکی از آن است که هوش مصنوعی فراتر از هر منبع خاصی تعمیم یافته است.

هیچ اعتباری به کسی تعلق نمی گیرد. یا، فرض کنید، می توان گفت که اعتبار به همه تعلق می گیرد. متن جمعی و سایر محتوای نوع بشر که در اینترنت یافت می شود اعتبار می یابد. همه ما اعتبار می گیریم. تلاش برای مشخص کردن اعتبار به یک منبع خاص بی معنی است. خوشحال باشید که هوش مصنوعی در حال پیشرفت است و همه بشریت از آن سود خواهند برد. این پست‌ها در اینترنت باید باعث افتخار باشد که به پیشرفت‌های آینده در هوش مصنوعی کمک کرده‌اند و چگونه این امر به بشریت تا ابد کمک خواهد کرد.

من در مورد هر دوی این دیدگاه های متضاد حرف بیشتری برای گفتن خواهم داشت.

در همین حال، آیا شما به سمت اردوگاهی متمایل می شوید که می گوید اعتبار برای کسانی که وب سایت هایی در اینترنت دارند با تأخیر سررسید شده است یا متوجه می شوید که طرف مقابل که می گوید تولیدکنندگان محتوای اینترنتی قاطعانه هستند. نه کنده شدن حالت قانع کننده تری است؟

یک معما و یک معما همه با هم گیر کرده اند.

بیایید این را باز کنیم.

در ستون امروز، به این نگرانی‌های ابراز شده مبنی بر اینکه هوش مصنوعی مولد اساساً سرقت ادبی است یا احتمالاً حق نسخه‌برداری محتوای پست شده در اینترنت (که یک حق مالکیت معنوی یا موضوع IP در نظر گرفته می‌شود) را نقض می‌کند، خواهم پرداخت. ما اساس این شک و تردیدها را بررسی خواهیم کرد. در طول این بحث من گهگاه به ChatGPT اشاره خواهم کرد، زیرا این گوریل 600 پوندی هوش مصنوعی مولد است، هرچند به خاطر داشته باشید که تعداد زیادی اپلیکیشن مولد هوش مصنوعی وجود دارد و آنها عموما بر اساس اصول کلی یکسانی هستند.

در همین حال، ممکن است تعجب کنید که در واقع هوش مصنوعی مولد چیست.

اجازه دهید ابتدا اصول هوش مصنوعی مولد را پوشش دهیم و سپس می‌توانیم نگاهی دقیق به موضوع مهم در دست داشته باشیم.

در همه این موارد، ملاحظات اخلاق هوش مصنوعی و قانون هوش مصنوعی وجود دارد.

لطفاً توجه داشته باشید که تلاش‌های مداومی برای تطبیق اصول هوش مصنوعی اخلاقی در توسعه و پیاده‌سازی برنامه‌های هوش مصنوعی وجود دارد. گروه رو به رشدی از متخصصان اخلاق هوش مصنوعی نگران و قدیمی در تلاش هستند تا اطمینان حاصل کنند که تلاش‌ها برای ابداع و پذیرش هوش مصنوعی، دیدگاهی از انجام دادن را در نظر می‌گیرد. هوش مصنوعی برای خوب و جلوگیری می کند هوش مصنوعی برای بد. به همین ترتیب، قوانین جدید هوش مصنوعی پیشنهاد شده است که به عنوان راه حل‌های بالقوه برای جلوگیری از ابهام کردن تلاش‌های هوش مصنوعی در مورد حقوق بشر و مواردی از این دست، مورد استفاده قرار می‌گیرند. برای پوشش مداوم و گسترده من از اخلاق هوش مصنوعی و قانون هوش مصنوعی، نگاه کنید به پیوند اینجا و پیوند اینجا، فقط به نام چند.

توسعه و انتشار دستورات هوش مصنوعی اخلاقی دنبال می‌شود تا از افتادن جامعه در تله‌های بی‌شمار هوش مصنوعی جلوگیری شود. برای پوشش من از اصول اخلاق هوش مصنوعی سازمان ملل متحد که توسط نزدیک به 200 کشور از طریق تلاش های یونسکو ابداع و حمایت شده است، نگاه کنید به پیوند اینجا. در همین راستا، قوانین جدید هوش مصنوعی در حال بررسی هستند تا سعی شود هوش مصنوعی در یک سطح یکنواخت باقی بماند. یکی از آخرین برداشت ها شامل مجموعه ای از پیشنهادات است منشور حقوق هوش مصنوعی که اخیراً کاخ سفید ایالات متحده برای شناسایی حقوق بشر در عصر هوش مصنوعی منتشر کرده است پیوند اینجا. دهکده ای لازم است تا توسعه دهندگان هوش مصنوعی و هوش مصنوعی را در مسیری درست نگه دارد و از تلاش های غفلت آمیز هدفمند یا تصادفی که ممکن است جامعه را تضعیف کند، بازدارد.

من ملاحظات مربوط به اخلاق هوش مصنوعی و قوانین هوش مصنوعی را در این بحث در هم می آمیزم.

مبانی هوش مصنوعی مولد

شناخته شده ترین نمونه هوش مصنوعی مولد توسط یک برنامه هوش مصنوعی به نام ChatGPT نشان داده می شود. ChatGPT در ماه نوامبر زمانی که توسط شرکت تحقیقاتی AI OpenAI منتشر شد، به آگاهی عمومی رسید. از زمانی که ChatGPT تیترهای بزرگی را به خود اختصاص داد و به طرز شگفت انگیزی از پانزده دقیقه شهرت خود فراتر رفت.

حدس می‌زنم احتمالاً نام ChatGPT را شنیده‌اید یا شاید کسی را بشناسید که از آن استفاده کرده است.

ChatGPT یک برنامه هوش مصنوعی مولد در نظر گرفته می شود زیرا مقداری متن را از یک کاربر و سپس به عنوان ورودی می گیرد تولید می کند یا خروجی ای تولید می کند که از یک مقاله تشکیل شده است. هوش مصنوعی یک تولیدکننده متن به متن است، اگرچه من هوش مصنوعی را به عنوان یک تولیدکننده متن به مقاله توصیف می‌کنم، زیرا به راحتی مشخص می‌کند که معمولاً برای چه مواردی از آن استفاده می‌شود. می‌توانید از هوش مصنوعی مولد برای نوشتن ترکیب‌های طولانی استفاده کنید یا می‌توانید آن را وادار کنید تا نظرات نسبتاً کوتاهی ارائه دهد. همه چیز به درخواست شماست.

تنها کاری که باید انجام دهید این است که یک درخواست وارد کنید و برنامه هوش مصنوعی برای شما مقاله ای ایجاد می کند که سعی می کند به درخواست شما پاسخ دهد. متن ساخته شده به نظر می رسد که گویی مقاله توسط دست و ذهن انسان نوشته شده است. اگر می‌خواهید پیامی را وارد کنید که می‌گوید «درباره آبراهام لینکلن به من بگویید»، هوش مصنوعی مولد مقاله‌ای درباره لینکلن در اختیار شما قرار می‌دهد. حالت های دیگری از هوش مصنوعی مولد وجود دارد، مانند تبدیل متن به هنر و متن به ویدئو. من در اینجا بر روی تغییر متن به متن تمرکز خواهم کرد.

اولین فکر شما ممکن است این باشد که این قابلیت مولد از نظر تولید مقاله چندان مهم به نظر نمی رسد. شما به راحتی می توانید یک جستجوی آنلاین در اینترنت انجام دهید و به راحتی هزاران مقاله در مورد رئیس جمهور لینکلن پیدا کنید. نکته مهم در مورد هوش مصنوعی مولد این است که مقاله تولید شده نسبتاً منحصر به فرد است و یک ترکیب اصلی را به جای یک کپی ارائه می دهد. اگر بخواهید مقاله تولید شده توسط هوش مصنوعی را در جایی آنلاین پیدا کنید، بعید است که آن را کشف کنید.

هوش مصنوعی مولد از قبل آموزش داده شده است و از یک فرمول پیچیده ریاضی و محاسباتی استفاده می کند که با بررسی الگوها در کلمات نوشته شده و داستان ها در سراسر وب تنظیم شده است. در نتیجه بررسی هزاران و میلیون‌ها متن نوشته شده، هوش مصنوعی می‌تواند مقالات و داستان‌های جدیدی را منتشر کند که ترکیبی از آنچه پیدا شده است. با افزودن عملکردهای احتمالی مختلف، متن حاصل در مقایسه با آنچه در مجموعه آموزشی استفاده شده است، تقریباً منحصر به فرد است.

نگرانی های زیادی در مورد هوش مصنوعی مولد وجود دارد.

یکی از نکات منفی مهم این است که مقالات تولید شده توسط یک برنامه هوش مصنوعی مبتنی بر مولد می‌توانند دارای کاذب‌های مختلفی باشند، از جمله حقایق آشکارا نادرست، حقایقی که به‌طور گمراه‌کننده به تصویر کشیده شده‌اند، و حقایق ظاهری که کاملاً ساختگی هستند. آن جنبه های ساختگی اغلب به عنوان شکلی از نامیده می شود توهمات هوش مصنوعیجملاتی که من از آن خوشم نمی‌آیند، اما به نظر می‌رسد که به هر حال با کمال تاسف در حال جلب توجه مردم است (برای توضیح دقیق من در مورد اینکه چرا این اصطلاحات بد و نامناسب است، به پوشش من در پیوند اینجا).

نگرانی دیگر این است که انسان‌ها به راحتی می‌توانند برای مقاله تولید شده توسط هوش مصنوعی اعتبار بگیرند، علیرغم اینکه خود مقاله را ننوشته‌اند. شاید شنیده باشید که معلمان و مدارس کاملاً نگران ظهور اپلیکیشن‌های هوش مصنوعی هستند. دانش آموزان به طور بالقوه می توانند از هوش مصنوعی مولد برای نوشتن مقالات اختصاص داده شده خود استفاده کنند. اگر دانش آموزی ادعا کند که مقاله ای با دست خودش نوشته شده است، احتمال کمی وجود دارد که معلم بتواند تشخیص دهد که آیا در عوض توسط هوش مصنوعی ساخته شده است یا خیر. برای تجزیه و تحلیل من از این جنبه گیج کننده دانش آموز و معلم، به پوشش من در اینجا مراجعه کنید پیوند اینجا و پیوند اینجا.

در مورد این موضوع در شبکه‌های اجتماعی ادعاهای بزرگی وجود دارد هوش مصنوعی مولد ادعا می کند که این آخرین نسخه از هوش مصنوعی در واقع است هوش مصنوعی حساس (نه، آنها اشتباه می کنند!). کسانی که در اخلاق هوش مصنوعی و قانون هوش مصنوعی هستند به طور مشخص نگران این روند رو به رشد ادعاهای گسترده هستند. ممکن است مودبانه بگویید که برخی افراد درباره آنچه که هوش مصنوعی امروزی واقعاً می تواند انجام دهد اغراق می کنند. آنها تصور می کنند که هوش مصنوعی دارای قابلیت هایی است که ما هنوز نتوانسته ایم به آنها دست پیدا کنیم. این مایه تاسف است. بدتر از آن، آن‌ها می‌توانند به خود و دیگران اجازه دهند در موقعیت‌های وخیم قرار بگیرند، زیرا این تصور وجود دارد که هوش مصنوعی هوشیار یا انسان‌مانند خواهد بود تا بتواند اقدامی انجام دهد.

هوش مصنوعی را انسان سازی نکنید.

انجام این کار شما را در یک تله اتکای چسبناک و بی حوصله گرفتار می کند که انتظار دارید هوش مصنوعی کارهایی را انجام دهد که قادر به انجام آن نیست. با توجه به آنچه گفته شد، جدیدترین هوش مصنوعی مولد برای کارهایی که می تواند انجام دهد نسبتاً چشمگیر است. البته توجه داشته باشید که محدودیت های قابل توجهی وجود دارد که باید به طور مداوم هنگام استفاده از هر برنامه هوش مصنوعی مولد در نظر داشته باشید.

یک هشدار نهایی در حال حاضر.

هر آنچه را که در یک پاسخ هوش مصنوعی مولد می بینید یا می خوانید به نظر می رسد برای اینکه کاملاً واقعی باشد (تاریخ، مکان ها، افراد و غیره)، مطمئن شوید که شک دارید و مایل باشید آنچه را می بینید دوباره بررسی کنید.

بله، خرما را می توان جعل کرد، مکان ها را می توان ساخت، و عناصری که معمولاً انتظار داریم بیش از حد ملامت باشند. تمام در معرض سوء ظن آنچه را که می خوانید باور نکنید و هنگام بررسی هر مقاله یا خروجی هوش مصنوعی با شک و تردید نگاه کنید. اگر یک اپلیکیشن مولد هوش مصنوعی به شما بگوید که آبراهام لینکلن با جت شخصی خود در سراسر کشور پرواز کرده است، بدون شک متوجه خواهید شد که این یک بیماری ناخوشایند است. متأسفانه، برخی از مردم ممکن است متوجه نباشند که جت‌ها در زمان او وجود نداشتند، یا ممکن است بدانند اما متوجه این موضوع نشوند که این مقاله این ادعای گستاخانه و به‌شدت نادرست را دارد.

دوز قوی از شک و تردید سالم و ذهنیت ناباوری مداوم بهترین دارایی شما در هنگام استفاده از هوش مصنوعی مولد خواهد بود.

ما آماده هستیم تا وارد مرحله بعدی این شفاف سازی شویم.

اینترنت و هوش مصنوعی مولد با هم هستند

اکنون که شباهتی از هوش مصنوعی مولد دارید، می‌توانیم این سؤال آزاردهنده را بررسی کنیم که آیا هوش مصنوعی مولد به طور منصفانه یا غیرمنصفانه «اهرم‌کننده» است یا برخی می‌گویند آشکارا بهره برداری از محتوای اینترنتی

در اینجا چهار موضوع حیاتی من در رابطه با این موضوع وجود دارد:

1) مشکل دوگانه: سرقت ادبی و نقض حق نسخه برداری
2) تلاش برای اثبات سرقت ادبی یا نقض حق نسخه برداری تلاش خواهد شد
3) تشکیل پرونده برای سرقت ادبی یا نقض حق چاپ
4) مین های زمینی قانونی در انتظار هستند

من هر یک از این موضوعات مهم را پوشش خواهم داد و ملاحظات روشنگرانه ای را ارائه خواهم داد که همه ما باید با دقت در مورد آنها فکر کنیم. هر یک از این موضوعات بخشی جدایی ناپذیر از یک پازل بزرگتر است. شما نمی توانید فقط به یک قطعه نگاه کنید. همچنین نمی توانید به هیچ قطعه ای جدا از قطعات دیگر نگاه کنید.

این یک موزاییک پیچیده است و کل پازل باید به طور هماهنگ در نظر گرفته شود.

مشکل مضاعف: سرقت ادبی و نقض حق چاپ

مشکل مضاعف پیش روی آنهایی که هوش مصنوعی مولد می سازند و به میدان می آورند این است که کالاهای آنها ممکن است دو کار بد انجام دهند:

1) سرقت ادبی هوش مصنوعی مولد را می توان به این صورت تعبیر کرد سرقت ادبی محتوایی که بر اساس اسکن اینترنتی که در طول آموزش داده های هوش مصنوعی انجام شده، در اینترنت وجود دارد.
2) نقض حق چاپ هوش مصنوعی مولد را می توان به عنوان یک تعهد ادعا کرد نقض قوانین حق تکثیر مرتبط با محتوای اینترنتی است که در طول آموزش داده اسکن شده است.

برای روشن‌تر شدن، محتوای بسیار بیشتری در اینترنت نسبت به آنچه که معمولاً برای آموزش داده‌های هوش مصنوعی مولد اسکن می‌شود، وجود دارد. معمولاً فقط بخش کوچکی از اینترنت استفاده می شود. بنابراین، احتمالاً می‌توان فرض کرد که هر محتوایی که در طول آموزش داده اسکن نشده است، گوشت گاو خاصی با هوش مصنوعی مولد ندارد.

اگرچه این موضوع تا حدودی قابل بحث است زیرا می‌توانید به طور بالقوه خطی بکشید که محتوای دیگر اسکن شده را با محتوای اسکن نشده مرتبط کند. همچنین، شرط مهم دیگر این است که حتی اگر محتوایی وجود داشته باشد که اسکن نشده باشد، اگر خروجی‌های هوش مصنوعی مولد در همان لغت ظاهر شوند، همچنان می‌توان به عنوان سرقت ادبی و/یا نقض حق نسخه‌برداری استدلال کرد. حرف من این است که در همه اینها لجن زنی زیاد است.

خط پایین: هوش مصنوعی مولد مملو از معماهای قانونی بالقوه اخلاقی و حقوق هوش مصنوعی در مورد سرقت ادبی و نقض حق نسخه برداری است. زیربنای شیوه های رایج آموزش داده.

تاکنون، سازندگان هوش مصنوعی و محققان هوش مصنوعی با وجود شمشیر آویزان و آویزان که بالای سرشان آویزان است، تقریباً بدون اسکی از این اسکیت عبور کرده‌اند. تنها چند شکایت تا به امروز علیه این اقدامات آغاز شده است. ممکن است مقالات خبری در مورد چنین اقدامات قانونی را شنیده یا دیده باشید. برای مثال، یکی شرکت‌های تبدیل متن به تصویر Midjourney و Stability AI را به دلیل نقض محتوای هنری منتشر شده در اینترنت درگیر می‌کند. مورد دیگر شامل نقض متن به کد علیه GitHub، مایکروسافت و OpenAI به دلیل نرم افزار Copilot است که برنامه های هوش مصنوعی را تولید می کند. Getty Images همچنین قصد دارد از هوش مصنوعی پایداری برای نقض متن به تصویر استفاده کند.

می‌توانید پیش‌بینی کنید که پرونده‌های اینچنینی بیشتری تشکیل شود.

در حال حاضر، راه اندازی این دعاوی کمی امکان پذیر است زیرا نتیجه نسبتاً ناشناخته است. آیا دادگاه طرفدار سازندگان هوش مصنوعی خواهد بود یا کسانی که معتقدند محتوای آنها به طور ناعادلانه مورد سوء استفاده قرار گرفته است پیروز خواهند شد؟ یک نبرد حقوقی پرهزینه همیشه یک موضوع جدی است. صرف هزینه های حقوقی در مقیاس بزرگ باید با شانس برنده شدن یا باخت سنجیده شود.

به نظر می رسد سازندگان هوش مصنوعی چاره ای جز مبارزه ندارند. اگر بخواهند حتی اندکی تسلیم شوند، احتمال این وجود دارد که سیلی از شکایت های اضافی منجر شود (در اصل، در را به روی شانس بیشتری برای غلبه دیگران باز می کند). هنگامی که خون قانونی در آب وجود دارد، کوسه های قانونی باقی مانده به «امتیاز آسان» در نظر گرفته می شوند و مطمئناً یک حمام خون پولی کوبنده و کوبنده رخ خواهد داد.

برخی معتقدند که ما باید قوانین جدیدی را برای هوش مصنوعی تصویب کنیم که از سازندگان هوش مصنوعی محافظت کند. حفاظت حتی ممکن است عطف به ماسبق باشد. اساس این کار این است که اگر می‌خواهیم پیشرفت‌های مولد هوش مصنوعی را ببینیم، باید به سازندگان هوش مصنوعی مقداری باند منطقه امن بدهیم. هنگامی که شکایت‌ها علیه سازندگان هوش مصنوعی شروع به پیروزی می‌کنند، اگر این اتفاق بیفتد (هنوز نمی‌دانیم)، نگرانی این است که هوش مصنوعی مولد از بین می‌رود زیرا هیچ‌کس حاضر به حمایت از شرکت‌های هوش مصنوعی نخواهد بود.

همانطور که در مقاله اخیر قانون بلومبرگ با عنوان "ChatGPT: IP، امنیت سایبری و سایر خطرات قانونی هوش مصنوعی مولد" توسط دکتر ایلیا کولوچنکو و گوردون پلات، قانون بلومبرگ، فوریه 2023 اشاره شده است، در اینجا دو گزیده حیاتی وجود دارد که این دیدگاه ها را منعکس می کنند:

اکنون بحث داغی بین محققان حقوقی ایالات متحده و اساتید حقوق IP در مورد اینکه آیا حذف غیرمجاز و استفاده متعاقب آن از داده‌های دارای حق چاپ به منزله نقض حق نسخه‌برداری است، در جریان است. اگر دیدگاه دست اندرکاران حقوقی که شاهد نقض حق چاپ در چنین رویه ای هستند، غالب باشد، کاربران چنین سیستم های هوش مصنوعی نیز ممکن است مسئول نقض ثانویه باشند و به طور بالقوه با عواقب قانونی مواجه شوند.
برای رسیدگی جامع به این چالش، قانونگذاران نه تنها باید قوانین کپی رایت موجود را مدرن‌سازی کنند، بلکه باید مجموعه‌ای از قوانین و مقررات ویژه هوش مصنوعی را نیز اجرا کنند.»

به یاد بیاورید که ما به عنوان یک جامعه حمایت های قانونی را برای آن ها در نظر گرفتیم توسعه از اینترنت، همانطور که اکنون توسط دادگاه عالی در حال بررسی بخش معروف یا بدنام 230 مشاهده می شود. بنابراین، به نظر می رسد در حد منطق و سابقه است که ممکن است مایل به انجام برخی محافظت های مشابه برای پیشرفت هوش مصنوعی باشیم. شاید بتوان حفاظت ها را به طور موقت تنظیم کرد و پس از اینکه هوش مصنوعی مولد به سطحی از مهارت از پیش تعیین شده رسید، منقضی می شود. سایر مقررات حفاظتی می تواند ابداع شود.

من به زودی تجزیه و تحلیل خود را از چگونگی تأثیر ارزیابی دیوان عالی و حکم نهایی در مورد بخش 230 بر ظهور هوش مصنوعی مولد ارسال خواهم کرد. منتظر آن پست بعدی باشید!

برگردیم به این عقیده که به شدت ابراز شده است که ما باید برای نوآوری تکنولوژیکی الهام‌بخش اجتماعی که به عنوان هوش مصنوعی مولد شناخته می‌شود، آزادی عمل بدهیم. برخی می‌گویند که حتی اگر نقض حق نسخه‌برداری ادعا شده رخ داده باشد یا در حال وقوع باشد، جامعه به‌عنوان یک کل باید مایل باشد که این اجازه را برای اهداف خاص پیشرفت هوش مصنوعی مولد بدهد.

امید این است که قوانین جدید هوش مصنوعی به دقت تدوین و با جزئیات مرتبط با آموزش داده برای هوش مصنوعی مولد تنظیم شوند.

استدلال‌های متقابل زیادی برای این مفهوم وجود دارد که قوانین جدید هوش مصنوعی برای این منظور ابداع می‌کند. یکی از نگرانی‌ها این است که هر گونه قانون جدید هوش مصنوعی دریچه‌هایی را برای هر گونه نقض حق چاپ باز می‌کند. ما از روزی که اجازه دادیم چنین قوانین جدید هوش مصنوعی در کتاب ها قرار بگیرد، ناراحت خواهیم شد. مهم نیست که چقدر سعی می کنید این را فقط به آموزش داده های هوش مصنوعی محدود کنید، دیگران به صورت مخفیانه یا هوشمندانه حفره هایی را پیدا می کنند که منجر به نقض بی حد و حصر حق نسخه برداری می شود.

بحث ها را دور و بر بچرخانید.

یکی از استدلال‌هایی که به‌ویژه قابل اعتماد نیست، به تلاش برای شکایت از خود هوش مصنوعی مربوط می‌شود. توجه داشته باشید که من از سازنده هوش مصنوعی یا محققان هوش مصنوعی به عنوان سهامداران مقصر یاد می کنم. این افراد و شرکت ها هستند. برخی پیشنهاد می کنند که ما باید هوش مصنوعی را به عنوان طرفی که مورد شکایت قرار می گیرد، هدف قرار دهیم. من به طور طولانی در ستون خود بحث کرده ام که ما هنوز شخصیت حقوقی را به هوش مصنوعی نسبت نمی دهیم پیوند اینجا به عنوان مثال، و بنابراین چنین دعواهایی با هدف فی نفسه هوش مصنوعی در حال حاضر بی معنی تلقی می شوند.

به عنوان یک ضمیمه به این سوال که چه کسی یا چه چیزی باید مورد شکایت قرار گیرد، این موضوع آبدار دیگری را مطرح می کند.

فرض کنید یک برنامه هوش مصنوعی مولد خاص توسط برخی از سازنده های هوش مصنوعی ابداع شده است که ما آن را شرکت ویجت می نامیم. شرکت ویجت از نظر اندازه نسبتاً کوچک است و نه درآمد زیادی دارد و نه از نظر دارایی. شکایت از آنها به احتمال زیاد ثروت کلانی را که ممکن است فرد به دنبال آن باشد به دست نمی آورد. حداکثر، شما صرفاً از اصلاح آنچه اشتباه می‌بینید، رضایت خواهید داشت.

میخوای بری دنبال ماهی بزرگ

در اینجا نحوه ایجاد آن است. یک سازنده هوش مصنوعی تصمیم می گیرد هوش مصنوعی مولد خود را در اختیار شرکت Big Time قرار دهد، یک مجموعه بزرگ با هزاران خمیر و دارایی های فراوان. طرح دعوی قضایی با نام شرکت ویجت اکنون هدف بهتری را در نظر دارد، یعنی همچنین با نام شرکت بیگ تایم. این مبارزه داوود و جالوت است که وکلا از آن لذت می برند. البته، شرکت بیگ تایم بدون شک تلاش خواهد کرد تا قلاب ماهیگیری را تکان دهد. اینکه آیا آنها می توانند این کار را انجام دهند یک بار دیگر یک سؤال حقوقی است که نامشخص است، و ممکن است به طرز ناامیدانه ای در لجنزار غرق شوند.

قبل از اینکه خیلی بیشتر به این موضوع بپردازیم، می‌خواهم در مورد تجاوزات احتمالی هوش مصنوعی مولد به دلیل آموزش داده، چیز مهمی را روی میز بیاورم. من مطمئن هستم که شما به طور شهودی متوجه شده اید که سرقت ادبی و نقض حق چاپ دو حیوان تا حدودی متفاوت هستند. آنها اشتراکات زیادی دارند، اگرچه تفاوت های چشمگیری نیز دارند.

در اینجا یک توضیح مختصر از دانشگاه دوک آمده است که این دو را توضیح می دهد:

"سرقت ادبی به بهترین وجه به عنوان استفاده ناشناخته از کار شخص دیگر تعریف می شود. این یک موضوع اخلاقی است که شامل ادعای اعتبار برای کاری است که مدعی ایجاد نکرده است. بدون در نظر گرفتن وضعیت کپی رایت آن اثر، می‌توان آثار دیگران را سرقت ادبی کرد. برای مثال، با این وجود، کپی برداری از کتاب یا مقاله ای که خیلی قدیمی است و هنوز تحت کپی رایت نیست، سرقت ادبی است. همچنین استفاده از داده های گرفته شده از یک منبع ناشناس سرقت ادبی است، حتی اگر مطالب واقعی مانند داده ها توسط حق چاپ محافظت نشود. با این حال، سرقت ادبی به راحتی قابل درمان است - استناد مناسب به منبع اصلی مطالب.
از سوی دیگر، نقض حق چاپ، استفاده غیرمجاز از کار دیگری است. این یک موضوع حقوقی است که به این بستگی دارد که آیا اثر در وهله اول توسط حق چاپ محافظت می شود یا نه، و همچنین به موارد خاصی مانند میزان استفاده و هدف استفاده بستگی دارد. اگر فردی بیش از حد از یک اثر محافظت شده کپی کند یا برای هدفی غیرمجاز کپی کند، صرفاً تأیید منبع اصلی مشکل را حل نمی کند. تنها با گرفتن مجوز قبلی از دارنده حق چاپ، از خطر اتهام نقض جلوگیری می شود.

من به اهمیت این دو نگرانی اشاره می کنم تا متوجه شوید که راه حل ها می توانند بر این اساس متفاوت باشند. همچنین، هر دوی آنها درگیر ملاحظاتی هستند که اخلاق هوش مصنوعی و قانون هوش مصنوعی را در بر می‌گیرد و بررسی آنها را به همان اندازه ارزشمند می‌کند.

بیایید یک درمان یا راه حل ادعا شده را بررسی کنیم. خواهید دید که ممکن است به یکی از مشکلات مضاعف کمک کند، اما به دیگری کمک نمی کند.

برخی اصرار دارند که تنها کاری که سازندگان هوش مصنوعی باید انجام دهند این است که منابع خود را ذکر کنند. هنگامی که هوش مصنوعی مولد مقاله ای را تولید می کند، صرفاً استنادهای خاصی را برای هر آنچه در مقاله بیان شده است درج کنید. نشانی‌های اینترنتی مختلف و سایر نشانه‌هایی که از محتوای اینترنتی استفاده شده را ارائه دهید. به نظر می رسد که این باعث می شود آنها از شک و تردید در مورد سرقت ادبی خلاص شوند. احتمالاً مقاله خروجی به وضوح مشخص می کند که از چه منابعی برای عبارتی که تولید می شود استفاده شده است.

در آن راه‌حل ادعا شده، ایراداتی وجود دارد، اما در سطح 30,000 فوتی، بیایید بگوییم که به عنوان یک درمان نیمه رضایت‌بخش برای معضل سرقت ادبی عمل می‌کند. همانطور که در بالا در توضیح نقض حق چاپ بیان شد، ذکر منبع منبع لزوماً شما را از خانه سگ خارج نمی کند. با فرض اینکه محتوا دارای حق چاپ است، و بسته به عوامل دیگری مانند میزان استفاده از مطالب، شمشیر انتظار نقض حق چاپ می تواند به شدت و با قطعیت به سمت پایین حرکت کند.

مشکل مضاعف کلمه اصلی اینجاست.

تلاش برای اثبات سرقت ادبی یا نقض حق نسخه برداری تلاش خواهد شد

امتحان کن

این همان آهنگ فرسوده ای است که همه ما در زمان های مختلف زندگی خود شنیده ایم.

میدونی چطور پیش میره ممکن است ادعا کنید که چیزی در حال وقوع است یا اتفاق افتاده است. شما ممکن است در قلب خود بدانید که این اتفاق افتاده است. اما وقتی نوبت به هل دادن در مقابل هل دادن می‌رسد، باید مدرک آن را داشته باشید.

در اصطلاح امروزی، باید نشان دهید رسیدهمانطور که می گویند.

سوال من از شما این است: چگونه می‌خواهیم ثابت کنیم که هوش مصنوعی مولد به‌طور نامناسبی از محتوای اینترنت بهره‌برداری کرده است؟

یکی فرض می کند که پاسخ باید آسان باشد. شما از هوش مصنوعی مولد می خواهید یا می گویید که یک مقاله خروجی تولید کند. سپس مقاله را بردارید و آن را با آنچه در اینترنت یافت می شود مقایسه کنید. اگر مقاله را پیدا کردید، بم، هوش مصنوعی مولد را به دیوار ضرب المثل میخکوب کرده اید.

به نظر می رسد زندگی هرگز به این آسانی نبوده است.

تصور کنید که ما برای تولید مقاله ای حاوی حدود 100 کلمه، هوش مصنوعی تولید کنیم. ما به اطراف می‌گردیم و سعی می‌کنیم به تمام گوشه‌ها و گوشه‌های اینترنت دسترسی پیدا کنیم و آن 100 کلمه را جستجو کنیم. اگر 100 کلمه را پیدا کنیم که دقیقاً به همان ترتیب نشان داده شده اند و به روشی یکسان نشان داده شده اند، به نظر می رسد که خودمان را داغ کرده ایم.

فرض کنید که ما در اینترنت مقاله ای به ظاهر «مقایسه» پیدا می کنیم، اگرچه فقط با 80 کلمه از 100 کلمه مطابقت دارد. این شاید هنوز کافی به نظر می رسد. اما تصور کنید که ما فقط یک نمونه از 10 کلمه از 100 کلمه را پیدا کنیم. آیا این برای ادعای اینکه سرقت ادبی رخ داده است یا نقض حق چاپ کافی است؟

خاکستری وجود دارد.

متن از این طریق خنده دار است.

این را با شرایط تبدیل متن به تصویر یا متن به هنر مقایسه کنید. هنگامی که هوش مصنوعی مولد قابلیت تبدیل متن به تصویر یا متن به هنر را فراهم می کند، یک پیام متنی را وارد می کنید و برنامه هوش مصنوعی تا حدودی بر اساس درخواستی که شما ارائه کرده اید، تصویری تولید می کند. این تصویر ممکن است متفاوت از هر تصویری باشد که تاکنون در این سیاره یا هر سیاره دیگری دیده شده است.

از سوی دیگر، تصویر ممکن است یادآور تصاویر دیگری باشد که وجود دارند. ما می‌توانیم به تصویر تولید شده توسط هوش مصنوعی نگاه کنیم و تا حدودی به‌طور غریزی بگوییم که مطمئناً شبیه تصویر دیگری است که قبلاً دیده‌ایم. به طور کلی، بصری جنبه های مقایسه و کنتراست کمی آسان تر انجام می شود. همانطور که گفته شد، لطفاً بدانید که بحث‌های حقوقی عظیم تضمین می‌کند که چه چیزی همپوشانی یا تکرار یک تصویر از تصویر دیگر را تشکیل می‌دهد.

وضعیت مشابه دیگری در مورد موسیقی وجود دارد. برنامه‌های هوش مصنوعی مولد هستند که به شما امکان می‌دهند یک پیام متنی را وارد کنید و خروجی تولید شده توسط هوش مصنوعی موسیقی صوتی است. این قابلیت‌های هوش مصنوعی تبدیل متن به صدا یا متن به موسیقی در حال حاضر شروع به ظهور کرده‌اند. یکی از چیزهایی که می‌توانید روی دلار برتر خود شرط بندی کنید این است که موسیقی تولید شده توسط هوش مصنوعی مولد به شدت برای نقض مورد بررسی قرار می‌گیرد. به نظر می‌رسد که وقتی نقض موسیقی را می‌شنویم، می‌دانیم، اگرچه دوباره این یک مسئله حقوقی پیچیده است که فقط بر اساس احساس ما در مورد تکرار درک شده نیست.

یک مثال دیگر به من اجازه دهید.

هوش مصنوعی مولد متن به کد این امکان را برای شما فراهم می کند که یک پیام متنی را وارد کنید و هوش مصنوعی کد برنامه نویسی را برای شما تولید می کند. سپس می توانید از این کد برای تهیه یک برنامه کامپیوتری استفاده کنید. ممکن است از کد دقیقاً همانطور که ایجاد شده است استفاده کنید، یا ممکن است تصمیم بگیرید که کد را مطابق با نیاز خود ویرایش و تنظیم کنید. همچنین باید مطمئن شوید که کد مناسب و قابل اجرا است زیرا ممکن است خطاها و نادرستی ها در کد تولید شده ایجاد شود.

اولین فرض شما ممکن است این باشد که کد برنامه نویسی تفاوتی با متن ندارد. فقط متن است مطمئناً، این متنی است که هدف خاصی را ارائه می دهد، اما همچنان متن است.

خوب، نه دقیقا. اکثر زبان های برنامه نویسی فرمت و ساختار دقیقی نسبت به ماهیت عبارات برنامه نویسی آن زبان دارند. این به یک معنا بسیار محدودتر از زبان طبیعی روان است. شما تا حدودی در مورد نحوه فرمول بندی عبارات کدگذاری مطلع هستید. به همین ترتیب، توالی و روشی که در آن عبارات استفاده و آرایه می شوند تا حدودی در کادر قرار می گیرند.

در مجموع، امکان نشان دادن اینکه کد برنامه‌نویسی سرقت ادبی یا نقض شده است، تقریباً ساده‌تر از آنچه در زبان طبیعی گفته می‌شود، است. بنابراین، هنگامی که یک هوش مصنوعی مولد به اسکن کد برنامه نویسی در اینترنت می پردازد و بعداً کد برنامه نویسی را تولید می کند، احتمال اینکه این کد به طور آشکار تکرار شده است نسبتاً قانع کننده تر خواهد بود. نه یک اسلم دانک، بنابراین انتظار داشته باشید که نبردهای تلخی در این مورد انجام شود.

نکته کلی من این است که ما قرار است مسائل اخلاقی هوش مصنوعی و قوانین هوش مصنوعی مشابهی را داشته باشیم که با همه حالت‌های هوش مصنوعی مولد مواجه است.

سرقت ادبی و نقض حق چاپ برای موارد زیر مشکل ساز خواهد بود:

متن به متن یا متن به مقاله
متن به تصویر یا متن به هنر
متن به صدا یا متن به موسیقی
متن به ویدئو
متن به کد
غیره

همه آنها در معرض یک نگرانی هستند. ممکن است "اثبات" برخی از آنها کمی ساده تر از دیگران باشد. همه آن‌ها کابوس‌های متنوع خود را در زمینه اخلاق هوش مصنوعی و قوانین هوش مصنوعی خواهند دید.

تشکیل پرونده برای سرقت ادبی یا نقض حق چاپ

برای اهداف بحث، بیایید روی هوش مصنوعی تولیدی متن به متن یا متن به مقاله تمرکز کنیم. من این کار را تا حدی به دلیل محبوبیت فوق‌العاده ChatGPT انجام می‌دهم، که نوع متن به متن هوش مصنوعی مولد است. افراد زیادی هستند که از ChatGPT استفاده می کنند و بسیاری دیگر از برنامه های مشابه AI تولید کننده متن به متن استفاده می کنند.

آیا افرادی که از برنامه‌های هوش مصنوعی مولد استفاده می‌کنند می‌دانند که به طور بالقوه به سرقت ادبی یا نقض حق نسخه‌برداری متکی هستند؟

به نظر می رسد که آنها مشکوک هستند.

به جرات می توانم بگویم که فرض غالب این است که اگر برنامه هوش مصنوعی مولد برای استفاده در دسترس باشد، سازنده هوش مصنوعی یا شرکتی که هوش مصنوعی را ارائه کرده است باید بداند یا مطمئن باشد که هیچ چیز ناخوشایندی در مورد کالاهایی که برای استفاده ارائه می دهند وجود ندارد. اگر می توانید از آن استفاده کنید، باید در بالای صفحه باشد.

بیایید نظر قبلی خود را در مورد اینکه چگونه می‌خواهیم تلاش کنیم و ثابت کنیم که یک هوش مصنوعی مولد خاص بر مبنای اشتباهی در مورد آموزش داده کار می‌کند، دوباره مرور کنیم.

همچنین می‌توانم اضافه کنم که اگر بتوانیم یک هوش مصنوعی مولد را در حال انجام این کار بگیریم، احتمال دستگیری دیگران افزایش می‌یابد. من نمی گویم که همه برنامه های هوش مصنوعی مولد در یک قایق باشند. اما زمانی که یکی از آنها به دیوار چسبانده شود، خود را در دریاهای نسبتاً خشن خواهند یافت.

به همین دلیل است که توجه به دعاوی موجود نیز بسیار ارزشمند خواهد بود. اولین موردی که در مورد نقض ادعا شده برنده می‌شود، اگر این اتفاق بیفتد، احتمالاً برای سایر برنامه‌های هوش مصنوعی مولد عذاب و تاسف خواهد بود، مگر اینکه محدودیت‌هایی از مشکلات گسترده‌تر در دست فرار کند. آنهایی که در مورد نقض ادعا شده ضرر می کنند لزوماً به این معنی نیست که برنامه های هوش مصنوعی مولد می توانند زنگ ها را به صدا درآورند و جشن بگیرند. ممکن است این ضرر به عوامل دیگری نسبت داده شود که به سایر برنامه های هوش مصنوعی مولد مرتبط نیستند و غیره.

اشاره کرده بودم که اگر یک مقاله 100 کلمه‌ای بگیریم و سعی کنیم دقیقاً همان کلمات را در اینترنت پیدا کنیم، ممکن است یک مورد نسبتاً محکم برای سرقت ادبی یا نقض حق چاپ داشته باشیم، در حالی که همه چیز برابر است. اما اگر تعداد کلماتی که مطابقت دارند کم باشد، به نظر می رسد که روی یخ نازک هستیم.

من می خواهم عمیق تر در آن کاوش کنم.

یکی از جنبه‌های آشکار مقایسه، عبارت است از همان کلمات در همان دنباله. این ممکن است برای کل پاساژها رخ دهد. این می تواند راحت تشخیص داده شود، تقریباً مانند این است که در یک بشقاب نقره ای به ما تحویل داده شود.

اگر فقط تکه ای از کلمات مطابقت داشته باشد، ممکن است مشکوک باشیم. ایده این است که ببینیم آیا آنها کلمات مهمی هستند یا شاید کلمات پرکننده ای هستند که می توانیم به راحتی حذف یا نادیده بگیریم. ما همچنین نمی‌خواهیم با استفاده از کلمات در زمان گذشته یا آینده آنها یا یک حماقت دیگر فریب بخوریم. این تغییرات در کلمات نیز باید در نظر گرفته شود.

سطح دیگری از مقایسه زمانی است که کلمات به طور خاص تا حد زیادی یکسان نیستند، با این حال به نظر می‌رسد که کلمات حتی در حالت‌های متنوع هنوز همان نکات را بیان می‌کنند. به عنوان مثال، یک خلاصه معمولاً از کلمات کاملاً مشابه به عنوان منبع اصلی استفاده می کند، اما می توانیم تشخیص دهیم که خلاصه به نظر می رسد بر اساس منبع اصلی باشد.

سخت ترین سطح مقایسه بر اساس مفاهیم یا ایده ها خواهد بود. فرض کنید مقاله‌ای را می‌بینیم که کلمات مشابه یا مشابهی برای مقایسه ندارد، اما اصل یا ایده‌ها یکی هستند. مسلماً ما در حال ورود به قلمروی ناهموار هستیم. اگر بخواهیم به آسانی بگوییم که ایده‌ها از نزدیک محافظت می‌شوند، تقریباً همه اشکال دانش و گسترش دانش را می‌پوشانیم.

می توانیم یک بار دیگر به توضیح مفیدی از دانشگاه دوک اشاره کنیم:

«حق کپی رایت از ایده ها محافظت نمی کند، فقط از بیان خاص یک ایده محافظت می کند. برای مثال، دادگاهی تصمیم گرفت که دن براون هنگام نوشتن، حق چاپ کتاب قبلی را نقض نکرده است رمز داوینچی زیرا تمام چیزی که او از کار قبلی وام گرفته بود، ایده های اساسی بود، نه جزئیات طرح یا دیالوگ. از آنجایی که حق چاپ به منظور تشویق تولید خلاقانه است، استفاده از ایده های دیگران برای ایجاد یک اثر جدید و اصیل، هدف کپی رایت را حفظ می کند، آن را نقض نمی کند. تنها در صورتی که یکی بدون اجازه از بیان دیگری کپی کند، حق نسخه‌برداری بالقوه نقض می‌شود.»
از سوی دیگر، برای جلوگیری از سرقت ادبی، باید منشأ ایده‌هایی را که از شخص دیگری به عاریت گرفته شده‌اند، بدون توجه به اینکه بیان آن ایده‌ها با آن‌ها وام گرفته شده است، شناسایی کرد. بنابراین، نقل قول نیاز به استناد دارد، حتی اگر به ندرت مشکل حق چاپ را ایجاد کند.

لطفاً توجه داشته باشید که قبلاً تفاوت‌های بین جنبه‌های مشکل مضاعف را شناسایی کردیم.

اکنون پس از آن، عملی کردن رویکردهای مقایسه ای چیزی است که سال هاست در حال انجام است. اینجوری بهش فکر کن دانش‌آموزانی که برای تکالیف مدرسه خود مقاله می‌نویسند ممکن است وسوسه شوند که محتوا را از اینترنت بگیرند و وانمود کنند که کلمات برنده جایزه پولیتزر درجه A را نوشته‌اند.

معلمان برای مدت طولانی از برنامه های بررسی سرقت ادبی برای مقابله با این موضوع استفاده می کنند. یک معلم مقاله دانش آموز را می گیرد و آن را به چک کننده سرقت ادبی می دهد. در برخی موارد، کل مدرسه مجوز استفاده از یک برنامه بررسی سرقت ادبی را صادر می کند. هر زمان که دانش‌آموزان مقاله‌ای را تحویل می‌دهند، ابتدا باید مقاله را به برنامه بررسی سرقت ادبی ارسال کنند. معلم از آنچه برنامه گزارش می دهد مطلع می شود.

متأسفانه، شما باید در مورد آنچه که این برنامه های بررسی سرقت ادبی می گویند بسیار محتاط باشید. مهم است که به دقت ارزیابی کنید که آیا نشانه های گزارش شده معتبر هستند یا خیر. همانطور که قبلا ذکر شد، توانایی تشخیص اینکه آیا یک اثر کپی شده است یا خیر می تواند مبهم باشد. اگر بدون فکر نتیجه برنامه بررسی را بپذیرید، می توانید به دروغ دانش آموز را متهم به کپی برداری کنید در حالی که این کار را انجام نداده است. این می تواند روح را خرد کند.

در ادامه، می‌توانیم از برنامه‌های بررسی سرقت ادبی در حوزه آزمایش خروجی‌های هوش مصنوعی مولد استفاده کنیم. با مقالات خروجی از یک برنامه هوش مصنوعی مولد طوری رفتار کنید که گویی توسط یک دانش آموز نوشته شده است. سپس بررسی می‌کنیم که چک‌کننده سرقت ادبی چه می‌گوید. این کار با یک دانه نمک انجام می شود.

یک مطالعه تحقیقاتی اخیر وجود دارد که سعی در عملیاتی کردن این نوع مقایسه ها در زمینه هوش مصنوعی مولد به همین روش دارد. من می خواهم چند یافته جالب را با شما مرور کنم.

ابتدا مقداری پس زمینه اضافه شده مورد نیاز است. هوش مصنوعی مولد گاهی اوقات به عنوان LLM (مدل های زبان بزرگ) یا به سادگی LMs (مدل های زبان) نامیده می شود. دوم، ChatGPT بر اساس نسخه دیگری از بسته هوش مصنوعی مولد OpenAI به نام GPT-3.5 است. قبل از GPT-3.5، GPT-3 وجود داشت و قبل از آن GPT-2 بود. امروزه، GPT-2 در مقایسه با سری های بعدی نسبتاً ابتدایی در نظر گرفته می شود، و همه ما مشتاقانه منتظر رونمایی آینده از GPT-4 هستیم، بحث من را در اینجا ببینید. پیوند اینجا.

مطالعه تحقیقاتی که می خواهم به طور خلاصه بررسی کنم شامل بررسی GPT-2 بود. این مهم است که بدانیم زیرا ما اکنون فراتر از توانایی های GPT-2 هستیم. در مورد نتایج این تجزیه و تحلیل GPT-2 هیچ نتیجه گیری عجولانه ای انجام ندهید. با این وجود، ما می توانیم چیزهای زیادی از ارزیابی GPT-2 بیاموزیم. این مطالعه با عنوان "آیا مدل های زبان سرقت ادبی می کنند؟" توسط Jooyoung Lee، Thai Le، Jinghui Chen، و Dongwon Lee، که در ACM WWW '23، 1 تا 5 مه 2023، آستین، TX، ایالات متحده ظاهر می شوند.

این سوال اصلی تحقیق آنهاست:

LM ها تا چه حد (نه محدود به حفظ کردن) از عبارات یا جملات نمونه های آموزشی خود استفاده می کنند؟

آنها از این سه سطح یا دسته سرقت بالقوه استفاده کردند:

سرقت ادبی کلمه به کلمه: کپی دقیق کلمات یا عبارات بدون تغییر شکل.
سرقت ادبی پارافراسی: جایگزینی مترادف، مرتب سازی مجدد کلمات و/یا ترجمه برگشتی.
"دزدی ادبی ایده: نمایش محتوای اصلی به شکل کشیده."

GPT-2 در واقع بر روی داده های اینترنتی آموزش دیده بود و بنابراین کاندیدای مناسبی برای این نوع تجزیه و تحلیل است:

«GPT-2 از قبل در WebText آموزش داده شده است و حاوی بیش از 8 میلیون سند است که از 45 میلیون پیوند Reddit بازیابی شده است. از آنجایی که OpenAI به صورت عمومی WebText را منتشر نکرده است، ما از OpenWebText استفاده می کنیم که یک بازآفرینی متن باز از مجموعه WebText است. این به طور قابل اعتماد توسط ادبیات قبلی استفاده شده است.

یافته های کلیدی انتخابی برگرفته از این مطالعه عبارتند از:

ما متوجه شدیم که خانواده های GPT-2 از قبل آموزش دیده از OpenWebText سرقت ادبی می کنند.
«یافته‌های ما نشان می‌دهد که تنظیم دقیق به طور قابل‌توجهی موارد سرقت ادبی را از OpenWebText کاهش می‌دهد.»
مطابق با کارلینی و همکاران. و کارلینی و همکاران، متوجه شدیم که مدل‌های بزرگتر GPT-2 (بزرگ و xl) معمولاً توالی‌های سرقت‌شده را بیشتر از مدل‌های کوچکتر تولید می‌کنند.
با این حال، LM های مختلف ممکن است الگوهای مختلفی از سرقت ادبی را نشان دهند، و بنابراین نتایج ما ممکن است به طور مستقیم به LM های دیگر، از جمله LM های جدیدتر مانند GPT-3 یا BLOOM تعمیم ندهند.
علاوه بر این، آشکارسازهای سرقت ادبی خودکار دارای حالت های خرابی بسیاری هستند (هم در منفی کاذب و هم در موارد مثبت کاذب).
با توجه به اینکه اکثر داده‌های آموزشی LM بدون اطلاع صاحبان محتوا از وب حذف می‌شوند، تکرار کلمات، عبارات و حتی ایده‌های اصلی از مجموعه‌های آموزشی در متون تولید شده پیامدهای اخلاقی دارد.

ما قطعاً به مطالعات بیشتری از این نوع نیاز داریم.

اگر در مورد مقایسه GPT-2 با GPT-3 در مورد آموزش داده کنجکاو هستید، تضاد کاملاً مشخصی وجود دارد.

طبق نشانه های گزارش شده، آموزش داده برای GPT-3 بسیار گسترده تر بود:

این مدل با استفاده از پایگاه‌های داده متنی از اینترنت آموزش داده شد. این شامل 570 گیگابایت داده‌های به‌دست‌آمده از کتاب‌ها، متون وب، ویکی‌پدیا، مقاله‌ها و سایر نوشته‌های اینترنتی است. به بیان دقیق تر، 300 میلیارد کلمه وارد سیستم شد.تمرکز علمی بی بی سی مجله، "ChatGPT: هر آنچه که باید در مورد ابزار GPT-3 OpenAI بدانید" توسط الکس هیوز، فوریه 2023).

برای کسانی از شما که علاقه مند به توضیحات عمیق تر از آموزش داده برای GPT-3 هستند، در اینجا گزیده ای از کارت مدل رسمی GPT-3 ارسال شده در GitHub (آخرین تاریخ به روز رسانی ذکر شده در سپتامبر 2020) آمده است:

مجموعه داده آموزشی GPT-3 از متن ارسال شده در اینترنت یا متن بارگذاری شده در اینترنت (به عنوان مثال، کتاب) تشکیل شده است. داده های اینترنتی که تا به امروز بر روی آنها آموزش دیده و ارزیابی شده است شامل: (1) نسخه ای از مجموعه داده CommonCrawl، فیلتر شده بر اساس شباهت به مجموعه های مرجع با کیفیت بالا، (2) یک نسخه توسعه یافته از مجموعه داده های متنی وب، (3) ) دو مجموعه کتاب مبتنی بر اینترنت و (4) ویکی‌پدیای انگلیسی زبان.»
«با توجه به داده‌های آموزشی آن، خروجی‌ها و عملکرد GPT-3 بیش از آنهایی که در فرهنگ کلامی و غیر دیجیتالی غوطه‌ور هستند، معرف جمعیت‌های متصل به اینترنت است. جمعیت متصل به اینترنت بیشتر نماینده کشورهای توسعه‌یافته، ثروتمند، جوان‌تر و دیدگاه‌های مردانه است و عمدتاً آمریکا محور هستند. ملت ها و جمعیت های ثروتمند در کشورهای توسعه یافته ضریب نفوذ اینترنت بیشتری را نشان می دهند. شکاف جنسیتی دیجیتال همچنین نشان می دهد زنان کمتری در سراسر جهان به صورت آنلاین حضور دارند. علاوه بر این، از آنجایی که نقاط مختلف جهان دارای سطوح مختلف نفوذ و دسترسی به اینترنت هستند، مجموعه داده‌ها جوامع کمتر مرتبط را نشان می‌دهند.

یکی از نکات مهم در مورد GPT-3 این است که یک قانون کلی در میان آنهایی که هوش مصنوعی مولد را ایجاد می کنند این است که هرچه اطلاعات اینترنتی بیشتری را بتوانید اسکن کنید، احتمال بهبود یا پیشرفت هوش مصنوعی مولد افزایش می یابد.

شما می توانید به هر دو صورت به این موضوع نگاه کنید.

1) بهبود AI. ما قصد داریم هوش مصنوعی مولد داشته باشیم که تا حد امکان در سراسر اینترنت بخزد. نتیجه هیجان انگیز این است که هوش مصنوعی مولد بهتر از آنچه که هست خواهد بود. این چیزی است که باید منتظر آن بود.
2) کپی کردن پتانسیل فراوان. این گسترش اسکن اینترنت به طور مشمئز کننده و جذابی باعث می شود که سرقت ادبی و مشکل نقض حق چاپ به طور بالقوه بزرگتر و بزرگتر شود. در حالی که قبل از آن تعداد زیادی از تولیدکنندگان محتوا تحت تأثیر قرار نمی‌گرفتند، اندازه آن در حال شکوفا شدن است. اگر شما یک وکیل در کنار سازندگان محتوا هستید، این موضوع اشک شما را در می آورد (شاید اشک ناراحتی، یا اشک شوق از اینکه این موضوع چه چشم اندازی از نظر شکایت به همراه دارد).

لیوان نیمه پر است یا نیمه خالی؟

تو تصمیم بگیر.

مین های قانونی در انتظار

سوالی که ممکن است در مورد آن فکر کنید این است که آیا محتوای اینترنتی ارسال شده شما برای اسکن شدن یک بازی منصفانه در نظر گرفته می شود؟ اگر محتوای شما پشت یک دیوار پرداخت است، احتمالاً هدفی برای اسکن شدن نیست زیرا بسته به قدرت دیوار پرداخت، به راحتی قابل دسترسی نیست.

من حدس می‌زنم که اکثر افراد روزمره محتوایشان را پشت یک دیوار پرداخت نمی‌کنند. آنها می خواهند محتوایشان در دسترس عموم باشد. آنها فرض می کنند که مردم نگاهی به آن خواهند داشت.

آیا در دسترس بودن محتوای خود به صورت عمومی به این معنی است که شما تأیید می کنید که برای استفاده توسط هوش مصنوعی مولد که در حال آموزش داده است، اسکن شود؟

شاید آره شاید نه.

این یکی از آن مسائل حقوقی است.

بازگشت به موارد ذکر شده قبلی قانون بلومبرگ در مقاله، نویسندگان به اهمیت شرایط و ضوابط (T&C) مرتبط با بسیاری از وب سایت ها اشاره می کنند:

این مین قانونی - که توسط شرکت‌های هوش مصنوعی ناخواسته که ربات‌های آنلاین را برای جمع‌آوری داده‌ها کار می‌کنند به شدت نادیده گرفته می‌شود - در شرایط و ضوابط که معمولاً در همه نوع وب‌سایت‌های عمومی موجود است پنهان است. برخلاف قانون مالکیت مالکیت نامطلوب فعلی و معضل نقض حق نسخه برداری، شرایط و ضوابط یک وب سایت توسط قانون قرارداد به خوبی تثبیت شده پشتیبانی می شود و معمولاً می توان با تکیه بر تعداد کافی سابقه در دادگاه اجرا کرد.

آنها نشان می دهند که با فرض اینکه وب سایت شما دارای یک صفحه مرتبط با مجوز است، این احتمال وجود دارد که اگر از یک الگوی استاندارد مدرن امروزی استفاده می کنید، ممکن است حاوی یک بند حیاتی باشد:

«در نتیجه، اکثر شرایط و ضوابط دیگ بخار برای وب‌سایت‌ها - که به وفور در دسترسی رایگان در دسترس هستند - حاوی یک بند است که حذف خودکار داده‌ها را ممنوع می‌کند. از قضا، چنین قالب هایی که به صورت رایگان در دسترس هستند احتمالاً برای آموزش ChatGPT استفاده شده اند. بنابراین، صاحبان محتوا ممکن است بخواهند شرایط و ضوابط خود را بازبینی کنند و بند جداگانه‌ای را وارد کنند که استفاده از هر محتوایی را از وب‌سایت‌ها برای آموزش هوش مصنوعی یا اهداف مرتبط، خواه به صورت دستی یا خودکار، بدون اجازه کتبی قبلی مالک وب‌سایت، به‌طور قاطع ممنوع کند. "

در تجزیه و تحلیل آنها از اقدامات بالقوه برای سازندگان محتوا در مورد وب سایت خود، یک ضربه زننده اضافه شده است:

«بنابراین، درج مقررات خسارت نقدی قابل اجرا برای هر تخلف از بند عدم خراش، که با حکم دستور بدون ضمانت افزایش یافته است، می تواند راه حل قابل قبولی برای آن دسته از نویسندگان محتوای خلاقانه باشد که مایل به ارائه ثمرات خود نیستند. کار فکری برای اهداف آموزش هوش مصنوعی بدون اینکه برای آن دستمزد دریافت کنند یا حداقل اعتبار مناسبی برای کارشان در نظر گرفته شود.»

ممکن است بخواهید در این مورد با وکیل خود مشورت کنید.

برخی می گویند که این یک راه حیاتی برای تلاش و گفتن به سازندگان هوش مصنوعی است که سازندگان محتوا در حفاظت از محتوای خود بسیار جدی هستند. به نظر می رسد که اطمینان حاصل کنید که مجوز شما دارای عبارت مناسب است، سازندگان هوش مصنوعی را مورد توجه قرار می دهد.

هر چند دیگران کمی ضعیف هستند. آنها با ناراحتی می گویند که می توانید خشن ترین و کشنده ترین زبان قانونی را در وب سایت خود قرار دهید، اما در نهایت، سازندگان هوش مصنوعی آن را اسکن می کنند. شما نمی دانید که آنها این کار را کردند. شما شیطان زمانه ای خواهید داشت که ثابت می کند آنها این کار را کردند. بعید است متوجه شوید که خروجی های آنها منعکس کننده محتوای شماست. این یک نبرد دشوار است که شما در آن پیروز نخواهید شد.

استدلال متقابل این است که شما در حال تسلیم نبرد حتی قبل از شروع آن هستید. اگر حداقل زبان قانونی کافی نداشته باشید، و اگر آنها را دستگیر کنید، آنها راه خود را برای فرار از هر مسئولیتی تکان می دهند و راسو می کنند. همه اینها به این دلیل است که شما نوع درستی از زبان حقوقی را پست نکرده اید.

در همین حال، رویکرد دیگری که به دنبال جلب توجه است عبارت است از علامت گذاری وب سایت شما با چیزی که می گوید سایت توسط هوش مصنوعی مولد اسکن نمی شود. ایده این است که یک نشانگر استاندارد ابداع شود. احتمالاً وب سایت ها می توانند نشانگر را به سایت خود اضافه کنند. به سازندگان هوش مصنوعی گفته می شود که باید اسکن داده های خود را تغییر دهند تا از وب سایت های علامت گذاری شده عبور کنند.

آیا یک رویکرد نشانگر می تواند موفقیت آمیز باشد؟ نگرانی ها شامل هزینه های دریافت و ارسال نشانگرها می شود. به همراه اینکه آیا سازندگان هوش مصنوعی از نشانگرها تبعیت می کنند و اطمینان حاصل می کنند که از اسکن سایت های علامت گذاری شده اجتناب می کنند. دیدگاه دیگر این است که حتی اگر سازندگان هوش مصنوعی با علامت‌گذاری‌ها همراهی نکنند، این یک سرنخ گویای دیگر برای مراجعه به دادگاه و استدلال این است که سازنده محتوا آخرین مایل را طی کرده و در مورد اسکن هوش مصنوعی هشدار داده است.

بله، همه اینها سر شما را به چرخش در می آورد.

نتیجه

چند نکته پایانی در مورد این موضوع خاردار.

آیا برای یک چشم انداز ذهنی در مورد کل این هوش مصنوعی به عنوان یک معضل سرقت ادبی و نقض حق چاپ آماده هستید؟

بسیاری از فرضیات در مورد "گرفتن" هوش مصنوعی مولد در عمل سرقت ادبی یا نقض حق چاپ به کشف خروجی هایی بستگی دارد که بسیار شبیه کارهای قبلی مانند محتوای موجود در اینترنت که به طور بالقوه در طول آموزش داده اسکن شده است.

فرض کنید که یک ترفند تفرقه بیانداز و حکومت کن در اینجا در حال بازی است.

در اینجا منظورم چیست؟

اگر هوش مصنوعی مولد کمی از اینجا و کمی از آنجا قرض بگیرد، در نهایت آنها را با هم ترکیب کند تا هر خروجی خاصی تولید کند، شانس داشتن یک لحظه هولناک به شدت کاهش می‌یابد. هر خروجی ظاهراً به آستانه کافی نمی رسد که به طور قطع بگوییم که از یک آیتم منبع خاص استخراج شده است. مقاله حاصل یا سایر حالت های خروجی فقط به صورت جزئی قابل تطبیق خواهد بود. و با رویکرد معمول تلاش برای استدلال اینکه سرقت ادبی یا نقض حق نسخه‌برداری رخ داده است، معمولاً باید بیش از مقداری کوچک در بازی به نمایش بگذارید، به خصوص اگر لقمه برجسته نباشد و بتوان آن را به طور گسترده در اینترنت پیدا کرد. هر گونه بار کافی برای اثبات اختلاس).

آیا هنوز هم می‌توانید قانع‌کننده اعلام کنید که آموزش داده‌ها توسط هوش مصنوعی مولد، وب‌سایت‌ها و تولیدکنندگان محتوا را از بین برده است، حتی اگر دلیل پیشنهادی نسبتی ظاهراً غیرمادی باشد؟

راجع بهش فکر کن.

اگر به طور بالقوه با سرقت ادبی در مقیاس و نقض حق نسخه‌برداری در مقیاس مواجه هستیم، ممکن است نیاز داشته باشیم رویکرد خود را برای تعریف آنچه که سرقت ادبی و/یا نقض حق نسخه‌برداری است تغییر دهیم. شاید موردی برای سرقت ادبی یا نقض کپی رایت به طور عمده یا عمومی وجود داشته باشد. موزاییکی متشکل از هزاران یا میلیون‌ها قطعه کوچک می‌تواند به عنوان مرتکب چنین تخلفاتی تعبیر شود. با این حال، مشکل ظاهری این است که این امر می‌تواند باعث شود همه نوع محتوا به طور ناگهانی زیر چتر نقض شوند. این می تواند یک شیب لغزنده باشد.

افکار سنگین

لئو تولستوی، نویسنده افسانه ای، در مورد افکار سنگین صحبت می کند: "تنها معنای زندگی خدمت به بشریت است."

اگر وب‌سایت شما و وب‌سایت‌های دیگران برای بهبود هوش مصنوعی اسکن می‌شوند، و با وجود اینکه حتی یک ریال هم برای آن دریافت نمی‌کنید، آیا می‌توانید با این باور شدید که در آینده بشریت سهیم هستید، آرامشی جدی داشته باشید؟ به نظر می رسد هزینه کمی است.

خوب، مگر اینکه هوش مصنوعی یک خطر وجودی مخوف باشد که همه انسان ها را از وجود پاک کند. شما نباید برای آن اعتبار قائل شوید. من فرض می‌کنم که شما به زودی در آن نتیجه وخیم مشارکت نمی‌کنید. با کنار گذاشتن این پیش‌بینی فاجعه‌بار، ممکن است به این فکر کنید که اگر سازندگان هوش مصنوعی از هوش مصنوعی مولد خود درآمد کسب می‌کنند و به نظر می‌رسد که از سودجویی لذت می‌برند، شما هم باید یک تکه از کیک را دریافت کنید. به اشتراک بگذارید و به اشتراک بگذارید. سازندگان هوش مصنوعی باید برای اسکن هر وب سایت اجازه بخواهند و سپس در مورد قیمتی که باید برای انجام اسکن پرداخت شود مذاکره کنند.

در جایی که اعتبار دارد اعتبار بدهید.

بیایید فعلاً حرف آخر را به سر والتر اسکات بگوییم: «اوه، چه تار و پود درهم تنیده‌ای داریم. اولین بار که برای فریب دادن تمرین می کنیم.»

اگر فکر می‌کنید که فریب در راه است، این ممکن است صدق کند، یا اگر فکر می‌کنید که همه چیز درست و کاملاً صریح و مشروع است، صدق نمی‌کند. لطفاً سخاوتمندانه به خودتان اعتبار بدهید که به این موضوع فکر کرده اید. شما سزاوار آن هستید.

منبع: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- و-آی-قانون/