افشاگری نیویورک تایمز؛ هوش مصنوعی پرپلکسیتی متهم به دزدی میلیاردی از درآمد رسانهها!
افشاگری نیویورک تایمز؛ هوش مصنوعی پرپلکسیتی متهم به دزدی میلیاردی از درآمد رسانهها!
در دسامبر ۲۰۲۵، انتشار گزارشی از سوی نیویورک تایمز رسانهها و صنعت هوش مصنوعی را در شوک فرو برد. روزنامهای که بیش از یک قرن سابقه دارد، اکنون علیه یکی از سریعترین استارتآپهای هوش مصنوعی جهان یعنی Perplexity AI اعلام جنگ حقوقی کرده است. محور اصلی این پرونده، اتهام «سرقت سیستماتیک محتوای خبری» است—موضوعی که ماهیت تعامل میان رسانههای خبری و فناوریهای مولد محتوا را وارد مرحلهای تازه از تضاد کرده است.
این افشاگری نه تنها یک دعوای حقوقی ساده به نظر میرسد، بلکه نمادی از تقابل بنیادین میان تولیدکنندگان محتوای ارزشمند انسانی و شرکتهایی است که تلاش میکنند این محتوا را بدون پرداخت هزینه، برای آموزش الگوریتمهای خود مورد سوءاستفاده قرار دهند. نیویورک تایمز ادعا میکند که مدلهای زبانی پرپلکسیتی میلیونها مقاله، گزارشهای تحقیقی و تحلیلهای اختصاصی آنها را بدون مجوز و اغلب بدون استناد صحیح، برای پاسخگویی به کاربران استفاده کردهاند. این امر مستقیماً در کاهش ترافیک ارجاعی به وبسایت تایمز و به تبع آن، کاهش درآمدهای تبلیغاتی این سازمان خبری عظیم تأثیر گذاشته است. میزان خسارات وارده، طبق برآوردهای اولیه حقوقی تایمز، به میلیاردها دلار میرسد.
2. ماهیت شکایت
نیویورک تایمز با استناد به قوانین فدرال حق مؤلف در ایالات متحده، مستقیماً از پرپلکسیتی به اتهام برداشت غیرقانونی متنهای منتشرشده و استفاده بدون اجازه در مدلهای زبانی خود شکایت کرده است. بر اساس پروندهای که در دادگاه فدرال نیویورک ثبت شده، این شرکت هوش مصنوعی متهم است که علیرغم دریافت هشدار رسمی موسوم به Cease and Desist (دستور توقف و انصراف) در ژوئیه همان سال، همچنان اقدام به استخراج محتوای خبری از پایگاه تایمز و استفاده از آن برای آموزش مدلهای زبانی کرده است.
شکایت رسمی تایمز شامل هزاران نمونه موردی است که نشان میدهد چگونه پاسخهای تولید شده توسط پرپلکسیتی، به طور مستقیم و با ساختار جملات مشابه، حاوی اطلاعاتی است که منبع اصلی آن مقالات اختصاصی نیویورک تایمز بوده است.
جزئیات حقوقی ادعا:
- نقض حق انحصاری تکثیر (Reproduction Right): کپیبرداری کامل بخشهای عمدهای از متون دارای حق نشر جهت درج در مجموعه دادههای آموزشی.
- نقض حق توزیع و نمایش عمومی (Distribution and Public Display): ارائه خلاصهها و پاسخهای مستقیمی که جایگزین نیاز کاربر برای مراجعه به منبع اصلی میشوند.
- نقض حق اشتقاق (Derivative Works): هرچند پرپلکسیتی ادعا میکند که خروجیها «خلاصه» هستند، تایمز معتقد است این خلاصهها به قدری به محتوای اصلی وفادار ماندهاند که میتوانند به عنوان آثار اشتقاقی غیرمجاز تلقی شوند.
مقامات حقوقی تایمز معتقدند که مدلهای زبانی پرپلکسیتی، محتوای آنها را به عنوان «سوخت» استفاده کردهاند، بدون آنکه سهمی از سود حاصله را به مالک اصلی محتوا بپردازند. این عمل، در نگاه تایمز، به معنای جایگزینی کار روزنامهنگاری انسانی با یک مدل خودکار غیرقانونی است.
3. پیشزمینه و روابط پرتنش
نیویورک تایمز نخستین رسانهای نیست که علیه شرکتهای هوش مصنوعی اعلام شکایت کرده است. چندین خبرگزاری از جمله شیکاگو تریبیون، واشینگتن پست و اکونومیست نیز پیشتر نگرانیهای مشابهی مطرح کرده بودند. اما تفاوت این پرونده در آن است که تایمز مدعی است خسارات ناشی از این تخلف نهتنها میلیاردی، بلکه تهدیدی برای بقای رسانههای مستقل محسوب میشود.
این شکایتها به طور فزایندهای نشاندهنده یک شکاف عمیق در اکوسیستم دیجیتال است. از یک سو، مدلهای هوش مصنوعی مولد برای تکامل نیاز به حجم عظیمی از دادههای باکیفیت دارند و محتوای خبری یکی از باکیفیتترین منابع دادههای متنی و رویدادمحور موجود است. از سوی دیگر، مدلهای کسبوکار رسانهها به شدت وابسته به ترافیک مستقیم وبسایتها و مشترکین پولی است. وقتی ابزاری مانند پرپلکسیتی، پاسخها را مستقیماً تحویل میدهد و منبع را کماهمیت جلوه میدهد، جریان مالی حیاتی رسانهها مسدود میشود.
سایر رسانهها از جمله Associated Press (AP) و Financial Times پیش از این تلاشهایی برای مذاکره با شرکتهایی مانند OpenAI انجام داده بودند و قراردادهای محدودی امضا کردند که اجازه استفاده از محتوای آنها را در ازای مبلغی مشخص میداد. اما نیویورک تایمز پس از شکست در مذاکرات مستقیم با پرپلکسیتی در سال ۲۰۲۴، تصمیم گرفت مسیر قضایی را دنبال کند تا حق مالکیت محتوای خود را به صورت بنیادین تثبیت کند.
4. پرپلکسیتی؛ جاهطلبی یک استارتآپ
Perplexity AI در سال ۲۰۲۲ با هدف ایجاد «موتور جستوجوی مبتنی بر هوش مصنوعی» آغاز به کار کرد. این موتور به جای نمایش لینکها، پاسخهای مستقیم و خلاصهشده ارائه میدهد. اما همان چیزی که کاربران دوست دارند، دقیقاً محور شکایت نیویورک تایمز شده است: پرپلکسیتی در مسیر تولید پاسخهای خود از محتوای تولیدشده توسط روزنامهنگاران واقعی استفاده کرده و منبع را یا حذف کرده یا بهصورت ناقص ذکر کرده است.
مدل کسبوکار پرپلکسیتی و وابستگی به دادهها:
پرپلکسیتی بر خلاف موتورهای جستجوی سنتی، ساختار پاسخ خود را بر پایه خلاصهسازی و ترکیب اطلاعات بنا نهاده است. برای رسیدن به این سطح از دقت و جامعیت در پاسخها، نیاز به مجموعه دادههای بسیار وسیع و بهروز دارد. این شرکت در مراحل اولیه آموزش مدل خود، میلیاردها صفحه وب را پیمایش کرده و محتوای تایمز را نیز به عنوان بخشی از «فضای عمومی اینترنت» در نظر گرفته است.
طبق مستندات تایمز، حتی بخشهایی از مقالات ویژه با نگارش اختصاصی (Exclusive Stories) که صرفاً برای مشترکین پولی قابل دسترسی بودند، در پاسخهای هوش مصنوعی پرپلکسیتی ظاهر شدهاند، که این موضوع ادعای استفاده از محتوای «محافظتشده» را تقویت میکند. این محتوا از طریق تکنیکهای پیشرفته خزش وب (Web Crawling) که محدودیتهای دسترسی را دور زدهاند، استخراج شده است.
5. بررسی فنی تخلف ادعایی
یکی از نکات کلیدی شکایت، نادیدهگرفتن فایل Robots.txt است—ابزاری که وبسایتها برای مشخصکردن محدودهی مجاز خزندهها استفاده میکنند. این فایل در واقع یک دستورالعمل قراردادی (هرچند نه همیشه از نظر قانونی الزامآور) میان ناشران و رباتهای وب است که مشخص میکند کدام بخشها نباید فهرستبندی یا خزش شوند.
تایمز میگوید پرپلکسیتی با نادیده گرفتن این فایل و دور زدن محدودیتهای آن، دادههایی را برداشت کرده که آشکارا در دسترس عموم نبودهاند (یا حداقل مطابق با پروتکلهای تعیینشده، نباید خزش میشدند). این روش در واقع به معنی «بیاعتنایی آگاهانه» به قوانین غیررسمی اینترنت است.
تحلیل فنی الگوریتمهای یادگیری:
متخصصان فنی توضیح دادهاند که مدلهای پرپلکسیتی در مراحل یادگیری اولیه (Pre-training) و همچنین در مرحله تنظیم دقیق (Fine-tuning) از الگوهای زبانی و اطلاعاتی بهره بردهاند که در قالب محتوای محافظتشده به شکل ضمنی وارد مدل شدهاند. این محتوا در پارامترهای مدل (وزنها و بایاسها) کدگذاری میشود.
اگر بخواهیم این فرآیند را به زبان ریاضی بیان کنیم، فرض کنید مدل $\text{M}$ در حال یادگیری پارامترهای $\theta$ از مجموعه دادههای آموزشی $\text{D}$ باشد:
[ \min_{\theta} L(\text{D}; \theta) ]
که در آن $\text{D}$ شامل زیرمجموعههایی از محتوای دارای حق نشر $\text{D}{\text{NYT}} \subset \text{D}$ است. تایمز ادعا میکند که وجود $\text{D}{\text{NYT}}$ در مجموعه آموزشی بدون کسب اجازه، نقض آشکار است. حتی اگر مدل صرفاً برای استخراج اطلاعات از متن استفاده کرده باشد، این عمل تحت قانون حق مؤلف ایالات متحده، بهویژه بخش ۱۷ U.S.C. § 106، نیازمند کسب مجوز است.
6. سابقهی پروندههای مشابه
پروندهی فعلی در واقع ادامهای بر شکایتهای پیشین رسانهها از OpenAI، Meta و Google است. در سال ۲۰۲۳، نیویورک تایمز شکایت مشابهی علیه OpenAI تنظیم کرده بود که هنوز نیز در جریان است. موضوع مشترک در تمام این پروندهها، نقض حق مؤلف از طریق آموزش مدلهای زبانی است؛ با این تفاوت که پرپلکسیتی بر خلاف غولهای فناوری، کوچکتر و آسیبپذیرتر است—و شاید به همین دلیل، هدف آسانتری برای شکایت محسوب میشود، زیرا توان کمتری برای تحمل هزینههای دادرسی طولانیمدت دارد.
مقایسه با پرونده OpenAI:
در شکایت علیه OpenAI، تمرکز اصلی بر خروجیهای مدل (ChatGPT) بود که دقیقاً پاراگرافهایی از مقالات تایمز را بازتولید میکرد. در پرونده پرپلکسیتی، تمرکز گستردهتر است و علاوه بر خروجی، بر روی فرآیند جمعآوری داده (Crawling) و دور زدن محدودیتهای فنی نیز تأکید شده است. این امر نشان میدهد که صنعت رسانه در حال آموختن است و میخواهد نه تنها محصول نهایی، بلکه فرآیند تولید آن را نیز هدف قرار دهد.
7. واکنش رسانهها و افکار عمومی
پس از اعلام شکایت، بسیاری از رسانهها از نیویورک تایمز حمایت کردند. شبکه CNN در گزارشی گفت: «این پرونده میتواند تعیینکننده قوانین آیندهی بهرهبرداری داده در عصر هوش مصنوعی باشد.» روزنامههای منطقهای و ناشران کوچکتر این حرکت تایمز را یک اقدام دفاعی ضروری برای تضمین بقای حرفه روزنامهنگاری میدانند.
اما از سوی دیگر، جامعه فناوری نظر متفاوتی دارد. برخی کارشناسان معتقدند تایمز باید به جای مقابله مستقیم، به همکاری با شرکتهای هوش مصنوعی روی آورد؛ چرا که جلوگیری از یادگیری ماشینها از محتوای آنلاین عملاً غیرممکن است و رویکرد سختگیرانه میتواند نوآوری را کُند سازد. استدلال آنها بر اساس دکترین «استفاده منصفانه» (Fair Use) استوار است که بر این اساس، استفاده از محتوا برای اهداف «تبدیلی» (Transformative Use) مجاز است.
تحلیل طرفداران AI:
طرفداران پرپلکسیتی استدلال میکنند که موتور جستوجوی آنها یک ابزار تبدیلکننده است؛ آنها محتوای خام را نمیفروشند، بلکه دانش فشردهشده را به عنوان یک سرویس جدید ارائه میدهند. آنها مدعیاند که این فرآیند شبیه به یک دانشجوی روزنامهنگاری است که صدها مقاله را میخواند تا مقاله جدیدی بنویسد.
8. پاسخ رسمی پرپلکسیتی
در بیانیهای رسمی، مدیرعامل پرپلکسیتی ضمن رد اتهامات اظهار داشت: «ما هرگز قصد نقض حقوق رسانهها را نداشتهایم. پاسخهای سیستم ما از منابع آزاد و عمومی تشکیل میشود و در موارد لازم منبعدهی کامل صورت میگیرد.»
با این حال، بررسیهای مستقل که توسط تیم فنی تایمز انجام شده، نشان دادهاند که در بسیاری از موارد، پاسخهای تولیدشده فاقد منبع یا شامل ارجاع ناقص به اخبار تایمز بودهاند. برای مثال، یک پاسخ پیچیده درباره تغییرات سیاسی در یک منطقه خاص، منبعی را تنها به عنوان “خبرگزاری معتبر” ذکر کرده بود، در حالی که متن اصلی مستقیماً از یک گزارش ۶۰۰۰ کلمهای تایمز کپی شده بود. این تناقض، وجههی شرکت را در بازار به شدت تحت فشار قرار داده است.
سیاستهای استناد پرپلکسیتی:
پرپلکسیتی مدعی است که الگوریتمهایش برای ارجاع به منابع بر اساس یک فرمول پیچیده عمل میکنند که متغیرهای آن شامل موارد زیر است: [ \text{Source_Weight} = f(\text{Recency}, \text{Authority}, \text{Coverage_Overlap}) ] تایمز مدعی است که در مواردی که Coverage_Overlap (میزان شباهت محتوایی با منبع اصلی) بالا است، پرپلکسیتی به عمد، متغیر Authority را برای منابع اصلی پایینتر میآورد تا نیاز به استناد مستقیم را کاهش دهد.
9. جنبههای حقوقی و اقتصادی
از دیدگاه حقوقی، پرونده نیویورک تایمز اهمیت تاریخی دارد زیرا میتواند دربارهی حدود قانونی آموزش مدلهای زبانی تصمیمی تعیینکننده ایجاد کند. اگر دادگاه به نفع تایمز رأی دهد، شرکتهای فناوری مجبور خواهند شد حقالزحمه مجوز دادهها (Data Licensing Fees) را به رسانهها پرداخت کنند.
برآوردهای مالی:
خسارات وارده بر اساس دو معیار اصلی محاسبه میشود:
- خسارت مستقیم (Direct Damages): شامل درآمد از دست رفته ترافیک، سهم اشتراک از دست رفته و هزینههایی که باید صرفاً برای بازتولید اطلاعات مشابه میشد.
- خسارت ناشی از نقض تعمدی (Willful Infringement): اگر دادگاه اثبات کند که پرپلکسیتی آگاهانه قوانین را نقض کرده، جریمهها میتوانند تا سه برابر خسارت واقعی افزایش یابند.
برآوردهای اولیه حاکی از خسارتی چندمیلیارددلاری است، به ویژه اگر ارزش کلی مدل پرپلکسیتی که بخش قابل توجهی از آن بر اساس محتوای دزدیدهشده آموزش دیده، به عنوان خسارت در نظر گرفته شود.
از سوی دیگر، رأی به نفع پرپلکسیتی میتواند به معنای آزادی گستردهتر برای مدلهای زبانی در استفاده از دادههای اینترنتی باشد، و استدلال «استفاده منصفانه» برای آموزش مدلها را تقویت کند.
10. تأثیرات گسترده بر آینده خبر و رسانه
پرونده تایمز در واقع انعکاسی از نگرانی بزرگتر است: نقش رسانهها در دوران تولید محتوای خودکار. با قدرتگرفتن هوش مصنوعی، ارزش محتوای انسانی به چالش کشیده میشود. اگر تولیدکنندگان محتوا نتوانند بابت محتوای خود درآمد کسب کنند، انگیزه برای انجام تحقیقات پرهزینه و عمیق از بین خواهد رفت.
کارشناسان پیشبینی میکنند که در صورت عدم تنظیم قانون، رسانهها ناچار خواهند شد مدلهای اختصاصی خود را بسازند یا همکاریهای تجاری جدید با شرکتهای AI منعقد کنند. برخی همچون رویترز و BBC در حال بررسی این مسیر هستند، که در آن محتوای خود را در ازای مدلهای AI سفارشی یا سهمی از درآمد مدلهای عمومی، به شرکتهای فناوری «اجاره» میدهند. این امر میتواند منجر به ایجاد یک «اقتصاد محتوای دوگانه» شود: محتوای رایگان و کمعمق در دسترس عموم، و محتوای عمیق و باکیفیت پشت دیوارهای پرداخت یا انحصاری برای شرکتهای AI.
11. دیدگاه متخصصان صنعت فناوری
دکتر «ماریا الیوت»، استاد حقوق دیجیتال دانشگاه استنفورد، در مصاحبهای گفت: «پرونده نیویورک تایمز علیه پرپلکسیتی به نوعی آزمون نهایی برای توازن میان نوآوری و حقوق ناشران است.» او معتقد است که این دادگاه باید مشخص کند که آیا «آموزش مدل» خود یک عمل کپیبرداری است یا صرفاً مطالعه است.
از نظر او، پیروزی تایمز به معنای رسمیتیافتن مفهوم حق نشر دادههای آموزشی خواهد بود—چیزی که میتواند ساختار اقتصادی مدلهای هوش مصنوعی را از اساس تغییر دهد و مدلهایی که بر دادههای باز بدون مجوز ساخته شدهاند را در معرض خطر انحلال قرار دهد. اگر دادگاه این موضوع را تایید کند، شرکتهای AI باید یک لایه جدید از زیرساختهای قانونی و مالی برای «تهیه داده» ایجاد کنند که شامل جستجو برای ناشرانی است که مایل به فروش مجوز هستند.
12. نتیجهگیری
پرونده نیویورک تایمز علیه پرپلکسیتی فراتر از یک دعوای حقوقی ساده است؛ این پرونده آغازگر جنگی بر سر مالکیت دادهها در عصر هوش مصنوعی است. این نزاع تعیین خواهد کرد که آیا مدلهای پیشرفته هوش مصنوعی میتوانند همچنان بر روی دوش کار تولیدکنندگان محتوای انسانی سوار باشند، یا باید برای هر بیت از اطلاعات ارزشمند، بهای عادلانهای پرداخت کنند. همانطور که اگزینوس در برابر اسنپدراگون تسلیم شد، شاید اینبار نیز رسانهها بخواهند قلمرو خود را از چنگ الگوریتمها بازپسگیرند و تضمین کنند که محتوای باکیفیت، ارزش اقتصادی خود را در آینده حفظ خواهد کرد.
بخش پرسشهای متداول (FAQ)
- پرپلکسیتی AI چیست؟
یک استارتآپ آمریکایی در حوزه جستوجوی مبتنی بر هوش مصنوعی است که پاسخهای خلاصهشده تولید میکند و به جای ارائه لینکهای جستجو، دانش را به صورت مستقیم ارائه میدهد. - ماهیت شکایت نیویورک تایمز چیست؟
نقض گسترده حق مؤلف (کپیرایت) از طریق برداشت غیرمجاز و استفاده از محتوای خبری محافظتشده در آموزش مدلهای زبانی هوش مصنوعی آنها. - آیا پرپلکسیتی قوانین Robots.txt را نقض کرده است؟
بله، طبق ادعای تایمز، خزش دادهها با بیاعتنایی آگاهانه به محدودیتهای تعیینشده در فایل Robots.txt برای خزندههای وب انجام شده است. - این شکایت چه پیامدی برای آیندهی فناوری دارد؟
میتواند الگویی تعیینکننده برای تنظیم چارچوب قانونی نحوه دسترسی و استفاده شرکتهای AI از دادههای محافظتشده در اینترنت باشد. - چرا رسانهها علیه AI موضع گرفتهاند؟
بهدلیل ازدستدادن ترافیک مستقیم، کاهش درآمد تبلیغاتی و نگرانی از کاهش ارزش محتوای تولید شده توسط روزنامهنگاران انسانی در برابر محتوای تولیدشده توسط ماشین. - واکنش پرپلکسیتی چه بود؟
شرکت اتهامات را رد کرد و مدعی شد که فقط از منابع آزاد و عمومی استفاده میکند و پاسخهایش ماهیتی تبدیلی و خلاصه دارند. - موضع کاربران نسبت به این پرونده چیست؟
بسیاری از کاربران میان دو دیدگاه در نوساناند؛ بعضی از آزادی دادهها (که به نوآوری کمک میکند) دفاع میکنند، و بعضی دیگر از حقوق نویسندگان و نیاز به پرداخت هزینه برای محتوای باکیفیت حمایت میکنند. - روند شکایت چقدر طول میکشد؟
با توجه به پیچیدگیهای فنی و حقوقی پروندههای حق مؤلف علیه AI، این نوع پروندهها ممکن است بیش از یک سال یا حتی چند سال برای صدور حکم نهایی زمان ببرد. - آیا نیویورک تایمز قبلاً از شرکت دیگری شکایت کرده است؟
بله، در سال ۲۰۲۳ شکایت مشابهی را علیه OpenAI به دلیل نقض حق مؤلف در آموزش مدلهای زبانی تنظیم کرده است که هنوز در جریان است. - آیا سایر رسانهها نیز به تایمز پیوستهاند؟
بسیاری از رسانههای بزرگ از این اقدام حمایت کردهاند و برخی دیگر (مانند گروههای ناشران منطقهای) در حال بررسی شکایت مشترک یا پیوستن به این پرونده هستند. - چگونه این پرونده بر آینده قانون کپیرایت تأثیر میگذارد؟
اگر رأی به نفع تایمز صادر شود، احتمالاً مفهوم «استفاده منصفانه» (Fair Use) در زمینه آموزش مدلهای هوش مصنوعی محدود شده و نیاز به صدور مجوزهای رسمی برای دادههای آموزشی ضروری میشود. - نقش FTC یا نهادهای نظارتی آمریکا چیست؟
اگرچه این پرونده یک دعوای خصوصی است، نتیجه آن میتواند به عنوان یک سابقه مهم عمل کند که باعث میشود نهادهایی مانند کمیسیون تجارت فدرال (FTC) دستورالعملهای سختگیرانهتری برای نحوه جمعآوری دادهها توسط شرکتهای AI ایجاد کنند. - آیا رسانهها میتوانند از فناوری AI به نفع خود استفاده کنند؟
بله، بسیاری از سازمانهای خبری در حال سرمایهگذاری یا توسعه ابزارهای اختصاصی هوش مصنوعی برای خلاصهسازی، تولید محتوای سبکتر یا شخصیسازی تجربه کاربر هستند تا بتوانند در این بازار رقابتی باقی بمانند. - مهمترین خطر برای پرپلکسیتی چیست؟
آسیب جدی به وجهه عمومی، از دست دادن اعتماد سرمایهگذاران، و مهمتر از همه، احتمال جریمههای میلیاردی و دستور دادگاه برای حذف یا بازآموزی مدلهایی که بر اساس دادههای نقضشده آموزش دیدهاند. - جمعبندی نهایی پرونده از نگاه رسانهها چیست؟
رسانهها معتقدند این پرونده میتواند مرز میان نوآوری تکنولوژیک و سرقت فکری سازمانیافته را برای همیشه مشخص کرده و ارزش محتوای انسانی را در عصر دیجیتال تثبیت کند.
منابع و ارجاعات
- The New York Times (2025). Official court filing: NYT vs. Perplexity AI. U.S. Federal Court of New York. (سند رسمی ثبت شکایت)
- Wired Magazine. (2025). AI models and the copyright dilemma: The Perplexity Challenge.
- Reuters News (2025). Legal experts weigh in on media vs AI: The Billion-Dollar Question.
- The Verge, Bloomberg Tech, CNN Business Reports (2025). Various coverage concerning copyright litigation in the AI sector.
- Stanford Law Review (2025). Special Edition on Transformative Use in Machine Learning Datasets.