25.3 C
Raipur
Tuesday, June 24, 2025

ChatGPT विवाद: OpenAI के GPT-4o मॉडल पर पेड बुक्स से ट्रेनिंग लेने का आरोप, नई रिसर्च का बड़ा दावा

Must read

नई दिल्ली। AI तकनीक की दुनिया में एक बार फिर बड़ा विवाद खड़ा हो गया है। OpenAI के नए AI मॉडल GPT-4o पर अब यह गंभीर आरोप लगा है कि उसने O’Reilly Media द्वारा प्रकाशित पेड (Paywalled) किताबों का इस्तेमाल ट्रेनिंग के लिए किया है। यह दावा AI Disclosures Project, एक नॉन-प्रॉफिट AI वॉचडॉग संगठन ने अपनी ताज़ा रिसर्च रिपोर्ट में किया है।

रिपोर्ट में क्या है दावा?

रिपोर्ट के अनुसार, GPT-4o को O’Reilly की उन किताबों को पहचानने में ज्यादा सफलता मिल रही है जो सार्वजनिक रूप से उपलब्ध नहीं हैं, जबकि OpenAI का पिछला मॉडल GPT-3.5 Turbo केवल सार्वजनिक किताबों को पहचानता है। इससे संकेत मिलता है कि GPT-4o के ट्रेनिंग डेटा में नॉन-पब्लिक, पेड किताबें शामिल हो सकती हैं।

रिसर्चर्स का कहना है कि OpenAI और O’Reilly Media के बीच कोई लाइसेंसिंग समझौता नहीं है, जिससे यह मामला कॉपीराइट उल्लंघन की तरफ इशारा करता है।

जांच में किस तकनीक का इस्तेमाल हुआ?

रिसर्चर्स ने इस जांच में “Membership Inference Attack” नाम की तकनीक (जिसे DE-COP कहा जाता है) का इस्तेमाल किया।
यह तकनीक यह विश्लेषण करती है कि AI मॉडल किसी पुस्तक के असली पैराग्राफ और AI द्वारा पैराफ्रेज़ किए गए टेक्स्ट में फर्क कर पाता है या नहीं।

यदि फर्क आसानी से किया जाता है, तो यह माना जाता है कि मॉडल ने उस किताब को ट्रेनिंग के दौरान देखा है।
इस रिसर्च में O’Reilly Media की 34 पेड किताबों के 13,962 पैराग्राफ्स का विश्लेषण किया गया, जिसमें GPT-4o को सबसे ज्यादा सक्षम पाया गया।

पहले से चल रहे विवाद और कानूनी मामले

गौरतलब है कि Microsoft समर्थित OpenAI पहले से ही कई लेखकों और मीडिया कंपनियों द्वारा कॉपीराइट उल्लंघन के केस का सामना कर रहा है।
इन कंपनियों का आरोप है कि OpenAI ने उनकी अनुमति के बिना कंटेंट का उपयोग किया है।

OpenAI और Google की लॉबिंग

रिपोर्ट के अनुसार, OpenAI और Google अमेरिकी सरकार पर दबाव बना रहे हैं कि AI मॉडल को कॉपीराइटेड कंटेंट से ट्रेनिंग देना Fair Use के तहत वैध घोषित किया जाए।
OpenAI पहले ही कई न्यूज पब्लिशर्स, सोशल मीडिया नेटवर्क और मीडिया लाइब्रेरीज़ से डेटा लाइसेंसिंग डील्स कर चुका है। साथ ही, OpenAI ने पत्रकारों को भी हायर किया है ताकि मॉडल आउटपुट की गुणवत्ता सुधारी जा सके।

क्या होगी कार्रवाई?

हालांकि रिपोर्ट में GPT-4o के खिलाफ ठोस तकनीकी आधार पर गंभीर आरोप लगाए गए हैं, लेकिन अब तक इस मामले में कोई कानूनी कार्रवाई की पुष्टि नहीं हुई है।

- Advertisement -spot_img

More articles

- Advertisement -spot_img

Latest article