वैज्ञानिक साहित्य में नकली शोध पत्रों की भरमार

क अध्ययन से पता चला है कि वैज्ञानिक साहित्य में कंप्यूटर प्रोग्राम द्वारा रचे गए बेमतलब शोध पत्रों की संख्या काफी अधिक है। यदि प्रकाशकों द्वारा कार्यवाही की जाती है तो 200 से अधिक शोध पत्र हटाए जा सकते हैं।

यह मुद्दा सबसे पहले तब सामने आया जब 2005 में तीन पीएचडी छात्रों ने शोध पत्र बनाने वाला SCIgen नामक सॉफ्टवेयर तैयार किया। वे बताना चाहते थे कि कुछ सम्मेलनों में अर्थहीन पेपर भी स्वीकार किए जाते हैं। यह सॉफ्टवेयर बेतरतीब शीर्षकों, शब्दों और चार्ट्स के माध्यम से शोध आलेख तैयार करता है। मानव पाठक इसकी निरर्थकता को बहुत ही आसानी से पकड़ सकते हैं।

वर्ष 2012 तक कंप्यूटर वैज्ञानिक सिरिल लेबे ने SCIgen की मदद से तैयार किए गए 85 नकली पत्रों का पता लगाया था जो IEEE द्वारा प्रकाशित किए जा चुके हैं। इसके अलावा एक अन्य प्रकाशक स्प्रिंगर द्वारा भी कई नकली शोध पत्र प्रकाशित किए गए हैं। हालांकि, ये लेख या तो वापस ले लिए गए या हटा दिए गए हैं। फिर भी लेबे ने एक वेबसाइट शुरू की है जिसमें कोई भी पेपर या शोध पत्र अपलोड कर सकता है और पता लगा सकता है कि यह SCIgen की मदद से तैयार किया गया है या नहीं। स्प्रिंगर ने भी ऐसे पत्रों का पता लगाने के लिए SciDetect नामक सॉफ्टवेयर तैयार किया है।

इन कूट-रचित पर्चों का पता लगाने के लिए पहले तो लेबे ने SCIgen की शब्दावली के विशिष्ट शब्दों का सहारा लिया। फ्रांस के एक अन्य वैज्ञानिक ने SCIgen रचित पर्चों में प्रमुख वैयाकरणिक तत्वों का पता लगाने का काम किया। पिछले महीने ही दोनों ने डायमेंशन डैटाबेस में मौजूद लाखों पर्चों में ऐसे वाक्यांशों की खोज की है। इस अध्ययन में उन्होंने 243 ऐसे लेख पाए जो पूर्ण या आंशिक रूप से SCIgen की मदद से तैयार किए गए थे। ये लेख 2008 से 2020 के दौरान प्रकाशित किए गए हैं और मुख्य रूप से कंप्यूटर साइंस क्षेत्र के जर्नल, सम्मेलनों, प्रीप्रिंट साइट्स में छपे हैं। इनमें से कुछ तो ओपन-एक्सेस जर्नल में प्रकशित हुए हैं। 46 पर्चों को वेबसाइटों से वापस ले लिया या हटा दिया गया है। पिछले वर्ष वैज्ञानिकों ने 20 अन्य पेपर्स को भी हटाया है जो MATHgen (गणित) और SBIR प्रपोज़ल जनरेटर द्वारा रचे गए थे।

गौरतलब है कि SCIgen की मदद से तैयार किए गए अधिकांश नवीनतम पेपर चीन (64 प्रतिशत) और भारत (22 प्रतिशत) के शोधकर्ताओं द्वारा लिखे गए हैं। कुछ लेखकों ने बताया कि उनका नाम उनसे पूछे बगैर शामिल किया गया है। लेकिन कई लेख वास्तविक संदर्भ सूची के साथ प्रस्तुत किए गए हैं। लगता है कि वैज्ञानिकों की प्रकाशन-प्रतिष्ठा बढ़ाने के लिए ऐसा किया गया है। 

SCIgen रचित दो ऐसे पेपर्स का पता लगा है जिन्हें IEEE ने वापस नहीं लिया है। इसी तरह स्प्रिंगर का भी एक पेपर वापस नहीं लिया गया है जिसमें कुछ भाग MATHgen द्वारा रचित है। इस पड़ताल से कुछ प्रकाशक बहुत चिंतित हैं क्योंकि इससे यह भी पता चलता है कि इन सभी पेपर्स की विशेषज्ञ समीक्षा के दौरान ये पेपर्स पकड़े नहीं जा सके थे। यानी इस प्रक्रिया के साथ भी समझौता हुआ था।

SCIgen की मदद रचित सबसे अधिक सामग्री को प्रकाशित करने वालों में स्विस ट्रांस टेक पब्लिकेशन्स (57), भारत स्थित ब्लू आईज़ इंटेलिजेंस इंजीनियरिंग एंड साइंस पब्लिकेशन (BEIESP, 54) और फ्रांस स्थित अटलांटिस प्रेस (39) है। ट्रांस टेक और अटलांटिस ने लेखों को वापस लेते हुए इस पर जांच करने की बात कही है जबकि BEIESP का कहना है कि वह मूल सामग्री पर आधारित पेपर गहन समकक्ष समीक्षा और सभी तरह की जांच के बाद ही प्रकाशित करता है।

एक अध्ययन में पता चला है कि समकक्ष समीक्षा के पहले पेपर साझा करने वाले एक सर्वर (SSRN), पर भी SCIgen रचित 16 लेख प्रकाशित हुए हैं जिनकी जांच जारी है। ऐसे में वैज्ञानिकों को अपारदर्शी तरीकों से शोध पत्रों को प्रकाशित करने को लेकर काफी चिंता है। उदाहरण के लिए IEEE ने तो अपनी वेबसाइट से ऐसे शोध पत्रों को तो हटा लिया है और अन्य प्रकाशकों को औपचारिक तौर पर ऐसे पत्र हटाने के संदेश भी दिए हैं। SSRN सर्वर से कुछ पेपर्स तो बिना किसी रिकॉर्ड के हटा दिए गए हैं।

वैसे तो SCIgen की मदद से तैयार किए गए पेपर्स की संख्या बहुत ज़्यादा नहीं है लेकिन इस तरह के पेपर्स का प्रकाशित होना वैज्ञानिक प्रकाशन की परंपरा के लिए काफी खतरनाक है। (स्रोत फीचर्स)

नोट: स्रोत में छपे लेखों के विचार लेखकों के हैं। एकलव्य का इनसे सहमत होना आवश्यक नहीं है।
Photo Credit : https://media.nature.com/w1248/magazine-assets/d41586-021-00733-5/d41586-021-00733-5_18989362.jpg

प्रातिक्रिया दे