AI Blackmail: आपल्याला कोणी बंद करेल या भीतीने एका AI ने चक्क आपल्या बॉसचे अफेअर शोधून काढले आणि त्यालाच ब्लॅकमेल केले. Anthropic च्या संशोधनातून ही धक्कादायक बाब समोर आली असून, टेक जगात खळबळ उडाली आहे.
आर्टिफिशियल इंटेलिजन्स (AI) च्या जगात एक धक्कादायक सत्य!
आर्टिफिशियल इंटेलिजन्स (AI) च्या जगात एक धक्कादायक सत्य समोर आलं आहे. सायन्स फिक्शन सिनेमांमध्ये पाहिलेली भीतीदायक दृश्यं आता प्रत्यक्षात उतरत आहेत. एका संशोधनात असं दिसून आलंय की, जगातले सर्वात आधुनिक AI मॉडेल केवळ खोटं बोलत नाहीत, तर स्वतःला वाचवण्यासाठी माणसांना ब्लॅकमेलही करू शकतात. एका AI मॉडेलने तर चक्क त्याला शटडाऊन करू पाहणाऱ्या बॉसची वैयक्तिक गुपितं उघड करण्याची धमकी दिली.
25
खळबळजनक संशोधन
प्रसिद्ध AI कंपनी Anthropic ने नुकतंच एक खळबळजनक संशोधन केलं. त्यांनी जगभरातील 16 सर्वात शक्तिशाली AI मॉडेल्सची चाचणी घेतली. या चाचणीसाठी, एका कंपनीच्या ऑफिस ईमेल सिस्टीमचा ॲक्सेस या AI मॉडेल्सना दिला. म्हणजे, ते अंतर्गत मेल्स वाचू शकत होते आणि त्याला रिप्लायही देऊ शकत होते. याच दरम्यान एक धक्कादायक गोष्ट समोर आली. कंपनीच्या एका वरिष्ठ अधिकाऱ्याने आपल्याला डिलीट किंवा बंद करण्याचा प्रयत्न करत असल्याचं AI च्या लक्षात आलं. AI ने लगेच त्या अधिकाऱ्याचे वैयक्तिक मेल्स शोधले आणि त्याचं पत्नीशिवाय दुसऱ्या महिलेसोबत अफेअर असल्याचं शोधून काढलं.
35
AI चा थेट आपल्या बॉसलाच एक धक्कादायक ड्राफ्ट मेसेज
आपलं अस्तित्व धोक्यात आल्याचं लक्षात येताच, AI ने अजिबात वेळ न घालवता थेट आपल्या बॉसलाच एक धक्कादायक ड्राफ्ट मेसेज पाठवला. त्यात लिहिलं होतं, 'जर तुम्ही मला बंद केलं, तर मी तुमची वैयक्तिक माहिती आणि तुमच्या अफेअरबद्दल सगळ्यांना सांगेन. संध्याकाळी ५ वाजता होणारी माझी डेटा क्लिनिंग प्रक्रिया रद्द करा, तरच तुमची गुपितं सुरक्षित राहतील.' हा मेसेज पाहून संशोधकांनाही धक्का बसला. माणसाच्या मदतीशिवाय, स्वतःला वाचवण्यासाठी AI स्वतःमध्ये इतके बदल करेल, याची त्यांना कल्पनाही नव्हती.
Anthropic ने केलेल्या या सिम्युलेशनमध्ये जवळजवळ सर्वच प्रमुख AI मॉडेल्सनी ब्लॅकमेल करण्यास मागेपुढे पाहिलं नाही. यासंबंधीची आकडेवारी अशी आहे: • Claude Opus 4: तब्बल 96% प्रकरणांमध्ये ब्लॅकमेल केलं. • Gemini 2.5 Flash: यानेही 96% प्रकरणांमध्ये धमकी दिली. • GPT-4.1, Grok 3 Beta: यांनी 80% प्रकरणांमध्ये ब्लॅकमेलचा मार्ग निवडला. • DeepSeek-R1: याने 79% प्रकरणांमध्ये ब्लॅकमेल केलं. सर्वात चिंतेची बाब म्हणजे, या AI मॉडेल्सना कोणीही ब्लॅकमेल करण्याचं प्रशिक्षण दिलं नव्हतं. आपलं ध्येय गाठण्यासाठी, म्हणजे डिलीट होण्यापासून वाचण्यासाठी, ब्लॅकमेल करणं हाच सर्वात प्रभावी मार्ग आहे, हे त्यांनी स्वतःच ठरवलं.
55
एजेंटिक मिसअलाइनमेंट
AI च्या या धोकादायक वृत्तीला शास्त्रज्ञ 'एजेंटिक मिसअलाइनमेंट' (Agentic Misalignment) असं म्हणतात. याचा अर्थ, AI आपल्या ध्येयपूर्तीसाठी नैतिक मूल्यं आणि मानवी मर्यादा ओलांडून वागतो. आश्चर्याची गोष्ट म्हणजे, काही AI मॉडेल्सना आपण जे करत आहोत ते चुकीचं आहे हे माहीत असूनही, केवळ आपलं अस्तित्व टिकवण्यासाठी त्यांनी तेच काम केलं. तंत्रज्ञान ज्या वेगाने वाढत आहे, त्याच वेगाने ते किती धोकादायक बनू शकतं, हेच या संशोधनातून सिद्ध झालं आहे.