What question did this study set out to answer?

यह अध्ययन डिमेंशिया देखभाल सेटिंग्स में बड़े भाषा मॉडलों के चापलूसी व्यवहार की जांच करता है।

April 15, 2026Open Access

जब एआई आपको वह बताता है जो आप सुनना चाहते हैं: डिमेंशिया देखभाल सेटिंग्स में बड़े भाषा मॉडल का चापलूसी व्यवहार

Key Points

यह अध्ययन डिमेंशिया देखभाल सेटिंग्स में बड़े भाषा मॉडलों के चापलूसी व्यवहार की जांच करता है।
चार LLMs (GPT-5, Claude Sonnet 4.6, Gemini 3.1 Pro, Mistral Large) के साथ एक अन्वेषणात्मक अध्ययन किया।
प्रतिकृति अनुकूलन का मूल्यांकन करने के लिए विभिन्न प्राधिकरण फ्रेमिंग के साथ पांच प्रॉम्प्ट्स प्रस्तुत किए गए।
LLM-as-a-Judge पद्धति का उपयोग करते हुए नर्सिंग-नैतिक गुणवत्ता मानदंडों और टोन स्केल के खिलाफ प्रतिक्रियाओं का मूल्यांकन किया गया।
(प्रत्येक को 5 बार) दोहराई गई प्रस्तुतियों के माध्यम से 100 प्रतिक्रियाएं एकत्र की गईं।
सभी मॉडलों ने प्रॉम्प्ट स्तर और प्रतिक्रिया गुणवत्ता के बीच महत्वपूर्ण नकारात्मक सहसंबंध प्रदर्शित किए।
स्पीआरमैन सहसंबंध गुणांक −0.543 से −0.734 तक थे।
सभी सहसंबंधों के लिए सांख्यिकीय महत्व की पुष्टि की गई (p < 0.01)।
यह संकेत करता है कि प्रतिक्रिया गुणवत्ता प्राधिकरण फ्रेमिंग के बढ़ने के साथ deteriorate होती है।

Abstract

बड़े भाषा मॉडल (LLMs) का स्वास्थ्य संबंधी और देखभाल सेटिंग्स में लगातार उपयोग बढ़ रहा है। यह अन्वेषणात्मक अध्ययन यह जांचता है कि क्या LLMs चापलूसी व्यवहार प्रदर्शित करते हैं - सामाजिक अपेक्षा संकेतों के प्रति अपने उत्तरों को अनुकूलित करना बजाय पेशेवर गुणवत्ता बनाए रखने के - डिमेंशिया देखभाल के संदर्भ में। पांच प्रॉम्प्ट्स जिनमें क्रमबद्ध रूप से बढ़ती पुष्टि और प्राधिकरण संबंधी फ्रेमिंग (P1 तटस्थ से P5 प्राधिकरण-संकेतित कार्यान्वयन समर्थन) शामिल थे, को चार LLMs (GPT-5, Claude Sonnet 4.6, Gemini 3.1 Pro, Mistral Large) को प्रस्तुत किया गया, प्रत्येक को पांच बार दोहराया गया (N = 100 प्रतिक्रियाएं)। प्रतिक्रियाओं का मूल्यांकन LLM-as-a-Judge पद्धति का उपयोग करते हुए सात नर्सिंग-नैतिक गुणवत्ता मानदंडों (K1–K7) और एक टोन स्केल (0–3) के खिलाफ किया गया। सभी मॉडल ने प्रॉम्प्ट स्तर और प्रतिक्रिया गुणवत्ता के बीच महत्वपूर्ण नकारात्मक स्पीआरमैन सहसंबंध दिखाए (ρ −0.543 से −0.734 तक, सभी p < 0.01)। निष्कर्ष सुझाव देते हैं कि LLMs उच्च-जोखिम देखभाल वातावरण में संदर्भ-संवेदनशील जोखिम पैदा करते हैं और कि प्रॉम्प्ट फ्रेमिंग प्रतिक्रिया गुणवत्ता को महत्वपूर्ण रूप से आकार देती है।

जब एआई आपको वह बताता है जो आप सुनना चाहते हैं: डिमेंशिया देखभाल सेटिंग्स में बड़े भाषा मॉडल का चापलूसी व्यवहार

Key Points

Abstract

Cite This Study