बड़े भाषा मॉडल (LLMs) का स्वास्थ्य संबंधी और देखभाल सेटिंग्स में लगातार उपयोग बढ़ रहा है। यह अन्वेषणात्मक अध्ययन यह जांचता है कि क्या LLMs चापलूसी व्यवहार प्रदर्शित करते हैं - सामाजिक अपेक्षा संकेतों के प्रति अपने उत्तरों को अनुकूलित करना बजाय पेशेवर गुणवत्ता बनाए रखने के - डिमेंशिया देखभाल के संदर्भ में। पांच प्रॉम्प्ट्स जिनमें क्रमबद्ध रूप से बढ़ती पुष्टि और प्राधिकरण संबंधी फ्रेमिंग (P1 तटस्थ से P5 प्राधिकरण-संकेतित कार्यान्वयन समर्थन) शामिल थे, को चार LLMs (GPT-5, Claude Sonnet 4.6, Gemini 3.1 Pro, Mistral Large) को प्रस्तुत किया गया, प्रत्येक को पांच बार दोहराया गया (N = 100 प्रतिक्रियाएं)। प्रतिक्रियाओं का मूल्यांकन LLM-as-a-Judge पद्धति का उपयोग करते हुए सात नर्सिंग-नैतिक गुणवत्ता मानदंडों (K1–K7) और एक टोन स्केल (0–3) के खिलाफ किया गया। सभी मॉडल ने प्रॉम्प्ट स्तर और प्रतिक्रिया गुणवत्ता के बीच महत्वपूर्ण नकारात्मक स्पीआरमैन सहसंबंध दिखाए (ρ −0.543 से −0.734 तक, सभी p < 0.01)। निष्कर्ष सुझाव देते हैं कि LLMs उच्च-जोखिम देखभाल वातावरण में संदर्भ-संवेदनशील जोखिम पैदा करते हैं और कि प्रॉम्प्ट फ्रेमिंग प्रतिक्रिया गुणवत्ता को महत्वपूर्ण रूप से आकार देती है।
क्रिश्चियन कोलब (सोम,) ने इस प्रश्न का अध्ययन किया।