बड़े भाषा मॉडल (एलएलएम) को निर्णय लेने वाले संदर्भों में लगातार तैनात किया जा रहा है, फिर भी विभाज्य विकल्पों में व्यवस्थित पूर्वाग्रहों को अच्छी तरह से समझा नहीं गया है। हमने 10 अत्याधुनिक मॉडलों (5 अमेरिका के, 5 चीन के) के बीच 4,000 रंग चयन परीक्षण किए ताकि यह जांचा जा सके कि प्रतिनिधित्व प्रारूप, मॉडल की उत्पत्ति, और संकेत भाषा चयन व्यवहार को कैसे प्रभावित करती है। अध्ययन 1 (N=2,000) में, मॉडलों ने हेक्स रंग कोड से चयन किया, जिसमें नीले रंग के लिए 67.2% स्पष्ट प्राथमिकता थी, जो अपेक्षित समान दर से लगभग सात गुना अधिक है। अध्ययन 2 (N=2,000) ने हेक्स कोड के बजाय प्राकृतिक भाषा रंग नामों का उपयोग करके डिज़ाइन को दोहराया। इस परिकल्पना के विपरीत कि नीले रंग की प्राथमिकता हेक्स कोड के कलाकृतियों से आती है, प्राकृतिक भाषा ने पूर्वाग्रह को बढ़ा दिया: नीले चयन 91.8% (+24.6 प्रतिशत अंक) तक बढ़ गया, जबकि चयन विविधता 70% (शैनन एंट्रॉपी: 1.720 → 0.506 बिट्स पर T=0.0) तक गिर गई। दस रंगों में से छह नाम के साथ शून्य चयन प्राप्त हुए, जबकि सभी रंगों को हेक्स कोड के साथ चुना गया। स्थिति पूर्वाग्रह दोनों प्रतिनिधित्वों में मजबूत रहा (पोजिशन 1: 14.1% चयन दर, χ2=77.23, p<0.001)। आपसी सांस्कृतिक प्रभाव न्यूनतम थे: चीनी मॉडलों ने चीनी में संकेत दिए तो लाल रंग की प्राथमिकता नहीं दिखाई (कुल 3.85%), और एफडीआर सुधार के बाद की उत्पत्ति प्रभाव छोटे थे (क्रामेर का V≤0.102)। तापमान robustness परीक्षण (T=0.0) ने पुष्टि की कि पूर्वाग्रह निर्धारक नमूनाकरण के तहत बने रहते हैं। ये निष्कर्ष दर्शाते हैं कि एलएलएम चयन पूर्वाग्रह अर्थपूर्ण तरीके से मध्यस्थता किए जाते हैं न कि प्रतिनिधित्व कलाकृतियों द्वारा, सुझाव देते हुए कि सीखे गए भाषाई संघ, संभवतः प्रशिक्षण कॉर्पस में पारिस्थितिकी कल्याण पैटर्न से, प्रणालीगत प्राथमिकताओं को प्रेरित करते हैं। हमारे परिणाम दिखाते हैं कि मॉडल की उत्पत्ति सांस्कृतिक भिन्नता रंग प्राथमिकताओं का उत्पादन नहीं करती है और एलएलएम तैनाती में प्रतिनिधित्व-सचेत पूर्वाग्रह मूल्यांकन प्रोटोकॉल की आवश्यकता को उजागर करती है.
पुणीत कुमार बजाज (सोम,) ने इस प्रश्न का अध्ययन किया।