What question did this study set out to answer?

यह अनुसंधान यह खोजने का प्रयास करता है कि प्रतिनिधित्व प्रारूप और मॉडल की उत्पत्ति बड़े भाषा मॉडलों में रंग चयन पूर्वाग्रह को कैसे प्रभावित करती है।

March 18, 2026Open Access

बड़े भाषा मॉडल में रंग पक्षपाती के अर्थपूर्ण अभिवर्धन: क्रॉस-भाषिक डिस्क्रीट चॉइस एक्सपेरिमेंट से साक्ष्य

Key Points

यह अनुसंधान यह खोजने का प्रयास करता है कि प्रतिनिधित्व प्रारूप और मॉडल की उत्पत्ति बड़े भाषा मॉडलों में रंग चयन पूर्वाग्रह को कैसे प्रभावित करती है।
10 भाषा मॉडलों (5 अमेरिका से, 5 चीन से) के बीच 4,000 परीक्षण किए गए।
अध्ययन 1 में हेक्स रंग कोड और अध्ययन 2 में प्राकृतिक भाषा रंग नामों का उपयोग करके विकल्पों का मूल्यांकन किया गया।
आंकिक विधियों का उपयोग करके चयन दरों और विविधता का विश्लेषण किया गया।
प्राकृतिक भाषा नामों के साथ नीले रंग की प्राथमिकता 91.8% के साथ काफी अधिक थी, जबकि हेक्स कोड के साथ यह 67.2% थी।
जब प्राकृतिक भाषा का उपयोग किया गया तो चयन विविधता 70% तक गिर गई, जो चयन में रंग विविधता को कम दर्शाती है।
पोजिशन पूर्वाग्रह दोनों परीक्षणों के दौरान बना रहा, विशेष रूप से चयन में स्थिति 1 को प्राथमिकता देते हुए।

Abstract

बड़े भाषा मॉडल (एलएलएम) को निर्णय लेने वाले संदर्भों में लगातार तैनात किया जा रहा है, फिर भी विभाज्य विकल्पों में व्यवस्थित पूर्वाग्रहों को अच्छी तरह से समझा नहीं गया है। हमने 10 अत्याधुनिक मॉडलों (5 अमेरिका के, 5 चीन के) के बीच 4,000 रंग चयन परीक्षण किए ताकि यह जांचा जा सके कि प्रतिनिधित्व प्रारूप, मॉडल की उत्पत्ति, और संकेत भाषा चयन व्यवहार को कैसे प्रभावित करती है। अध्ययन 1 (N=2,000) में, मॉडलों ने हेक्स रंग कोड से चयन किया, जिसमें नीले रंग के लिए 67.2% स्पष्ट प्राथमिकता थी, जो अपेक्षित समान दर से लगभग सात गुना अधिक है। अध्ययन 2 (N=2,000) ने हेक्स कोड के बजाय प्राकृतिक भाषा रंग नामों का उपयोग करके डिज़ाइन को दोहराया। इस परिकल्पना के विपरीत कि नीले रंग की प्राथमिकता हेक्स कोड के कलाकृतियों से आती है, प्राकृतिक भाषा ने पूर्वाग्रह को बढ़ा दिया: नीले चयन 91.8% (+24.6 प्रतिशत अंक) तक बढ़ गया, जबकि चयन विविधता 70% (शैनन एंट्रॉपी: 1.720 → 0.506 बिट्स पर T=0.0) तक गिर गई। दस रंगों में से छह नाम के साथ शून्य चयन प्राप्त हुए, जबकि सभी रंगों को हेक्स कोड के साथ चुना गया। स्थिति पूर्वाग्रह दोनों प्रतिनिधित्वों में मजबूत रहा (पोजिशन 1: 14.1% चयन दर, χ2=77.23, p<0.001)। आपसी सांस्कृतिक प्रभाव न्यूनतम थे: चीनी मॉडलों ने चीनी में संकेत दिए तो लाल रंग की प्राथमिकता नहीं दिखाई (कुल 3.85%), और एफडीआर सुधार के बाद की उत्पत्ति प्रभाव छोटे थे (क्रामेर का V≤0.102)। तापमान robustness परीक्षण (T=0.0) ने पुष्टि की कि पूर्वाग्रह निर्धारक नमूनाकरण के तहत बने रहते हैं। ये निष्कर्ष दर्शाते हैं कि एलएलएम चयन पूर्वाग्रह अर्थपूर्ण तरीके से मध्यस्थता किए जाते हैं न कि प्रतिनिधित्व कलाकृतियों द्वारा, सुझाव देते हुए कि सीखे गए भाषाई संघ, संभवतः प्रशिक्षण कॉर्पस में पारिस्थितिकी कल्याण पैटर्न से, प्रणालीगत प्राथमिकताओं को प्रेरित करते हैं। हमारे परिणाम दिखाते हैं कि मॉडल की उत्पत्ति सांस्कृतिक भिन्नता रंग प्राथमिकताओं का उत्पादन नहीं करती है और एलएलएम तैनाती में प्रतिनिधित्व-सचेत पूर्वाग्रह मूल्यांकन प्रोटोकॉल की आवश्यकता को उजागर करती है.

बड़े भाषा मॉडल में रंग पक्षपाती के अर्थपूर्ण अभिवर्धन: क्रॉस-भाषिक डिस्क्रीट चॉइस एक्सपेरिमेंट से साक्ष्य

Key Points

Abstract

Cite This Study