Key points are not available for this paper at this time.
الدافع: في أبحاث المعلوماتية الحيوية الإحصائية، قد تؤدي آليات تحسين مختلفة إلى "التفاؤل المفرط" في الأوراق المنشورة. حتى الآن، ومع ذلك، هناك نقص في دراسة نقدية منهجية تتعلق بالمصادر المختلفة التي تكمن وراء هذا التفاؤل المفرط. النتائج: نقدم دراسة تجريبية حول التفاؤل المفرط باستخدام التصنيف عالي الأبعاد كمثال. على وجه التحديد، ندرس خوارزمية تصنيف "واعدة" جديدة، وهي تحليل التمييز الخطي الذي يدمج المعرفة السابقة حول المجموعات الوظيفية للجينات من خلال قبض مناسب لمصفوفة التغاير داخل المجموعة. بينما تعطي هذه الطريقة نتائج ضعيفة من حيث معدل الخطأ، نظهر بشكل كمي أنه يمكن أن تبدو متفوقة مصطنعًا على الأساليب الموجودة إذا قمنا بـ"الصيد من أجل الدلالة الإحصائية". تشمل المصادر التي تم التحقيق فيها للتفاؤل المفرط تحسين مجموعات البيانات، والتحسينات في الإعدادات، والأساليب المنافسة، والأهم من ذلك خصائص الطريقة نفسها. نخلص إلى أنه إذا كان تحسين مقياس كمي مثل معدل الخطأ هو المساهمة الرئيسية في الورقة، فيجب دائمًا إثبات تفوق الخوارزميات الجديدة على بيانات تحقق مستقلة. التوفر: يمكن تنزيل أكواد R والبيانات ذات الصلة من http://www.ibe.med.uni-muenchen.de/organisation/mitarbeiter/020ₚrofessuren/boulesteix/overoptimism/، بحيث تكون الدراسة قابلة للاستنساخ بالكامل.
Building similarity graph...
Analyzing shared references across papers
Loading...
Monika Jelizarow
Vincent Guillemot
Arthur Tenenhaus
Bioinformatics
Supélec
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Jelizarow وآخرون هذه المسألة.
www.synapsesocial.com/papers/6a079994f8ea14d3ccc644c9 — DOI: https://doi.org/10.1093/bioinformatics/btq323
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: