Key points are not available for this paper at this time.
背景:遺伝子正規化の課題の目的は、文献中で言及された遺伝子または遺伝子産物を生物学的データベースにリンクすることです。これは生物学文献の正確な検索において重要なステップです。専門家であっても困難な課題であり、遺伝子はしばしば遺伝子記号でなく記述され、一つの遺伝子名が異なる遺伝子(しばしば異なる生物種)を指すことが混乱を招きます。BioCreative II の課題は、PubMed/MEDLINE 抄録において言及されたヒト遺伝子または遺伝子産物の Entrez Gene 識別子を列挙することでした。ヒト遺伝子に関する記事として事前にキュレーションされた抄録を選択しました。訓練用に684遺伝子識別子を含む281件の専門家注釈付き抄録を提供し、785識別子を含む262文書のブラインドテストセットを作成し、専門家によるゴールドスタンダードも用意しました。アノテーター間の一致率は90%以上でした。結果:20グループが各1~3件ずつ提出し、合計54件のランを得ました。3システムはF値(適合率と再現率の調和平均)0.80~0.81を達成しました。単純な投票方式や分類器を用いたシステム出力の統合により結果が改善し、最高の合成システムは10分割交差検証でF値0.92を達成しました。全参加者の結果を統合した「最大再現率」システムは、精度0.23で再現率0.97を示し、785識別子中763を特定しました。結論:BioCreative II 遺伝子正規化課題における大きな進歩は、参加チーム数の拡大(8から20チームへ)と、人間専門家並みの全体的なシステム性能(90%以上の一致率)です。これらの結果は、文献と生物学データベースを結びつけるツールとして有望です。
Building similarity graph...
Analyzing shared references across papers
Loading...
Alexander A. Morgan
Zhiyong Lu
Xinglong Wang
Genome biology
Stanford University
University of California, Berkeley
National Institutes of Health
Building similarity graph...
Analyzing shared references across papers
Loading...
Morgan et al. (Mon,) はこの問題を研究しました。
www.synapsesocial.com/papers/6a0711d985d51e7cc7583d04 — DOI: https://doi.org/10.1186/gb-2008-9-s2-s3