Gc-Msで用いられるnistデータベースには約35万件の化合物が収録されているが,誘導体化法などの前処理技術の発展によりgc/Msの適用範囲が広がっていることもあり,nist データベースに登録されていない未知化合物が多く存在する.著者らはこの未知化合物の解析のために精密質量測定が可能なgc-Tof-Msと機械学習を組み合わせた手法を開発してきた.今回は,本手法の改良を目的にeiマススペクトルを対象とした予測精度の向上と構造式候補の拡充を図った.予測精度の向上については,入力するデータ及びモデルの最適化により,コサイン類似度で0.72から0.86まで向上できた.候補の拡充については,tms誘導体化と樹脂の熱分解反応を計算で再現することにより,大幅な増加を達成した.また,応用事例として代謝物試料に改良した手法を適用した.その結果,代謝物試料中のnistデータベースに無い化合物の構造式を推定することができた.
Kubo et al. (Thu,) studied this question.