Key points are not available for this paper at this time.
오믹스에서의 합성 데이터 생성은 실제 생물학적 데이터를 모방하여 유전체 분석 도구의 훈련 및 평가를 위한 대안을 제공하고, 차별적 발현을 제어하며, 데이터 구조를 탐색합니다. 우리는 이전에 생물학적 연령을 예측하고 노화 및 노화 관련 질병에 관련될 수 있는 이중 목적의 치료 표적을 식별하기 위해 전사체 및 메틸화 데이터와 메타데이터로 훈련된 다중 모달 변환기인 Precious1GPT를 개발했습니다. 본 연구에서는 유전자 발현 및 DNA 메틸화 데이터로 훈련된 조건부 확산(CDiffusion) 및 디코더 전용 다중 오믹스 사전 훈련 변환기(MoPT) 모델을 통합한 다중 모달 아키텍처인 Precious2GPT를 소개합니다. Precious2GPT는 합성 데이터 생성에서 뛰어나며, 조건부 생성적 적대 신경망(CGANs), CDiffusion 및 MoPT를 능가합니다. 우리는 Precious2GPT가 실제 전사체 및 메틸오믹스 데이터에서 조직 및 연령 특정 정보 포착하는 대표적인 합성 데이터를 생성할 수 있음을 입증합니다. 특히, Precious2GPT는 생성된 데이터를 사용한 연령 예측 정확도에서 다른 모델을 초월하며, 120세 이상의 데이터를 생성할 수 있습니다. 또한, 이 모델을 사용하여 대장암 사례 연구에서 유전자 서명 및 잠재적 치료 표적을 식별하는 가능성을 보여줍니다.
Sidorenko et al. (Thu,)가 이 문제를 연구했습니다.