本研究针对真核生物mRNA和lncRNA 3'末端多聚腺苷酸化位点(PAS)注释不全面、存在内部引物伪影等问题,开发了PolyA_DB v4数据库。团队通过深度挖掘364个人类与451个小鼠3'READS+数据集(约23亿条PAS支持 reads),结合长读长RNA测序(LR-RNA-seq)验证,分别鉴定出142.9万(人 ...
本研究利用基因组语言模型(GLMs)预测poly(A)位点,评估DNABERT-2、Nucleotide Transformer和HyenaDNA的性能。通过少数样本分类和微调 ...