
在药物研发的漫长征途上,每一步都承载着对更快、更精准分子设计方法的渴望。从传统的高通量筛选,到计算化学与机器学习深度融合,再到大模型生成设计的兴起,技术正以前所未有的速度重塑药物研发格局,大幅缩短了候选分子从概念到诞生的时间。
SciMiner 平台自上线以来,集成了多款国际前沿的 AI 药物设计工具,打造从靶点分析到分子生成、优化、评估的全流程支持体系。今天,我们很高兴地宣布:全新上下文驱动分子生成工具——Assay2Mol正式登陆 SciMiner,为药物设计注入全新活力!

解析难:实验记录往往是自然语言,包含复杂的生物学逻辑(例如“某分子通过抑制 GRK2 发挥作用”),传统算法很难将这些信息转化为可操作的设计线索。结果是——大量宝贵的实验数据被困在‘信息孤岛’中,无法指导分子生成。
Assay2Mol 利用大型语言模型(LLM)强大的自然语言理解与上下文学习能力,将 BioAssay 的文本描述转化为分子生成的条件提示,打破了结构依赖限制,建立起从实验数据 → 分子设计的桥梁。它将分散的实验数据转化为可操作的知识图谱,推动药物早期研发进入以实验背景驱动的新阶段。
1. 实验数据深度解析引擎
2. 突破性无结构设计能力
无需蛋白三维结构,即便靶点结构未知,也能根据实验上下文生成高相关性分子,大大提升早期项目的探索自由度。
3. 活性与成药性双优化
生成分子不仅活性更高,还具备更优的类药性,能够有效规避潜在副作用,显著提升药物的安全性和开发成功率。
4. 全场景智能适配系统
强大的 prompt 设计能力支持各种复杂实验上下文,无论简单活性筛选还是复杂机制研究,都能精准适配。
为了满足不同用户的需求,平台为 Assay2Mol 设置了两个便捷接口:
1.自定义 API Key 接口:此接口允许自行添加大模型的 API Key。使用该接口时,平台不会扣除积分。
2.积分调用接口:若不想自行添加 API Key,可选择此接口。在该接口中,只需选定所需的大模型,即可使用平台预设的模型资源,但会消耗一定数量的积分。
参数名 | 说明 |
model_name | 用于分子生成的大模型,支持 ChatGPT-4o、DeepSeek-V3 |
ProteinDescription | 输入蛋白质文本描述(功能、结构域、通路等) |
pdb_id | 靶点PDB ID,增强结构相关性 |
uniprot_id | UniProt编号,自动关联靶点标准化信息 |
ID_mapping_file | 上传自定义靶点映射文件 |
pains_file | PAINS过滤规则文件,排除潜在假阳性活性分子 |
num_mol | 每轮生成候选分子数量,默认50 |
num_assays | 提取相关BioAssay记录数量,默认20 |
max_molecule_size | 最大分子原子数,默认50 |
num_generated_molecules | 最终输出优选分子总数,默认200 |
openai_api_key | ChatGPT-4o API密钥(自定义API Key接口使用) |
deepseek_api_key | DeepSeek-V3 API密钥(自定义API Key接口使用) |


Assay2Mol输出界面图
JAK2 是细胞因子受体下游的关键酪氨酸激酶,介导 STAT 转录因子的磷酸化与激活,在免疫信号调控与造血功能维持中扮演核心角色。传统 SBDD 在此靶点上高度依赖晶体结构,而早期发现阶段往往缺乏高质量结构信息。
smi_id | Affinity | smiles |
smi18 | -10.11 | CC1=CC(=NC=C1F)NC2=NC=C(C(=C2)NC3=CC=CC(=C3OC)C4=NNC(=N4)C)C(=O)NC |
smi15 | -10.02 | CC1=CC(=NC=C1F)NC2=NC=C(C(=N2)NC3=CC=CC(=C3OC)C4=NNC(=N4)C)C(=O)NC |
smi59 | -9.93 | CC1=CC(=NC=C1F)NC2=NC=C(C(=N2)NC3=CC=CC(=C3OC)C4=NC=NN4)C(=O)NC |
smi66 | -9.92 | CN1C=C(C=N1)NC2=NC=C(C(=N2)NC3=CC=CC(=C3OC)C4=NC=NN4)C(=O)NC |
smi86 | -9.87 | CNC(=O)C1=CN=C(C=C1NC2=CC=CC(=C2OC)C3=NN(C=N3)C)NC4=NC=C(C=C4)CN |
smi12 | -9.83 | CC1=CC(=NC=C1F)NC2=NC=C(C(=N2)NC3=CC=CC(=C3OC)C(=O)NCCN4CCOCC4)C(=O)NC |
smi55 | -9.83 | CC1=CC(=NC=C1F)NC2=NC=C(C(=C2)NC3=CC=CC(=C3OC)C4=NN(C=N4)C)C(=O)NC |
smi78 | -9.82 | CNC(=O)C1=CN=C(C=C1NC2=CC=CC(=C2OC)C3=NN(C=N3)C)NC4=NC=C(C=C4)CO |
smi30 | -9.8 | CC1=CN=C(N=C1NC2=CC=CC(=C2)CO)NC3=CC(=CC(=C3)S(=O)(=O)C)N4CCN(CC4)C(=O)C |
smi97 | -9.79 | CC1=CC(=NC=C1F)NC2=NC=C(C(=C2)NC3=CC=CC(=C3OC)C4=NC=NN4)C(=O)NC |
原配体的亲和力预测为 -9.74,而上述这些生成的小分子亲和力均优于原配体,这充分证明了 Assay2Mol 在分子生成方面的能力。它能够深入挖掘实验数据中的潜在信息,生成可能具有更高活性的分子,为药物研发提供了更多优质的候选分子。
暂无评论