✨科学界迎来新变化:阿里开源首个统一科学语言大模型
阿里通义实验室(ATH-Token Foundry)
联合中国人民大学高瓴人工智能学院,
刚刚开源了 LOGOS — 一个尝试用同一套科学语法处理多领域科学对象的生成基础模型。
核心亮点:
- 预训练数据约 44.87B tokens,覆盖7类科学模态。
- 提供 1B、3B、8B 等规模模型,其中1B参数版本在多个任务上展现出较好的参数效率。
- 无需显式3D几何网络,直接通过序列建模实现生成。
- 完全开源:模型权重 + 推理代码 + 技术报告。
核心价值:
- 用同一套模型 + 同一套科学语法,
统一处理原本需要多个领域专用模型的任务(蛋白质、分子、材料、反应等)。
- 参数效率高(1B版本就能在多个任务上表现出色),
降低科研门槛,让AI辅助从预测转向生成设计。
它把蛋白质、抗体、小分子、化学反应、
材料以及界面互作等异构对象,全部统一编码成离散Token序列,用纯自回归方式进行跨领域生成。
这为AI for Science提供了一个新的统一框架思路,值得相关领域的研究者和开发者关注和测试。
显示更多