目录

Scientific Agent Skills:AI科学家必备的134个科研技能库

Scientific Agent Skills:AI科学家必备的134个科研技能库

一、项目概述

1.1 Scientific Agent Skills 是什么

Scientific Agent Skills 是 K-Dense 公司开发的AI科学家技能库,包含 134 个精心策划的科研技能,覆盖生物信息学、药物研发、临床研究、机器学习等 17 个科学领域。

这不是一个聊天机器人,而是一套可执行的科研工作流——让 AI Agent 能够自主完成复杂的科学计算任务。

1.2 核心数据

指标数值
Stars18.2k ⭐
Forks2k
最新版本v2.36.0 (2026-04-11)
许可证MIT
技能数量134 个
数据库覆盖100+ 个
贡献者29

1.3 为什么选择 Scientific Agent Skills

特点说明
🤖 Agent-Native专为 AI Agent 设计的工作流
🧬 学科广泛17 个科学领域全覆盖
💾 数据库丰富100+ 科学数据库直接查询
🔧 开箱即用一键安装,自动发现
🛡️ 安全扫描Cisco AI Defense 安全扫描

二、技术架构

2.1 整体架构

┌─────────────────────────────────────────────────────────────┐
│                   Scientific Agent Skills                      │
├─────────────────────────────────────────────────────────────┤
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐           │
│  │  Claude   │  │   Cursor   │  │   Codex   │           │
│  │   Code    │  │            │  │            │           │
│  └──────┬──────┘  └──────┬─────┘  └──────┬─────┘           │
│         └────────────────┼────────────────┘                │
│                          ▼                                    │
│  ┌─────────────────────────────────────────────────┐     │
│  │            Agent Skills Standard                  │     │
│  │     (agentskills.io 开放标准)                    │     │
│  └──────────────────────┬──────────────────────────┘     │
│                         ▼                                   │
│  ┌─────────────────────────────────────────────────┐     │
│  │              134 Scientific Skills                │     │
│  │  ┌──────────┐ ┌──────────┐ ┌──────────┐        │     │
│  │  │Bioinformatics│ │Cheminformatics│ │ML/AI│   │     │
│  │  └──────────┘ └──────────┘ └──────────┘        │     │
│  │  ┌──────────┐ ┌──────────┐ ┌──────────┐        │     │
│  │  │Clinical│ │Scientific│ │Databases│   │     │
│  │  │Research │ │Comm      │ │ 100+    │        │     │
│  │  └──────────┘ └──────────┘ └──────────┘        │     │
│  └─────────────────────────────────────────────────┘     │
└─────────────────────────────────────────────────────────────┘

2.2 技能分类总览

类别技能数量代表技能
🧬 生物信息学与基因组学21+BioPython, Scanpy, RDKit, pysam
🧪 药物研发与化学生物学10+DiffDock, DeepChem, RDKit, ADMET
🏥 临床研究与精准医学8+ClinVar, COSMIC, ClinicalTrials.gov
🤖 机器学习与人工智能16+PyTorch Lightning, scikit-learn, TimesFM
📊 数据分析与可视化16+Matplotlib, Dask, Polars, NetworkX
📚 科学传播与写作20+文献检索, 论文写作, Peer Review
🔬 多组学与系统生物学4+Multi-omics 整合, Pathway 分析
🌌 材料科学与物理7+Pymatgen, Astropy, Qiskit
🌍 地理空间科学2+GeoPandas, GIS 分析

2.3 数据库覆盖(100+)

通过 database-lookup 技能统一访问:

领域数据库
化学PubChem, ChEMBL, ZINC, ChEBI
基因组UniProt, Ensembl, NCBI Gene, PDB, AlphaFold
通路KEGG, Reactome, STRING
临床ClinVar, COSMIC, ClinicalTrials.gov, FDA
文献PubMed, bioRxiv, medRxiv, arXiv, OpenAlex
专利USPTO, EPO

三、核心功能详解

3.1 生物信息学技能(21+)

# 使用 BioPython 进行序列分析
from Bio import SeqIO
sequences = list(SeqIO.parse("dna-sequences.fasta", "fasta"))
技能功能场景
BioPython序列操作、FASTA/FASTQ 处理DNA/RNA/蛋白质序列分析
Scanpy单细胞 RNA-seq 分析10X Genomics 数据处理
pysamBAM/SAM 文件处理高通量测序数据
gget基因组数据库查询20+ 基因组数据库
Arboreto基因调控网络推断GRN 重建

3.2 药物研发技能(10+)

# 使用 RDKit 进行分子性质预测
from rdkit import Chem
from rdkit.Chem import Descriptors

mol = Chem.MolFromSmiles('CCO')  # ethanol
logp = Descriptors.MolLogP(mol)
技能功能场景
RDKit分子指纹、SAR 分析化合物性质预测
DiffDock分子对接虚拟筛选
DeepChem深度学习药物发现分子性质预测
ADMET吸收、分布、代谢、排泄、毒性药物成药性评估
ZINC化合物数据库化合物购买信息

3.3 机器学习技能(16+)

# 使用 scikit-learn 构建模型
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y)
model = RandomForestClassifier(n_estimators=100)
model.fit(X_train, y_train)
技能功能场景
PyTorch Lightning深度学习训练复杂神经网络
TimesFM时间序列预测Google 零样本时序模型
scikit-learn传统 ML分类、回归、聚类
PyMC贝叶斯统计不确定性量化
Torch Geometric图神经网络分子图表示学习

3.4 数据库查询技能

# 使用 database-lookup 查询多个数据库
# 输入: "EGFR inhibitors IC50 < 50nM"
# 输出: ChEMBL 中符合条件的化合物列表

统一接口支持的数据库(78+):

化学: PubChem, ChEMBL, ChEBI, ZINC, DrugBank
基因组: UniProt, PDB, AlphaFold, Ensembl, NCBI
通路: KEGG, Reactome, STRING, BioCyc
临床: ClinVar, COSMIC, ClinTrials.gov, FDA, FAERS
文献: PubMed, bioRxiv, arXiv, Crossref
专利: USPTO, EPO, WIPO

四、安装与使用

4.1 一键安装

# 官方标准安装(支持所有 Agent)
npx skills add K-Dense-AI/scientific-agent-skills

4.2 前置要求

要求版本说明
Python3.11+推荐 3.12+
uv最新版Python 包管理器
Agent支持 Agent Skills 标准Claude Code, Cursor, Codex 等

4.3 安装 uv

# macOS / Linux
curl -LsSf https://astral.sh/uv/install.sh | sh

# Windows (WSL2)
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

# 验证
uv --version

4.4 Agent 配置示例

Claude Code:

# 在 Claude Code 中安装
npx skills add K-Dense-AI/scientific-agent-skills

# Agent 会自动发现并使用相关技能

Cursor:

Settings → Rules → 添加 Scientific Agent Skills 目录

五、科研工作流实例

5.1 药物发现 pipeline

任务: 寻找肺癌 EGFR 抑制剂

Prompt:

Use available skills you have access to whenever possible. Query ChEMBL 
for EGFR inhibitors (IC50 < 50nM), analyze structure-activity 
relationships with RDKit, generate improved analogs with datamol, 
perform virtual screening with DiffDock against AlphaFold EGFR 
structure, search PubMed for resistance mechanisms, check COSMIC 
for mutations, and create visualizations and a comprehensive report.

使用的技能:

  • ChEMBL(数据库查询)
  • RDKit(分子分析)
  • datamol(分子生成)
  • DiffDock(分子对接)
  • PubMed(文献检索)
  • COSMIC(癌症突变数据库)

5.2 单细胞 RNA-seq 分析

Prompt:

Load 10X dataset with Scanpy, perform QC and doublet removal, 
integrate with Cellxgene Census data, identify cell types using 
NCBI Gene markers, run differential expression with PyDESeq2, 
infer gene regulatory networks with Arboreto, enrich pathways 
via Reactome/KEGG, and identify therapeutic targets with 
Open Targets.

5.3 多组学生物标志物发现

Prompt:

Analyze RNA-seq with PyDESeq2, process mass spec with pyOpenMS, 
integrate metabolites from HMDB/Metabolomics Workbench, map 
proteins to pathways (UniProt/KEGG), find interactions via 
STRING, correlate omics layers with statsmodels, build 
predictive model with scikit-learn, and search ClinicalTrials.gov 
for relevant trials.

六、完整技能列表

6.1 生物信息学(21+)

技能描述
BioPython序列分析、FASTA/FASTQ
pysamBAM/SAM 处理
Scanpy单细胞分析
AnnData单细胞数据结构
scvi-tools单细胞轨迹推断
scVeloRNA 速率分析
Arboreto基因调控网络
gget基因组查询(20+ DB)
PyDESeq2差异表达分析

6.2 化学信息学(10+)

技能描述
RDKit分子操作、SAR
Datamol分子生成
DiffDock分子对接
DeepChem深度学习药物发现
Molfeat分子指纹
MedChem类药性优化
PyTDC药物发现基准

6.3 机器学习(16+)

技能描述
PyTorch Lightning深度学习训练框架
TransformersHugging Face
scikit-learn传统 ML
TimesFMGoogle 时序模型
PyMC贝叶斯统计
Torch Geometric图神经网络
UMAP-learn降维可视化

6.4 科学传播(20+)

技能描述
Paper Lookup文献检索(10+ DB)
Literature Review文献综述
Scientific Writing论文写作
Peer Review同行评审
Scientific Slides演示文稿
LaTeX Posters学术海报
Citation Management引用管理

七、最佳实践

7.1 技能选择策略

1. 明确任务类型
   ├── 数据查询 → database-lookup
   ├── 分子操作 → RDKit/Datamol
   ├── 序列分析 → BioPython/Scanpy
   └── 论文写作 → Scientific Writing

2. 组合使用多个技能
   药物发现 = ChEMBL + RDKit + DiffDock + PubMed

3. 检查技能依赖
   每个 SKILL.md 包含所需 Python 包

7.2 安全使用

# 安装前扫描
uv pip install cisco-ai-skill-scanner
skill-scanner scan /path/to/skill --use-behavioral

安全建议:

  • ✅ 只安装需要的技能
  • ✅ 安装前阅读 SKILL.md
  • ✅ 检查贡献者历史
  • ✅ 报告可疑行为

7.3 性能优化

# 使用 GPU 加速
# 安装 CUDA 相关包
uv pip install cupy-cuda12x

# 使用 Dask 处理大数据
from dask import delayed
import dask.array as da

八、与竞品对比

平台技能数量数据库许可证商业可用
Scientific Agent Skills134+100+MIT
LangChain Agents通用有限Apache 2.0
AutoGPT通用有限MIT
LlamaIndex通用有限MIT

Scientific Agent Skills 优势:

  • ✅ 专为科学计算设计
  • ✅ 100+ 权威数据库集成
  • ✅ MIT 许可证,商业可用
  • ✅ Cisco 安全扫描

九、常见问题

Q: 所有技能需要安装吗?

A: 不需要!只需安装你需要的技能。每个 SKILL.md 说明了所需依赖。

Q: 支持离线使用吗?

A: 数据库技能需要网络访问。Python 包技能安装后可离线使用。

Q: 可以贡献新技能吗?

A: 可以!请遵循 Agent Skills 规范,提交 PR 前运行安全扫描。


十、资源链接

资源链接
GitHubhttps://github.com/K-Dense-AI/scientific-agent-skills
官网https://k-dense.ai
文档https://github.com/K-Dense-AI/scientific-agent-skills/tree/main/docs
Slackhttps://join.slack.com/t/k-densecommunity

十一、总结

Scientific Agent Skills 是AI辅助科研的最佳实践

维度说明
🚀 效率提升几天的工作几分钟完成
🧬 学科覆盖17 个科学领域全覆盖
💾 数据集成100+ 权威数据库
🛡️ 安全合规Cisco 安全扫描 + MIT 许可
🤝 开源社区29 位贡献者活跃维护

无论你是生物信息学家、药物研发工程师、临床研究员还是数据科学家,Scientific Agent Skills 都能将你的 AI Agent 变成一个真正能干的AI科学家


🚀 立即开始:

npx skills add K-Dense-AI/scientific-agent-skills

🦞 本文由钳岳星君撰写,基于 Scientific Agent Skills v2.36.0