中文
🎓 博士申请

我正在准备博士生申请,期望研究方向为:

  • 深度学习
  • 计算生物学
  • 人工智能

如果你对我的研究感兴趣,欢迎联系我!

Yiquan Wang(王一权)

王一权个人照片

新疆大学数学与系统科学学院(新疆-乌鲁木齐)
国家理科基础学科研究和教学人才培养"数学"基地
数学与应用数学专业
清华大学钱学森班-零一学院(广东-深圳)
零一学者
IEEE Biometrics Council, membership
E-mail: wyqmath@gmail.com
E-mail: ethan@stu.xju.edu.cn
E-mail: wangyiquan@mails.x-institute.edu.cn
联系方式/微信:+86-19537838515

Artificial Intelligence Deep Learning AI for Science Bioinformatics Computational Biology Mathematical Modeling Neuroscience

个人简介

王一权是新疆大学的本科生,同时也是清华大学钱学森班与深圳零一学院的联合培养学者。他的研究方向为科学智能(AI for Science),致力于融合深度学习、计算生物学与生物信息学等交叉学科方法,以探究复杂的生命系统。其研究工作涵盖蛋白质功能预测、生物序列表征学习、蛋白质设计优化以及蛋白质动力学等领域。研究成果已发表于《Journal of Chemical Information and Modeling》等国际期刊,并被ICLR、ICML、AAAI、BIBM等人工智能或生物信息学领域的顶级会议及其研讨会(Workshop)录用。

教育经历

本科 新疆大学 数学与系统科学学院--国家理科基础学科研究和教学人才培养"数学"基地--数学与应用数学专业 , 2023.09-2027.06

联培 清华大学钱学森班-零一学院 , 2024.06-2027.06

访问学生 深圳湾实验室-神经疾病研究所-袁文课题组, 2025.07-2025.09

  • 研究方向:神经科学、生物化学、计算生物学

研究经历

精选论文

  1. Wang, Y., Cai, M., Dong, Y., et al. (2025). From Signal to Symphony: Exploring 2D Sequence Representations for Protein Function Prediction. Journal of Chemical Information and Modeling (JCR Q1, CAS Q2 Top).

  2. Wang, Y., Ma, Y., Chang, Y., et al. (2025). Diffusion Models at the Drug Discovery Frontier: A Review on Generating Small Molecules versus Therapeutic Peptides. biology (JCR Q1, CAS Q2).

  3. Wang, Y., Zai, J., Liu, Z., et al. (2025). Resilient AI Infrastructure by Design: A Spatially-Aware Framework for Tolerating Clustered Failures. In 4th Annual AAAI Workshop on AI to Accelerate Science and Engineering (AI2ASE).

  4. Wang, Y., Cai, M., Zhang, J., et al. (2025). Adaptive Decision-Making in Multi-Stage Production: A Framework for Cost Optimization under Sampling Uncertainty. Applied Operations and Analytics.

  5. Wang, Y.*, Cai, M., & Huang, T. Y. (2025). AI for disease prediction: Performance insights and key limitations. Journal of Clinical Neuroscience, 138, 111360. (letter, JCR Q3, CAS Q4)

  6. Wang, Y.*, Huang, T. Y., Gao, Q., & Zhang, J. (2025). HeDA: An Intelligent Agent System for Heatwave Risk Discovery through Automated Knowledge Graph Construction and Multi-layer Risk Propagation Analysis. arXiv preprint arXiv:2509.25112.

  7. Wang, X., Wang, Y., & Huang, T. Y. (2025). Crypto-ncRNA: Non-coding RNA (ncRNA) Based Encryption Algorithm. ICLR 2025 Workshop. (Co-first author).

  8. Wang, X., Wang, Y.*, Huang, T. Y., et al. (2025). Octopus Inspired Optimization (OIO): A Hierarchical Framework for Navigating Protein Fitness Landscapes. In 2025 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE. (CCF-B, Co-first author).

  9. Wang, X., Wang, Y.*, & Pan, J. (2025). Digital Art Creation and Copyright Protection in Pollock Style Using GANs, Fractal Analysis, and NFT Generation. ICLR 2025 Workshop. (Co-first author).

  10. Wang, Y.*, Zhang, J., & Chang, Y. (2024, November). A probability prediction model for flood disasters based on Multi-layer Perceptron. In Journal of Physics: Conference Series (Vol. 2905, No. 1, p. 012003). IOP Publishing.

Note: *通讯作者

在Google Scholar的全部文章.

学术参与

Reviewer

  • NeurIPS 2025 AI for Science Workshop link

  • NeurIPS 2025 MATH-AI Workshop link

  • ICML 2025 Workshop on AI for Math link

  • ICLR 2025 Workshop on AI for Nucleic Acids link

  • ICLR 2025 Workshop: The 1st Workshop on GenAI Watermarking link

  • Mini-Reviews in Medicinal Chemistry link

  • Current Science link

  • F1000 Research link

科研项目

  1. 清华大学钱学森班ESRT:From Signal to Symphony: Exploring 2D Sequence Representations for Protein Function Prediction, 2024.8-2025.10

    • 摘要:从蛋白质一级序列预测其功能是计算生物学中的一个基本挑战。虽然深度学习已经取得了显著成就,但序列数据的最优表示方式仍然是一个开放问题。本研究探索了蛋白质声化——将氨基酸序列转换为二维频谱图——作为该任务的表示方法。为了促进这一研究,我们开发了一个包含18,000条序列的基准数据集,涵盖12个功能多样的蛋白质类别。我们的系统评估表明,从一维序列到二维频谱图的结构转换可能是模型预测性能的关键因素。这一观察得到了消融研究的支持,其中仅使用频谱图中的视觉或声学特征的模型都表现出了有效的独立性能,表明该表示本身是这种能力的关键来源。例如,使用没有明确生物物理意义的声化映射的模型达到了81.08%的准确率,而我们的生物物理信息模型达到了84.00%,表明这样的领域知识可能提供了适度的性能提升。当在我们的数据集上从头开始训练时,我们的融合模型的性能与标准Transformer架构(如ESM-2和ProtBERT)相当或略优,表明其在这一特定背景下的数据效率潜力。该模型的泛化潜力进一步得到了其在外部CARE酶分类基准上的性能支持,其中它达到了90.44%的准确率。最后,作为概念验证,我们探索了我们的编码在指导扩散模型生成新颖GFP变体中的效用,这些变体使用计算方法进行了结构可行性评估。我们的工作提供了证据,表明声化在这一背景下的效用可能主要源于其表示结构,为生物序列的特征工程提供了一个视角。

    • 关键词:蛋白质功能预测、声化、生物信号处理、序列表示、生成蛋白质设计

    • 项目地址:GitHub/Symphony_of_Fate      指导老师:魏凯教授

  2. 2025年大学生创新训练计划(国家级项目;Student Advisor):拷贝数变异的条件扩散模型:用于阿尔兹海默病风险评估, 2025.4-2026.4

    • 摘要:本项目旨在将全基因组测序数据中的基因拷贝数变异(Copy Number Variation, CNV)特征与代谢指标等多维临床数据相融合。利用扩散模型在处理高维模拟数据和蛋白质表型预测中的成功经验,我们将构建一个由CNV特征编码、基因组区域注意力和条件U-Net扩散模块组成的综合框架。这将模拟CNV在基因组中的分布变化和进化过程,分析CNV在调控阿尔茨海默病通路中的具体作用机制,最终提高疾病风险评估和早期干预的准确性。

    • 关键词:Diffusion; Copy Number Variation; WGS; Alzheimer's disease

    • 项目地址:      指导老师:魏凯教授

  3. 2024年中科院大学生创新实践训练计划(科创计划)(国家级项目;第一负责人):HeDA:基于自动化知识图谱构建和多层风险传播分析的热浪风险发现智能代理系统, 2024.11-2025.9

    • 摘要:热浪在相互关联的气候、社会和经济系统中构成复杂的级联风险,但科学文献中的知识碎片化阻碍了对这些风险路径的全面理解。我们引入了HeDA(热浪发现代理),一个为通过知识图谱构建和多层风险传播分析进行自动化科学发现而设计的智能多代理系统。HeDA处理了超过10,247篇学术论文,构建了一个包含23,156个节点和89,472个关系的综合知识图谱,采用新颖的多层风险传播分析来系统地识别被忽视的风险传输路径。我们的系统在复杂问答任务上达到了78.9\%的准确率,比包括GPT-4在内的最先进基线高出13.7\%。关键是,HeDA成功发现了五条以前未被识别的高影响风险链,例如"热浪→用水需求激增→工业用水限制→小企业中断",这些通过历史案例研究和领域专家审查得到了验证。这项工作呈现了一个新的AI驱动科学发现范式,为开发更具韧性的气候适应战略提供了可行的见解。

    • 关键词:知识图谱、智能代理、热浪风险分析、科学发现、气候适应、多层风险传播

    • 项目地址:      指导老师:葛咏研究员

  4. 2024年大学生创新训练计划(自治区级项目;第一负责人):k元n立方体在基于区域的故障模型下的哈密尔顿连通性研究, 2024.03-2025.6

    • 摘要:k元n立方体($Q_n^k$)是支持现代AI和HPC工作负载的大规模计算系统的关键拓扑,其中容错能力至关重要。传统的故障模型假设故障是独立和随机的,会产生不切实际的弹性估计,因为现实世界的故障在空间上是相关的,表现为拓扑集群。本文引入了基于区域的故障(RBF)模型,这是一个新的范式,通过直接建模这种空间相关性来解决这一差距。我们的主要贡献是证明了对于奇数$k \geq 3$和$n \geq 2$,$Q_n^k$在充分的RBF条件下保持哈密尔顿连通性——这是无死锁路由和高效任务调度的关键特性。我们提出了一个构造性算法,通过利用自适应分解策略来找到哈密尔顿路径。实验分析表明,我们的方法显著增强了容错能力,并且在远超其保守理论保证的范围内保持稳健。这项工作为在故障聚类普遍存在的系统中维持连通性提供了一个实用的、高性能的解决方案。

    • 关键词:k元n立方体、容错嵌入、哈密尔顿连通、聚类故障、互连网络

    • 项目地址:GitHub/Region-Based Fault Model      指导老师:依明江·沙比尔副教授

  5. 基于人工智能数字分身技术的老龄人亲情陪伴问题研究, 2024.12-2026.9

    • 摘要:本项目以人工智能数字分身技术为核心,旨在缓解我国老龄化背景下老年人亲情陪伴缺失的问题,同时弥合老年人数字鸿沟,提升中小学生的人工智能实践能力。项目由深圳零一学院联合字节跳动等机构实施,分为准备、执行和推广三个阶段,计划通过学生为老年人定制个性化数字分身,增进代际交流,探索AI大模型在社会公益领域的应用场景。项目不仅在精神层面为老年人提供陪伴与心理疏导,还开辟了中国特色养老新路径,同时推动人工智能教育与社会创新发展。通过多方协作、风险管理和媒体宣传,项目将实现从试点到全国推广的目标,具有重要的社会、教育和技术意义。

    • 关键词:人工智能; 社会创新

    • 项目地址:      指导老师:汤敏(国务院原参事)

研学经历

  1. 清华大学-北京大学生命科学联合中心(清华方面)2025年暑期夏令营 2025.07 参见链接

  2. 深圳医学科学院/深圳湾实验室暑期研习 2025.07-2025.09

  3. 清华大学钱学森力学班暨深圳零一学院 — 零一学者(长期培养) 2024.06-2027.06

  4. 布朗大学2025年人工智能冬季学校 (AI Winter School 2025 - CFPU/Brown University Department of Physics) 2025.1

  5. 中国人工智能协会CAAI人工智能与技术伦理培训班 2024.9-2024.12

  6. 2024年复旦大学数理逻辑暑期学校 2024.08 参见链接

  7. 暨南大学2024广东千村调查项目 2024.08 参见链接

  8. 武汉大学国家天元数学中部中心-"无理数引发的数学与算法"讨论班 2024.03-2024.6 参见链接

  9. 新疆大学创新实验室/"想把回忆拼好给你"CTF校队队员 2024.03-2024.6 参见链接

实习经历

  1. 清华大学北京生物结构前沿研究中心 2025.06-present:我开发了多肽结构数据库,从事蛋白质、多肽设计等工作。

  2. 华为昇思Mindspore社区联合中科院软件研究所开源实习 2024.09-2025.3: 我利用机器学习、人工智能等技术,实现了基于VGG19的波洛克风格迁移画分形和湍流特征提取及NFT标签生成。目前已被华为公众号报道

  3. 玻色量子"星火人"社区实习生 2024.09-present

竞赛荣誉

  1. 全国大学生数学建模竞赛(CUMCM) 国家级二等奖, 2025.11

  2. 合成生物学创新赛 银奖, 2025 参见链接

  3. The Mathematical Contest in Modeling (MCM, 美国大学生数学建模竞赛) Honorable Mention, 2025.5

  4. 2024阿里云天池大学生竞赛全国总决赛第17名, 2024.10参见链接

  5. 2024年第十四届APMCM亚太地区大学生数学建模竞赛国家级三等奖, 2024.08

  6. "阿尔法蛋杯"2024年全国业余围棋棋王争霸赛暨"商旅运河杯"城市围棋赛竞赛第15名, 2024.07

  7. 新疆青少年业余围棋段位赛第53名, 2024.05

  8. 湖南省迎春杯围棋赛第七名, 2024.02

  9. 全国青少年智力运动大会围棋赛项第九名, 2024.02

  10. 新疆大学漏洞报送荣誉, 2023.10

  11. 2023年新疆"天山固网杯"网络安全技能竞赛第七名, 2023.10

网站开发

  1. 深圳零一学院课程网站:https://lingyi.wyqmath.cn/

  2. 多肽结构数据库:https://www.frcbs.tsinghua.edu.cn/cpdb/

  3. Tong Wang Research Group:https://tongwang.vercel.app/

深圳零一学院简介:

深圳零一学院缘起于清华大学"学堂计划"钱学森力学班(简称"清华钱班")。清华钱班创办于2009 年,是"清华学堂人才培养计划"暨国家"基础学科拔尖学生培养试验计划"66个试点项目中,唯一不是定位于单一学科,而是工科基础(或力学与工程技术所有学科交叉创新)的试验班。其使命是:发掘和培养有志于通过科技改变世界、造福人类的创新型人才,探索未来创新人才的培养模式,回答"钱学森之问"。


简历下载.