会议时间:2025年4月2日(周三)14:30
参会人员:信息科学与工程学院(人工智能学院)科研团队教师,欢迎广大师生参加。
会议地点:墨子楼中兴会议室
报告1:元强化微调(MRT)在大型语言模型推理中的应用
报告人:姚建龙
内容简介:高效的测试时计算优化是提升大型语言模型(LLM)推理能力的关键挑战。本报告介绍了由CMU和HuggingFace提出的「元强化微调」(MRT)新范式,通过密集奖励机制优化LLM在推理过程中的探索-利用平衡。MRT将输出流分割为多个片段,动态评估每个片段的进展,显著提升了模型在数学推理任务中的准确性和token效率。实验表明,MRT在AIME、AMC等基准测试中性能超越传统强化学习方法(如GRPO),准确率提升2~3倍,token效率提高1.5~5倍。该范式为LLM在分布外问题上的系统性推理提供了新思路。
报告2:融合领域知识的宫颈细胞实例分割方法
报告人:杨晓娜
内容简介:精准的细胞实例分割是计算机辅助诊断研究中的核心环节。本研究提出一种医学知识融合的实例分割方法。针对宫颈细胞图像中普遍存在的重叠、粘连及形态异质性显著等问题,设计了一种基于FPN(特征金字塔)架构的无监督的多阶段实例分割框架,通过专家知识引导的特征学习和自监督机制的协同优化,以增强模型对复杂细胞结构的表征能力。该方法能够实现没有任何标注数据下高精度的细胞边缘分割,并为下游任务(如细胞分类、病变分级)提供更可靠的数据支撑和可解释性。
科技处
信息科学与工程学院(人工智能学院)
2025年3月31日