一部一品丨研究生人工智能工程党支部举办“计E精研智享”—前沿 AI 论文分享会

发布时间:2025-07-30 19:39:04 发布人:孟飞 阅读量:3

image.png

为深入学习贯彻习近平新时代中国特色社会主义思想和新时代党的建设总要求,夯实基层党支部建设基础,切实发挥堡垒作用,计算机学院持续开展“一部一品”创建活动,创新推进新时代高校党建工作与思政育人深度融合,着力打造具有学科特色的党建文化生态,以品牌化建设增强基层党支部“两个功能”,积极探索党建引领事业高质量发展的新路径。

党支部品牌介绍

E精研智享

为积极响应并推动支部在人工智能(AI)领域建立深度研究与技术分享的前沿阵地,研究生人工智能工程党支部举办了一系列以“论文精读”和“前沿技术分享”为核心的特色支部活动。活动旨在通过对顶尖学术论文的深度剖析,激发成员的研究热情,促进学术思想的碰撞与融合,共同追踪和探索人工智能领域的最新理论与技术进展,营造浓厚的学术交流氛围。

活动回顾

7 17 日上午,研究生人工智能工程党支部举办 “前沿 AI 论文分享会”,聚焦计算机视觉、自然语言处理与科学计算交叉领域的最新成果。三场主题分享紧扣技术前沿,既有理论创新的深度剖析,也有实践应用的细致解读,为支部成员带来了一场丰富的学术盛宴。

分享会(一):视觉提示学习的前沿探索

分享人:林培乐

精读论文:《Visual Prompting via Image Inpainting》(NeurIPS 2022)

image.png

研究问题:将视觉领域的任务适配问题转化为图像修复问题。

创新方法:该研究受自然语言处理中“提示(Prompting)”技术的启发,创新性地将视觉领域的任务适配问题转化为一个图像修复(Image Inpainting)问题 。通过将任务的输入/输出示例与新的查询图像拼接成一张“视觉提示图像”,再利用强大的图像修复模型(如MAE-VQGAN)“脑补”出缺失的答案部分,从而完成特定任务 。

技术亮点:为训练该模型,研究者们从2010年至2022年的计算机视觉Arxiv论文中,构建了一个包含88,645张图像的专用数据集,这些图像天然的网格布局非常适合作为视觉提示的训练材料 。实验结果表明,该方法在前景分割、目标检测等任务上取得了优异的性能,尤其在使用专门构建的“Figures”数据集时,效果显著优于传统方法 。

分享会(二):融合蒙特卡洛树搜索的检索增强生成框架

分享人陈坤

精读论文:《MCTS-RAG: 基于蒙特卡洛树搜索的检索增强生成框架》

image.png

研究问题:报告聚焦于当前小型语言模型(7B-8B)在知识密集型任务中的瓶颈:传统检索增强生成(RAG)框架存在检索与推理割裂的问题,导致信息整合效率低,难以处理多跳复杂问题 。

创新方法:该研究首次将蒙特卡洛树搜索(MCTS)与RAG框架进行动态融合,创建了MCTS-RAG 。该框架将复杂的推理过程转化为一个结构化的搜索问题,通过MCTS的“选择-扩展-模拟-反向传播”机制,迭代式地进行知识检索与路径优化,从而动态地规划出最优的“思考链” 。

技术亮点:通过扩展的6种决策动作(A1-A6)和UCT算法,MCTS-RAG实现了检索与推理的深度协同 。实验结果令人振奋,在ComplexWebQA、GPQA等多个高难度问答数据集上,该框架使得Llama 3.1-8B等小模型的准确率大幅提升,例如在GPQA上提升了45.54%,性能逼近GPT-4o的水平 。

分享会(三):融合物理规律的多分辨率时空动力学学习框架

分享人:虞瑞繁

精读论文:《Multi-resolution partial differential equations preserved learning framework for spatiotemporal dynamics》(Communications Physics, 2024)

image.png

研究问题:关注了纯数据驱动的深度学习模型在模拟复杂物理过程(如流体动力学)时,面临的训练成本高、泛化能力差的挑战

创新方法:该研究提出了一个创新的“物理保留”学习框架,将数据驱动与物理规律进行深度融合 。该框架包含两个并行部分:一个高分辨率的、基于卷积神经网络(ConvResNet)的模块,负责从数据中学习复杂的时空模式;另一个低分辨率的、基于偏微分方程(PDE)的模块,负责利用已知的物理定律(如NS方程)对预测进行约束和校正 。

技术亮点:该方法巧妙地将流场数据类比为图像数据进行处理 ,利用U-Net等成熟的图像分割架构进行特征提取 。通过在不同分辨率上结合数据驱动的预测与物理方程的刚性约束,模型不仅能学习到数据中蕴含的复杂模式,还能确保其预测结果不违反基本的物理原理,显著提升了预测的长期稳定性和准确性。分享人还展望了将此框架应用于更具挑战性的多相流领域的研究前景 。

本次系列论文分享活动取得了圆满成功。三场报告内容深刻、视角多元,覆盖了从高效利用预训练模型(视觉提示学习)、优化小模型推理能力(MCTS-RAG)到融合领域知识提升模型可靠性(物理保留学习)等人工智能研究的前沿方向。这些分享不仅展示了AI在计算机视觉、自然语言处理和科学计算等领域的交叉应用与最新突破,也引发了支部成员之间富有成效的交流与讨论。