自主规划能力增强

多智能体寻路算法

研究问题：在避障与环境约束下，研究提升智能体在动态环境中最优路径规划效率的方案

技术路线

建立马尔可夫决策模型：不同智能体各自的最短路径视为“状态”，避免发生碰撞的约束视为 “动作”
提出 “蒙特卡洛约束树搜索” MCCTS算法，使用带约束的单智能体寻路算法作为构建块，实现实时路径规划
给出使用随机化单智能体寻路算法进行约束评估的方法

研究成果

历史上首次建立了使用蒙特卡洛搜索树求解非稳态条件下马尔可夫决策过程的非渐进性收敛性定理
实现了O(1/√N)的自适应非渐进收敛速率

He Xiaoyu, Tang Xueyan, Cai Wentong, Li Jingning. A stochastic process approach for multi-agent path finding with non-asymptotic performance guarantees [J]. Artificial Intelligence, 2024, 329: 104084. (CCF-A，人工智能顶刊)

多智能体巡逻算法

研究问题：为机器人制定周期性巡回路线，实现智能体在海湾花园设置自动巡逻的空气检疫装置

技术路线

针对单个智能体构建基于不确定性模型的、离散网格图场景中的马尔科夫决策模型
基于带约束的单智能体巡逻算法，利用迭代改进框架求解多智能体巡逻问题

研究成果

论证了使用单智能体巡逻算法求解多智能体巡逻问题的可能性
使用异步并行演化策略提升求解速率，实现线性加速比

He Xiaoyu, Tang Xueyan, Zheng Zibin, Zhou Yuren. Noisy Evolutionary Optimization With Application to Grid-Based Persistent Monitoring. IEEE Transactions on Evolutionary Computation [J], 2024, 28(6) : 1838–1851. (智能优化顶刊)

医疗质量控制的大语言模型平台

研究问题：利用智能体实现医疗质量控制（MQC）指标的自动化、高效且准确的计算

技术路线

通过在海量医学语料上持续预训练及基于课程学习的指令微调，构建了专用于理解电子病历的EMR-LLM模型
提出了一种知识增强的标准化表示语言，将复杂指标转化为结构化形式。
结合Least-to-Most提示与思维链技术，实现了全自动计算流程

研究成果

平台在质控指标计算任务上达到了93.31%的准确率，性能与人类专家相当
单张GPU卡每小时可处理1000份病历，相比人工审核效率提升了100倍。
系统已在上海多家医院实际部署，预计每月可节省约342万元人民币的人力成本。