推理加速

任务与挑战

目标

解析超长招标 PDF 原文件,针对特定问题抽取精准答案

三大挑战

文档超长

超出模型上下文限制

字段相近

例如“投标截止时间”与“项目结束时间”易混淆

泛化性要求高

不同招标书格式差异巨大

技术方案:分段-检索-抽取

按固定长度切分文档

StructBERT 领域微调,对比学习训练

按固定长度切分编写 Prompt 送入大模型抽取文档

答案改写与原文定位

核心数据对比

滚动至顶部