推理加速 任务与挑战 目标 解析超长招标 PDF 原文件,针对特定问题抽取精准答案 三大挑战 文档超长 超出模型上下文限制 字段相近 例如“投标截止时间”与“项目结束时间”易混淆 泛化性要求高 不同招标书格式差异巨大 技术方案:分段-检索-抽取 按固定长度切分文档 StructBERT 领域微调,对比学习训练 按固定长度切分编写 Prompt 送入大模型抽取文档 答案改写与原文定位 核心数据对比