Tags
3 个页面
评测
RAG 失败复盘手册:一张流程图 + 一段代码,把问题定位到检索/生成/数据
做一套可持续的 LLM 评测体系:离线数据集、在线回放与回归基线
RAG 落地清单:从检索到评测的一套可复用实践