自动发现的标签
范围:Bloom 框架的评估概念、设计思路、与 Agent Harness 的关系以及可复现性权衡
范围:本文档探讨了开源 LLM 观测平台 Opik 与多智能体后门攻击研究框架 Bloom 结合的技术路径与价值。