简体中文
主题
定义目标,设定指标,让 Agent 彻夜迭代,早晨查看结果。
学习每晚运行 100 次实验的自主改进循环——最初为 ML 设计,现已泛化到任何可测量领域。
从 /autoresearch:plan 到 /autoresearch:ship——涵盖研究、调试、安全审计和发布的完整工具链。
代码性能、ML 精度、文献综述、安全审计、内容质量——只要能测量,就能自动化。
每个项目附带起始代码和参考答案,从排序优化到完整端到端研究流水线逐步进阶。