GitHub - terminal-agent/AnnotationGuidelines

LLM Agent 标注原则

人类与LLM Agent在处理信息方式上存在明显差异。人类处理信息更类似于循环神经网络（RNN），信息处理具有明显的逐步性与遗忘性；而LLM Agent则通过KV Cache保留大量上下文，因此容易出现上下文爆炸的问题。为了有效地利用LLM Agent的能力并防止上下文过载，我们制定了以下一系列标注原则，以减少token消耗并提高任务效率。

1. 限制数据展示量

文件打开前先用wc -l检查行数。
少于50行才允许直接用cat展示。

2. 精确定位与局部查看

大文件一律用grep -n或sed -n精准定位，避免二次查找。
使用inspect概览python文件结构。
用sed -n 'a,bp'展示指定范围。

3. 上下文预留

grep推荐用-A n -B m上下文参数预留上下文。
一般设置5-10行为宜。

4. 非交互式编辑

禁止使用vim、nano等交互式编辑器。
推荐用replace、sed -i或patch等非交互式工具修改文本。

5. 增量式修改

少量修改避免全文重写。
使用sed -i或replace等进行原地小范围修改。

6. 冗余输出重定向与预览（优化）

对pip install、编译日志、长命令输出等，先将输出重定向到文件。
优先用tail -n 20 logfile判断命令是否成功。
若失败，再用grep -Ei "error|warning|fail" logfile定位问题。

示例：

pip install package > pip_log.txt 2>&1
if tail -n 20 pip_log.txt | grep -q "Successfully installed"; then
    echo "安装成功，无需查看详细日志。"
else
    grep -Ei "error|warning|fail" pip_log.txt || tail -n 30 pip_log.txt
fi

7. 任务单元化

大任务拆分为独立小任务，各自管理上下文。

8. 明确搜索边界

执行搜索时明确文件范围或日期范围，避免全局扫描。

9. 路径精准化

永远使用绝对路径或明确的相对路径，减少上下文推断成本。

10. 强制Review与人工干预

若Agent频繁修改后错误仍较大，人类可通过wait或类似指令暂停Agent操作，并通过明确提示如I think I ignore xxx或I think I miss xxx强制Agent重新审视错误。
若Agent仍无法发现错误，人类应直接以I think I am wrong because xxx方式介入编辑，强制纠正错误。
如果model在某一点一直进入循环, 人类应该通过wait I think I was trapped xxx。

示例：见强制纠正。

11. 写code

写代码之前, 最好让模型自己先规划via verbal, 要不然很可能出错，并且module.
浏览code的时候，模型需要一点点打开，一点点分析才能正确。

12. Annotator无法准确判断动作合理性

若Annotator无法准确判断Agent某一步的动作是否合理，可让Agent继续执行，明确出错后再纠正。
纠正错误时，可保留之前错误的几步仅在当前步骤强制纠正，提高模型纠错能力。

13. context管理 (TODO)

给model summarize和delete工具
或许可以尝试对context分区，变成linsir说的那种

14. workflow管理 (TODO)

给LLM工具去并行的call多个llm

15. replace

replace 工具在有行号的情况下比较容易出错

16. debug

debug的时候不会用print，不会分析对应的stack

17. 当agent需要从零开始实现一个复杂的逻辑（以MLE tasks为例）

建议标注员手动干预，强制让agent与 ipython 交互。这样避免bug在长文件里堆积。

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
examples		examples
rl		rl
README.md		README.md
README_en.md		README_en.md
data.md		data.md
questions.md		questions.md
roadmap.md		roadmap.md
seed_questions.md		seed_questions.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

LLM Agent 标注原则

1. 限制数据展示量

2. 精确定位与局部查看

3. 上下文预留

4. 非交互式编辑

5. 增量式修改

6. 冗余输出重定向与预览（优化）

7. 任务单元化

8. 明确搜索边界

9. 路径精准化

10. 强制Review与人工干预

11. 写code

12. Annotator无法准确判断动作合理性

13. context管理 (TODO)

14. workflow管理 (TODO)

15. replace

16. debug

17. 当agent需要从零开始实现一个复杂的逻辑（以MLE tasks为例）

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

terminal-agent/AnnotationGuidelines

Folders and files

Latest commit

History

Repository files navigation

LLM Agent 标注原则

1. 限制数据展示量

2. 精确定位与局部查看

3. 上下文预留

4. 非交互式编辑

5. 增量式修改

6. 冗余输出重定向与预览（优化）

7. 任务单元化

8. 明确搜索边界

9. 路径精准化

10. 强制Review与人工干预

11. 写code

12. Annotator无法准确判断动作合理性

13. context管理 (TODO)

14. workflow管理 (TODO)

15. replace

16. debug

17. 当agent需要从零开始实现一个复杂的逻辑（以MLE tasks为例）

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Packages