1.负责桌面版AlAgent功能的全面评测,重点验证Agent的任务执行能力、交互流畅度、逻辑合理性及异常场景处理能力,精准捕捉产品问题并记录细节
2.熟练使用命令行工具、IDE等工具,编写简单Python脚本辅助评测工作(如数据统计、自动化测试辅助等),提升评测效率。
3.对评测过程中发现的问题进行分类、汇总,协助撰写清晰、规范的评测报告,明确问题优先级及改进建议
4.关注市面主流AI模型及Agent相关产品,对比分析同类产品的优势与不足,为桌面版AIAgent的优化提供参考。
5.配合团队完善评测流程,参与评测标准的制定与优化,确保评测工作的规范性和一致性。