
人工智能技术公司Crowdworks于 30 日宣布,该公司赢得了 Meritz Fire & Marine Insurance 的人工智能代理人绩效评估项目合同。
本项目旨在评估 Meritz Fire & Marine Insurance 的人工智能销售支持服务在真实工作环境中的性能,该服务面向保险设计师,并通过提升服务质量和稳定性来支持服务的发展。该人工智能服务将学习保险条款、承保范围和专业术语,以辅助设计师的保险设计工作。
在这个项目中,Crowdworks 将专注于评估人工智能代理的响应。公司计划构建一个基于专家评估的数据集,以全面验证响应的准确性、任务成功率和可靠性。评估过程将采用 Crowdworks 自主研发的人工智能评估和验证解决方案 Alpy Evaluation。该解决方案能够评估包括 LLM、RAG 和人工智能代理在内的多个领域的性能,并包含防止产生有害内容和偏见的各项功能。
专门针对保险行业构建定制评估数据集,具有保险行业经验的数据专家根据实际设计师咨询场景设计问答数据。
Crowdworks 首席执行官金宇胜表示:“在评估人工智能代理的性能时,评估问题设计的复杂性比逻辑技术更重要。”他还补充道:“我们将把保险领域的特定数据与自动化评估系统相结合,从而提高金融领域人工智能服务的质量管理水平。”
- 查看更多相关文章
You must be logged in to post a comment.