× Reminder: You are browsing the staging site of lscm.hk
innerpage Project Funding
项目及资助计划
项目资料库
GPT 安全测试平台

打印

项目简介

使用 GPT 的担忧之一是它可能会受到攻击而产生恶意内容,从而导致错误讯息的传播、舆 论操纵和诈欺。 在这个专案中,我们强调测试平台在满足基于人工智慧的模型的安全需求 方面的重要性。 该计画建议专门针对 GPT 攻击创建测试平台。 探索的一种重要攻击技术是 提示注入,其中精心设计的提示操纵 GPT 忽略指令或执行意外操作。 尽管正在发现有关攻 击技术的新研究,但针对即时注入攻击的防御仍处于早期阶段。 该计画的另一个建议是开 发评估框架来衡量即时注入攻击的影响、成功机率和加权弹性得分。 可交付成果包括攻击 资料集的建构、每次攻击的平均影响指标的测量、攻击成功机率的计算以及加权弹性分数 的确定。 此外,我们还将评估 3 种常见的 GPT 模型,包括不同国家开发的线上版本和在地 化版本。

更多资讯

项目编号 ITP/051/23LP
研发单位 LSCM 研发中心
项目统筹员 岑松德博士
资助金额 港币二百七十九万
项目週期 2024年2月1日 - 2025年1月31日