OpenAI开源Privacy Filter,可在本地自动检测并遮蔽文本中的隐私信息

robot
摘要生成中
ME News 消息,4 月 23 日(UTC+8),据 动察 Beating 监测,OpenAI 以 Apache 2.0 许可证开源 Privacy Filter,一个本地部署的文本脱敏模型。用户将文本传入模型,它会自动识别其中的人名、邮箱、电话、地址、账号、URL、日期和密钥共 8 类个人身份信息(PII),并标记或遮蔽。整个过程在本地完成,数据不需要发往云端。 模型总参数 1.5B,但采用稀疏混合专家架构,实际每次推理只激活 50M 参数,因此可以在笔记本电脑甚至浏览器中运行。上下文窗口 128K token,单次前向传播即可标注全部隐私信息。用户可通过预设操作点调整精确率与召回率的权衡,也可用自有数据微调以适配特定场景。模型以英文为主,多语言能力有限。 (来源:BlockBeats)
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论