OpenAI запустила с открытым исходным кодом Privacy Filter, который может автоматически обнаруживать и скрывать конфиденциальную информацию в тексте локально.

ME News сообщает, 23 апреля (UTC+8), по данным мониторинга Dongcha Beating, OpenAI открыла исходный код Privacy Filter под лицензией Apache 2.0 — локально развертываемую модель для деидентификации текста. Пользователь передает текст модели, и она автоматически распознает 8 типов персональной идентифицируемой информации (PII): имена людей, email, телефон, адрес, номер аккаунта, URL, дату и ключи, а затем помечает или скрывает их. Весь процесс выполняется локально, данные не нужно отправлять в облако. Общее количество параметров модели — 1.5B, но благодаря архитектуре разреженных смешанных экспертов при каждом логическом выводе активируется только 50M параметров, поэтому она может работать на ноутбуке или даже в браузере. Контекстное окно — 128K токенов, за один прямой проход можно отметить всю приватную информацию. Пользователь может настраивать баланс между точностью и полнотой с помощью предустановленных операционных точек, а также дообучать модель на собственных данных для адаптации к конкретным сценариям. Модель в основном работает с английским языком, возможности мультиязычности ограничены. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено