OpenAI відкриває вихідний код Privacy Filter, який може автоматично виявляти та маскувати приватну інформацію в тексті локально.

robot
Генерація анотацій у процесі
ME News повідомляє, 23 квітня (UTC+8), за даними моніторингу Beating, OpenAI відкрив код Privacy Filter під ліцензією Apache 2.0 — це локально розгорнута модель для деідентифікації тексту. Користувач передає текст моделі, і вона автоматично визначає 8 типів персональної інформації (PII): імена, електронні адреси, номери телефонів, адреси, облікові записи, URL, дати та ключі, і позначає або приховує їх. Весь процес виконується локально, дані не надсилаються в хмару. Модель має загалом 1,5B параметрів, але використовує розріджену архітектуру суміші експертів, тому фактично активується лише 50M параметрів на кожен вивід, що дозволяє запускати її навіть на ноутбуці або в браузері. Контекстне вікно — 128K токенів, одне пряме поширення позначає всю конфіденційну інформацію. Користувач може налаштувати баланс точності та повноти через попередньо задані точки, а також доналаштувати модель на власних даних для адаптації до конкретних сценаріїв. Модель переважно англомовна, багатомовні можливості обмежені. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено