ME News ニュース、4月23日(UTC+8)、動察Beatingの監視によると、OpenAIはApache 2.0ライセンスの下でPrivacy Filterをオープンソース化しました。これはローカル展開可能なテキスト脱敏モデルです。ユーザーがテキストをモデルに入力すると、名前、メールアドレス、電話番号、住所、アカウント、URL、日付、キーの合計8種類の個人情報(PII)を自動的に識別し、マークまたはマスクします。全ての処理はローカルで完結し、データはクラウドに送信されません。モデルの総パラメータは1.5Bですが、スパース混合エキスパートアーキテクチャを採用しており、実際の推論時には50Mパラメータのみが活性化されるため、ノートパソコンやブラウザ上でも動作可能です。コンテキストウィンドウは128Kトークンで、一度の前方伝播で全てのプライバシー情報をマークできます。ユーザーは事前設定された操作ポイントを通じて精度とリコールのバランスを調整でき、また自前のデータを用いて微調整し特定のシナリオに適応させることも可能です。モデルは英語を主とし、多言語対応は限定的です。(出典:BlockBeats)
OpenAIオープンソースのプライバシーフィルターは、ローカルで自動的にテキスト内のプライバシー情報を検出して隠すことができます
ME News ニュース、4月23日(UTC+8)、動察Beatingの監視によると、OpenAIはApache 2.0ライセンスの下でPrivacy Filterをオープンソース化しました。これはローカル展開可能なテキスト脱敏モデルです。ユーザーがテキストをモデルに入力すると、名前、メールアドレス、電話番号、住所、アカウント、URL、日付、キーの合計8種類の個人情報(PII)を自動的に識別し、マークまたはマスクします。全ての処理はローカルで完結し、データはクラウドに送信されません。モデルの総パラメータは1.5Bですが、スパース混合エキスパートアーキテクチャを採用しており、実際の推論時には50Mパラメータのみが活性化されるため、ノートパソコンやブラウザ上でも動作可能です。コンテキストウィンドウは128Kトークンで、一度の前方伝播で全てのプライバシー情報をマークできます。ユーザーは事前設定された操作ポイントを通じて精度とリコールのバランスを調整でき、また自前のデータを用いて微調整し特定のシナリオに適応させることも可能です。モデルは英語を主とし、多言語対応は限定的です。(出典:BlockBeats)