文書AI企業のイパピルスは、敏感情報の非識別化モジュール「ブラックマーカー(BlackMarker)」をアップグレードし、PDFストリーミングビューアー「ストリームドックス(StreamDocs)」とPDF変換ソリューション「PDFゲートウェイ(PDF Gateway)」に副次機能として提供すると18日発表しました。
「ブラックマーカー」は、PDF文書内の敏感情報を自動的に検出してマスキング処理を施し、元データを削除する方法で情報漏洩のリスクを遮断します。今回のアップグレードによって、電話番号、住民登録番号、メールなどの定型データはもちろん、名前や住所などの非定型個人情報も自動で認識して処理できるようになりました。
非識別化の精度向上は膨大な人名・地名データベースに基づいたルールベースモデルと辞書ベースモデルを組み合わせたAI非識別化技術のおかげです。ユーザーは文書をアップロードすると、自動的にテキスト前処理を行い、定型・非定型個人情報がすべて非識別化されます。
イパピルスはユーザーのカスタマイズ機能も強化しました。マスキングの方法はテキストまたは特殊文字で設定でき、サーバー基盤のバッチ処理方式で大量文書も迅速に処理可能です。高性能GPUなしでもAIレベルの性能を実現し、コスト負担も低減しました。
イパピルスのキム・ジョンア副社長は「一般的なGPU環境でAI非識別化レベルの正確度を提供し、コスト削減と情報保護の効果を同時に達成できる」と説明しました。
PDFビューアー「ストリームドックス」では文書をビューアにアップロードした後、検索、指定、自動認識方式で非識別化を適用できます。非識別処理された文書はダウンロードなしでウェブリンクを通じて安全に共有可能です。

PDF変換ソリューション「PDFゲートウェイ」では、ハングル、MSオフィスなど様々な文書をPDFに変換しながら同時に個人情報を自動で非識別化できます。機関名、名詞、正規表現など特定データの自動マスキングもAPIカスタマイズを通じて実装可能です。

イパピルスはアメリカ、日本、ヨーロッパの海外子会社と協力して電子文書ソリューションの機能開発と性能改善を継続すると明らかにしました。