自動分類を使用すると、機密性の高いコンテンツに対して自動的にセキュリティ分類を適用することができます。それには、企業のコンテンツに含まれる用語や情報の種類など、特定のデータの種類の一致を検索する分類ポリシーを設定する必要があります。 コンテンツ内で検索するデータの種類を1つ以上選択し、データの種類に関する条件が満たされたときにそのコンテンツにセキュリティ分類を指定することができます。
ユーザーがファイルをアップロードすると、ファイルのコンテンツがスキャンされ、分類ポリシーで指定した種類のデータが検索されます。 分類ポリシーの条件を満たすファイルには、指定した分類が適用されます。
重要: 自動分類は、Shieldの権限を持つ管理者または共同管理者が使用できます。Shieldの権限を持つ共同管理者のメタデータの権限が自動的にチェックされることに注意してください。
新しい分類ポリシーの作成
新しい分類ポリシーを作成するには:
- 管理コンソールの左側のサイドバーで、[分類] をクリックします。
- ウィンドウの上部で、[分類ポリシー] をクリックします。
- [ポリシーの作成] をクリックします。
- [分類ポリシー名] に、ポリシーの名前を入力します。
- [説明] に、ポリシーの概要を入力します。
- [ステップ2 条件] までスクロールします。
- [フォルダの条件] で、[すべてのフォルダに適用する] または [選択したフォルダのみ] を選択します。[選択したフォルダのみ] を選択した場合は、[フォルダを選択] をクリックしてフォルダを選択します。完了したら、[保存] をクリックします。
- [ファイルの条件] で、[データの種類を選択] をクリックします。
- 情報の種類を選択するか、[カスタム用語を作成] をクリックします。
- 情報の種類を選択した場合は、[信頼性] で [高]、[中]、[低] のいずれかを選択します。 この手順の後に続く「信頼性に関する注意点」を参照してください。
- [カスタム用語を作成] をクリックした場合は、単語やフレーズをコンマで区切って入力するか貼り付けます (エントリあたり最大50個の用語まで)。
注: を調べる場合、 - [数値の条件] で、論理条件を選択します。
- [一意の数値] で、データの種類が何回出現したら論理条件が満たされるかを指定します。
- [ファイルに次の条件が含まれている場合] で、[すべて] または [いずれか1項目] から [いずれかX項目] (Xはこの条件グループで指定された条件の総数) の中から選択できます。
注: 1つの条件グループに追加できるデータの種類は最大20個までです。 [すべて] または [いずれかX項目] (Xはこの条件グループ内で指定された条件の総数) を選択すると、この条件グループのすべての条件が満たされたときにこの条件グループが満たされたと見なされます。 [いずれか1項目] を選択すると、条件のいずれかが満たされたときにこの条件グループが満たされたと見なされます。 [いずれか2項目] を選択すると、条件のうち2つが満たされたときにこの条件グループが満たされたと見なされます。
- 必要に応じて、[さらに条件を追加] をクリックして条件グループを追加し、上記の手順に従ってデータの種類を指定できます。
注: 追加できる条件グループは最大10個までです。
条件のグループは、「および」または「または」を使用して連結できます。 グループ間での「および」と「または」の組み合わせはサポートされていません。
[ステップ3 分類を適用] までスクロールします。
[この分類を適用] で、分類を選択します。
[管理コンソール] ウィンドウの右上で、[次へ] をクリックします。
ポリシーを下書きとして保存するか、すぐに有効にするかを選択します。 有効なものと無効なものを合わせて、最大50個の分類ポリシーを作成できます。
信頼性に関する注意点
[信頼性] に値を指定することで、コンテンツ内で一致する情報の種類を検出する際の精度を調整できます。
[高] を選択すると、信頼性が [高] の一致がカウントされます。
[中] を選択すると、信頼性が [中] と [高] の一致がカウントされます。
[低] を選択すると、信頼性が [低]、[中]、[高] の一致がカウントされます。
[高] を選択した場合は検出漏れが増える可能性があるのに対し、[低] を選択した場合は誤検出が増える可能性があります。
ファイルの条件の例
次に、[ファイルの条件] 用に1つの論理条件グループを定義する例を示します。
- グループの1つ目の条件は、「 信頼性が [低]、[中]、[高] の一意の米国社会保障番号が、このファイル内で1件以上検出された場合、この条件が満たされる」ことを示します。
- グループの2つ目の条件は、「 信頼性が [中] または [高] の一意の米国運転免許証番号が、このファイル内で1~10件検出された場合、この条件が満たされる」ことを示します。
- グループの3つ目の条件は、「信頼性が [高] の一意のパスポート番号が、このファイル内で5件以下検出された場合、この条件が満たされる」ことを示します。
- グループの4つ目の条件「6個の用語」は、このグループに含まれるデータの種類の1つと見なされます。この条件は、「6個の用語のリストにある一意の用語が、このファイル内で3件以上検出された場合、この条件が満たされる」ことを示します。
- 上記4つの条件を含む条件グループでは、統制する条件 [ファイルに次の条件が含まれている場合] が [いずれか2項目] は、「このグループの2つ以上の条件が満たされた場合、この条件グループで定義されたファイルの条件が満たされる」ことを示します。
カスタム用語の例
一部の企業で使用されている用語の例を次に示します。
最初に使用するポリシーの複製
既存のポリシーに選択したフォルダまたはファイルの条件を再利用するには、最初に使用するポリシーを複製できます。
- 管理コンソールの左側のサイドバーで、[分類] をクリックします。
- ウィンドウの上部で、[分類ポリシー] をクリックします。
- ポリシー名をクリックします。 ポリシーの詳細が表示されます。
- [複製] をクリックします。
- [管理コンソール] ウィンドウの右上で、[次へ] をクリックします。
- ポリシーを下書きとして保存するか、すぐに有効にするかを選択します。
FAQ
自動分類はいつ行われますか?
自動分類は、以下のファイルイベントが発生したときにトリガーされます。
- 分類ポリシーで指定されたフォルダに新しいファイルがアップロードされる。
- 分類ポリシーで指定されたフォルダで既存のファイルが更新される。
- 分類ポリシーで指定されたフォルダに既存のファイルが移動またはコピーされる。
初期設定で利用可能な情報の種類を教えてください。
サポートされている情報の種類のリストは、こちらを参照してください。
ファイルの条件にどのような情報の種類や用語が含まれているかを確認するにはどうすればよいですか?
自動分類でサポートされているファイルの種類を教えてください。
自動分類によるテキスト抽出のスキャンが可能なファイルの種類は、「as」、「as3」、「asm」、「bat」、「boxnote」、「c」、「cc」、「cmake」、「cpp」、「cs」、「css」、「csv」、「cxx」、「diff」、「doc」、「docx」、「erb」、「gdoc」、「groovy」、「gsheet」、「h」、「haml」、「hh」、「htm」、「html」、「java」、「js」、「json」、「less」、「log」、「m」、「make」、「md」、「ml」、「mm」、「msg」、「ods」、「odt」、「pdf」、「php」、「pl」、「ppt」、「pptx」、「properties」、「py」、「rb」、「rst」、「rtf」、「sass」、「scala」、「scm」、「script」、「sh」、「sml」、「sql」、「txt」、「vi」、「vim」、「webdoc」、「wpd」、「xhtml」、「xls」、「xlsb」、「xlsm」、「xlsx」、「xml」、「xsd」、「xsl」、「yaml」です。
注: Boxでは、光学式文字認識 (OCR) がサポートされていません。 そのため、Boxでは、自動分類でポリシーの一致が評価されたときに、画像に埋め込まれたテキストが抽出されることも考慮されることもありません。
サポートされている最大ファイルサイズを教えてください。
自動分類では、コンテンツ内のテキストがスキャンされ、ファイルのテキスト抽出が1 MBまでサポートされています。これにより、Box内のファイルの大部分がカバーされます。 通常、ファイルのテキスト抽出のサイズは、元のファイルより小さくなります。 例えば、20 MBのPower Pointファイル (.ppt) のテキスト抽出が200 KBになるとします。 テキスト抽出が1 MBを超える場合、Boxでは、最初の1 MBはスキャンされますが、1 MBを超える部分はスキャンされません。 そのため、分類ポリシーで指定された条件を最初の1 MBが満たせば、分類ポリシーが適用されます。
ファイルに設定されている分類ラベルは、自動分類によって上書きされますか?
分類ラベルがユーザーによって適用されている場合、既存のラベルが自動分類によって上書きされることはなく、元の分類ラベルはファイルに適用されたままになります。 分類ラベルが分類ポリシーによって適用されている場合、既存のラベルは自動分類によって上書きされます。