BoxのAI分類は、コンテンツを評価して分類し、適切な分類ラベルを自動的に適用するのに役立ちます。
AI分類は、既存の分類ポリシーと併用できます。 例えば、特定の情報の種類やファイル拡張子の検出に使用された自動分類ポリシーを維持したまま、AI分類を使用して、特定のデータの種類やキーワードでは簡単に識別できなかったより幅広いコンテンツにラベルを付けることができます。
ShieldのAI分類は、Shield Proアドオンの一部としてのみ利用可能です。 企業ごとに許可されるAI分類ポリシーは1つです。
Box AIを使用してコンテンツを分類するには、以下の手順に従う必要があります。
分類に対応するファイルの種類
AI分類では、以下のすべての拡張子に関してファイル内のテキストをスキャンします。
| 拡張子 | テキスト抽出の上限 |
| as、as3、bat、boxcanvas、boxnote、cmake、css、diff、doc、docx、gdoc、gslide、gslides、haml、htm、html、key、less、log、make、md、mm、msg、odp、odt、pages、pdf、ppt、pptx、properties、rst、rtf、sass、scm、script、sh、sml、txt、vi、vim、webdoc、wpd、xbd、xdw、xhtml、xml、xsd、xsl | 2 MB |
| asm、c、cc、cpp、cs、csv、cxx、erb、groovy、gsheet、h、hh、java、js、json、m、ml、php、pl、py、rb、scala、sql、ods、xls、xlsm、xlsx、yaml | 100 KB |
AI分類では、ファイルの種類に応じて、サポートされるテキスト抽出のサイズが異なります。 通常、ファイル内のテキストの量はファイルのサイズより小さくなります。例えば、20 MBのPowerPointファイル (.ppt) には、評価のために抽出できるテキストが200 KB含まれていることがあります。
Boxでスキャンされるのは、テキスト抽出の上限までです。 例えば、テキスト抽出が2 MBを超えるPDFファイルの場合、AI分類ポリシーは、最初の2 MBのテキストが分類ポリシーで指定された条件を満たしているかどうかに基づき分類します。
注: Boxの自動分類は、光学式文字認識 (OCR) をサポートしていません。そのため、画像に埋め込まれたテキストを抽出することはできません。
AI分類ポリシーの上限
ラベル全体で、すべての条件を組み合わせた合計サイズの上限は25,000バイトです。 この上限は言語によって異なります。サポートされる文字数の概算を以下に示します。
| 言語 | 文字数 |
英語 |
25,000 |
日本語 |
8,500 |
フランス語 |
23,000 |
中国語 |
8,500 |
韓国語 |
8,500 |
AI分類ポリシーの作成
管理者および以下の権限を持つ共同管理者は、AI分類ポリシーを作成、変更、削除できます。
- 会社のメタデータテンプレートを作成、編集する
- 会社のShieldダッシュボードを表示する
- 会社のShield構成を作成、編集、削除する
AI分類ポリシーを作成するには、以下の手順に従います。
- 管理コンソールに移動します。
- [分類] を選択します。
- [作成] を選択した後、ドロップダウンオプションから [AI分類ポリシー] を選択します。
注: このオプションは、AI分類ポリシーがすでに構成済みで、分類ポリシーのリストに記載されている場合は表示されません。
- 分類ラベルを選択し、分類するコンテンツの種類に関する詳細情報を入力します。 例えば、内部の分類には、給与記録、履歴書、ポリシードキュメントなどのコンテンツが含まれる場合があります。
分類ラベルは、説明ボックスの上にある [X] を選択すると、削除できます。
- 必要に応じて、最大10ファイルを使用してテストと繰り返し適用を実行します。
- ポリシーの設定で [すべてのフォルダに適用する] または [選択したフォルダのみ] を選択します。
- 競合の処理の動作を選択します。
- [次へ] をクリックします。
- [下書きとして保存] または [有効化] をクリックします。 [有効化] を選択すると、分類ポリシーは、分類のイベントでトリガーされるファイルに対して適用されます。
注:
- EIDあたりの分類ポリシー数の上限は50です。 AI分類ポリシーはこの上限に含まれます。
- 自動分類ポリシーが複数ある場合は、デフォルトで、AI分類ポリシーの優先順位が最後に設定されます。 これは、優先順位の変更によって変更可能です。
- 企業ごとに許可されるAI分類ポリシーは1つです。
- コンテンツは、ポリシーが有効になった場合のみ、先を見越してスキャンされます。
テストと繰り返し適用
テストファイルを選択することで、期待どおりの分類結果が表示されることを確認し、必要に応じて条件を変更することができます。
一度に選択できるのは10ファイルまでです。 ファイルが選択されると、選択された入力を使用してプロンプトが作成され、AIに送信されて各テストファイルが評価されます。
AI分類ポリシーの作成手順に従って手順5まで進んだ後、以下の手順を実行します。
- [テストと繰り返し適用] セクションで [ファイルを選択] をクリックします。
- テストするファイルを最大10個選択します。
- 提供されるガイダンスに基づいて分類が適用された状態で、テストの結果が表示されます。 AIがそのラベルを選択した理由が示されます。
分類が指定されない場合は、分類が適用されなかったことを正当化する理由が示されます。 Box AIがファイルを分類できない一般的な理由は以下のとおりです。
- ファイルがもう存在しない可能性がある
- ファイルからテキストを抽出できない (AIは、抽出可能なテキストを含むコンテンツでのみ動作する)
- ファイルが空である
テストを再実行するには、アップロード済みファイルの上にある円形の矢印を選択します。 これは、分類ラベルの説明の入力をリファインした後に特に役立ちます。
セクションの下部にある [クリア] を選択して、テストの結果を削除します。
AI分類ポリシーの設定
フォルダの条件
| 設定 | 説明 |
| すべてのフォルダに適用する | ポリシーは、社内のすべてのフォルダにあるファイルに適用されます。 |
| 選択したフォルダのみ |
ポリシーは、選択したフォルダとそのすべてのサブフォルダ内のファイルのみに適用されます。 フォルダを選択するには、次の手順に従います。
|
競合の処理
コンテンツに既存の分類ラベルが適用されている場合の競合に対するAI分類ポリシーの動作を決定します。
- [分類ラベルがすでに適用されているファイルをスキップする] (推奨) - ポリシーは以下の処理を行います。
- 別の分類ポリシーによって以前に適用された分類ラベルを上書きする
- 分類ラベルがユーザー、フォルダのカスケード、ワークフローによって適用されているファイル、またはMicrosoft Purview Information Protection (MPIP) 統合によってMPIPの秘密度ラベルから分類ラベルが適用されたファイルをスキップする
- [既存の分類ラベルを上書きする] - ポリシーは、既存の分類ラベルがユーザー、フォルダのカスケード、ワークフロー、以前のポリシーのうちどれによって適用されたかに関係なく、そのラベルを上書きします。ただし、以下の場合は除きます。
- 最新のファイルバージョンに対する自動分類ラベルをユーザーが手動で上書きした場合
- 分類ラベルがMPIPの秘密度ラベルから適用されたもので、MPIPの [変更を禁止する] 設定が有効になっている場合
注: 既存の分類ラベルを上書きすると、簡単に元に戻すことはできません。 AIの分類ガイダンスの精度が十分である場合にのみ、[既存の分類ラベルを上書きする] を選択することをお勧めします。
AI分類ポリシーの有効化、無効化、削除
AI分類ポリシーを有効化、無効化、または削除するには、以下の手順に従います。
- 管理コンソールに移動します。
- [分類] を選択します。
- AI分類ポリシーの名前をクリックします。
- [有効化]、[無効化]、または [削除] をクリックします。
AI分類ポリシーは、作成時に下書きとして保存した場合や作成後に無効化した場合、無効状態になります。
分類ポリシーを無効化しても、すでに適用されている分類は削除されません。 ポリシーを再度有効化するまで、ポリシーの適用が停止されるだけです。
AI分類ポリシーを削除しても、このポリシーによってコンテンツに適用された分類は削除されません。
注:
- AI分類ポリシーは複製できません。作成できるポリシーは1つだけです。
- 分類ポリシーは、有効にすると、分類のイベントでトリガーされるファイルに対して適用されます。
AI分類ポリシーのベストプラクティス
効果的なラベル条件の定義
正確なAI分類を確実にするために、ラベル定義は以下のようにしてください。
- 明確に区別する: 各ラベルには、独自のドキュメントの特性を対象とした、重複のない明確に区別された条件を設定する必要があります。
-
わかりやすくする: わかりやすい言葉を使用して以下を指定します。
- ドキュメントタイプ (例: 契約書、戦略的なドキュメント、スプレッドシート)
- トピックまたは目的 (例: 製品ロードマップ、セキュリティ違反、取引条件)
- データの種類 (例: PII、ソースコード、財務情報)
- 対象者 (例: 社内チーム、法務)
以下を避けてください:
- あいまいな記述 (例: 「会社にとって高リスク」)
- ラベルの重複 (例: 「機密」と「極秘」)
- 定義されていない技術的な専門用語
トラブルシューティングのヒント
AI分類の結果が期待どおりにならなかった場合:
- 使用する明確に定義されたラベルの数を減らす: 例を追加したり、条件を厳しくしたりしてください
- 重複を確認する: ラベルが明確でわかりやすく、重複していないことを確認し、「さまざまな状況に対応できる」ラベルを避けてください
ファイルがテキストベースであることを確認する: AIは、抽出可能なテキストを含むコンテンツでのみ動作します。 分類に対応するファイルの種類を確認してください
AI分類のユーザーエクスペリエンス
AI分類の詳細には、以下の手順でアクセスできます。
- Box内でファイルを選択する
- パネルの右側にある [詳細] ボタンをクリックする
情報は [適用したユーザー] セクションに表示されます。このセクションには、指定した日に分類がBox AIによって適用されたことが示されます。
説明は、そのラベルが適用された理由とともに表示されます。 例えば、「ファイルは、非公開の決算結果が含まれるため、内部専用に設定されました」のようになります。