文書管理ツールに入力されるデータの精度を向上するにはどうすればよいですか?
背景
時間を節約し、手動によるデータ入力を減らすために、Procore は機械学習、命名基準、プロジェクト設定を使用して、文書管理ツールにアップロードされた文書データを認識し、入力します。「文書管理ツールのさまざまなフィールドとは何ですか?」および「文書管理ツールにファイルをアップロードする場合、Procore が自動的に入力できるデータは何ですか?」を参照してください。
自動データ入力による不正確さの可能性を減らすために、機械学習モデルは精度を優先するように構築されており、情報を入力する目的で情報を「推測」しようとはしません。
答え
文書管理ツールにアップロードされたファイルからほとんどの情報が正しく入力されるようにするには、以下のベスト プラクティスに従ってください。
プロジェクト ファイルを標準化する
- 機械学習テクノロジーは、図面、仕様、その他文書の種類を検索します。最良の結果を得るには、以下のガイドラインに従うことをお勧めします:
- PDF はベクター形式である必要があります。
- PDF は横向きである必要があります。
- 使用するフォントは標準フォント (シンプルな Sans-Serif/UTF8) である必要があります。
- フォント サイズはファイル全体で同じにする必要があります。
- 単語は左から右、または上から下に読む必要があります。
- 分野は次のいずれかの基準に従う必要があります。
- 米国国家 CAD 標準。
- BS EN ISO 19650 規格。
- 図面には、タイトル、番号、分野の一貫した領域が必要です。
- 機械学習モデルは、タイトルや番号などの情報をスキャンする「関心領域」 (投資利益率) を識別します。この図面情報は通常、アルゴリズムが最初に調べる右下隅にあります。ただし、ブロックの内容に基づいて投資利益率を特定することもできます。
- 図面のタイトルと番号は、ファイル上で「図面タイトル」および「図面番号」としてラベル付けする必要があります。
注: 図面タイトルの長さに制限はありませんが、短いタイトルが推奨されます。 - その図面がどの地域のものであるかによって、その分野が予測されます。
命名基準を構成してそれに従う
文書管理ツールにアップロードした文書ファイル名がプロジェクトに設定された命名基準と一致する場合、Procore はアップロード済み元ファイル名内のキーワードと識別子に基づいて文書のメタデータを自動的に入力します。「文書管理ツールの命名基準を編集する」および「プロジェクトの命名基準からの自動データ入力」を参照してください。
ファイルをアップロードする前に文書管理フィールドを構成する
ファイルをアップロードする前に、文書管理フィールドと追加の Procore フィールド (プロジェクト、場所、発信者、段階など) を構成して、追加情報が自動的に入力されるようにします。「文書管理ツールの構成可能なフィールドのセットと既定フィールドを管理する」および「プロジェクト情報からの自動データ入力」を参照してください。