BigQuery に接続する
目的
アナリティクス クラウド コネクト アクセス ツールは、アナリティクス 2.0 を使用して Procore から BigQuery へのデータ転送を構成、管理するのに役立つノートブックです。
前提 条件
- アナリティクス 2.0 SKU
- Google Cloud Platform(GCP)へのアクセス
- Delta Share と BigQuery の両方に必要な権限
- 会社レベルのアナリティクス ツール(アナリティクス > スタートガイド> 接続オプション> BigQuery を使用)から、圧縮されたパッケージをダウンロードします。
ステップス
構成のセットアップ
デルタ共有の構成
- Delta Share の資格情報を使用して config.share という名前のファイルを JSON 形式で作成します。
- 必須フィールドを取得します。
メモ:これらの詳細は、Analytics Web アプリケーションから取得できます。- bearerTokenです。 Delta Share アクセス トークン。
- エンドポイント: Delta Share エンドポイント URL。
- shareCredentialsVersionに追加します。 バージョン番号 (現在は 1)。
config.share ファイルの例
{
"shareCredentialsVersion":1、
"bearerToken": "",
"エンドポイント": ""
}
BIGQUERY の構成
- Analytics Web アプリケーションから bigquery.zip ファイルをダウンロードします。
メモ:圧縮されたパッケージは、会社レベルのアナリティクス ツール(アナリティクス > スタートガイド> > BigQuery から)からダウンロードできます。 - パッケージを任意のディレクトリに抽出します。
- config.yaml ファイルを開き、次のパラメーターを変更します。
- source_config.config_pathに追加します。 Delta Share 構成ファイルへのパス。
- source_config.テーブル: 処理する特定のテーブルのオプションのリスト。すべてのテーブルを処理するには、空のままにします。
- target_config.project_id: BigQuery の GCP プロジェクト ID。
- target_config.データセット: BigQuery データセット名。
- target_config.threads: 同時実行テーブル・プロセスの数。
config.yaml ファイルの例
source_config:
config_path:「<path_to_delta_share_config>」
tables: # オプション - 処理する特定のテーブルのリスト
- 「テーブル1」
- 「テーブル2」
target_config:
project_id: <your-gcp-project-id>
データセット: "<bigquery-dataset-name>"
target_type: bigquery
設定ファイルのアップロード
- config.yaml と config.share ファイルの両方を gs バケットにアップロードします。
- Google Cloud Storage(GCS) (英語)
- 形式 gs://bucket-name/path/to/config.yaml を使用します。
- Google Cloud Storage(GCS) (英語)
BigQuery アプリケーションを実行する
- Python ノートブックを作成し、次のパッケージをインストールします。
%pipインストールデルタ共有pipインストールpandas-gbq -U
delta_share_to_bq.pyからコードをコピーしてノートブックに貼り付け、構成パス (config.yaml) を更新します。そしてそれを実行します。
監視とログ記録
このアプリケーションは、次のような詳細なログ記録を提供します。
- 各テーブルの処理ステータス。
- エラー メッセージと例外。
- 並行処理情報。
ベスト プラクティス
- パフォーマンスの最適化
- システムリソースに基づいてスレッド数を調整します。
- 大きなテーブルでメモリ使用量を監視します。
- 同時実行プロセスを設定するときは、テーブルのサイズを考慮してください。
- エラー管理
- アプリケーション ログを監視します。
- 適切なアラートを設定します。
- バックアップ構成を維持します。
トラブルシューティング
一般的な問題と解決策:
- 接続障害
- ネットワーク接続を確認します。
- 資格情報の有効性を確認します。
- サービス アカウントの権限を確認します。
- 処理エラー
- テーブルの存在を確認します。
- テーブルのアクセス許可を確認します。
- 構成設定を検証します。
- パフォーマンスの問題
- 同時スレッド数を減らします。
- システム・リソースをモニターします。
サポート
さらにヘルプが必要な場合:
- アプリケーション ログでエラーの詳細を確認します。
- 構成設定を確認します。
- すべての前提条件が満たされていることを確認します。
- 権限関連の問題については、システム管理者に問い合わせてください。

