このページはAIにより自動翻訳されており、不正確な内容が含まれている可能性があります。翻訳の誤りを報告するには、ページ右側の目次の下にあるフィードバックをご利用ください。

ベストプラクティス

Brazeクラウドデータ取り込みを使用すると、データウェアハウスやファイルストレージシステムからBrazeへの直接接続を設定して、関連するユーザーデータやカタログデータを同期できます。このデータをBrazeに同期すると、パーソナライゼーション、トリガー、セグメンテーションなどのユースケースに活用できます。

`UPDATED_AT`列を理解する

注

UPDATED_ATはデータウェアハウス統合にのみ関連するもので、S3同期には関係ありません。

同期が実行されると、Brazeはデータウェアハウスインスタンスに直接接続し、指定されたテーブルからすべての新しいデータを取得し、Brazeダッシュボードの対応するデータを更新します。同期が実行されるたびに、Brazeは更新されたデータを反映します。

重要

Braze CDIは、行の内容がBrazeに現在存在するものと同一であるかどうかにかかわらず、厳密にUPDATED_ATの値に基づいて行を同期します。そのため、不要なデータポイント使用量を避けるために、新規または更新されたデータのみを同期するようUPDATED_ATを適切に利用することを推奨します。

例：定期的な同期

CDI同期におけるUPDATED_ATの使用方法を示すため、ユーザー属性を更新する定期同期の例を考えてみましょう。

ファイルストレージソース
- Amazon S3

サポートされるデータタイプ

クラウドデータ取り込みは、次のデータタイプをサポートしています。

ユーザー属性（以下を含む）：
- 階層化カスタム属性
- オブジェクト配列
- サブスクリプションステータス
カスタムイベント
購入イベント
カタログ項目
ユーザー削除リクエスト

データタイプの問題を回避する

CDIを使用して外部ソース（DatabricksやSnowflakeなど）からデータを同期する場合、同期前にソース列が正しいデータタイプを使用していることを確認してください。よくある問題には以下があります。

文字列として保存されたタイムスタンプ： 日付列がソースデータベースでvarcharやstringではなく、timestampまたはdatetimeタイプを使用していることを確認してください。
文字列として保存された数値： 同期前にソースクエリで数値列をintegerまたはfloatタイプにキャストしてください。
同期間で一貫性のないタイプ： 同期間で列のタイプが変更されると、Brazeが新しいデータを拒否する場合があります。ソーススキーマが一貫していることを確認してください。

Brazeダッシュボードでカスタム属性のデータタイプを強制または変更する方法については、カスタムデータの管理を参照してください。

ユーザーデータは、external ID、ユーザーエイリアス、Braze ID、メール、または電話番号で更新できます。ユーザーはexternal ID、ユーザーエイリアス、またはBraze IDで削除できます。

同期されるデータ

同期が実行されるたびに、Brazeは以前に同期されていない行を調べます。このときに、テーブルまたはビューのUPDATED_AT列がチェックされます。Brazeは、最後に同期されたUPDATED_ATの値よりも後のUPDATED_ATを持つ行を選択してインポートします。境界タイムスタンプと完全に一致する行も、同じタイムスタンプで新しい行が実行間に追加された場合、再同期される可能性があります。

重要

CDIは、最後に同期されたUPDATED_ATの値における行数を追跡します。同じタイムスタンプで新しい行が実行間に追加された場合、CDIは包含境界（>=）に切り替え、そのタイムスタンプのすべての行（すでに処理済みのものを含む）を再同期します。重複同期や不要なデータポイント消費を避けるために、同期実行間でユニークなUPDATED_ATの値を使用してください。詳細については、重複タイムスタンプによる行の再同期を避けるを参照してください。

データウェアハウスで、次のユーザーと属性をテーブルに追加し、UPDATED_ATの時間をこのデータを追加する時間に設定します。

UPDATED_AT EXTERNAL_ID PAYLOAD

2022-07-17 08:30:00

customer_1234

1
2
3
4
5
6
7
8
{
    "attribute_1":"abcdefg",
    "attribute_2": {
        "attribute_a":"example_value_1",
        "attribute_b":"example_value_1"
    },
    "attribute_3":"2019-07-16T19:20:30+1:00"
}

2022-07-18 11:59:23

customer_3456

1
2
3
4
5
6
{
    "attribute_1":"abcdefg",
    "attribute_2":42,
    "attribute_3":"2019-07-16T19:20:30+1:00",
    "attribute_5":"testing"
}

2022-07-19 09:07:23

customer_5678

1
2
3
4
5
{
    "attribute_1":"abcdefg",
    "attribute_4":true,
    "attribute_5":"testing_123"
}

次のスケジュールされた同期時に、Brazeは最新の同期済みタイムスタンプよりも後のUPDATED_ATタイムスタンプを持つすべての行を同期します。Brazeはフィールドを更新または追加するため、毎回ユーザープロファイル全体を同期する必要はありません。同期後、ユーザープロファイルは新しい更新を反映します。

定期的な同期、2回目の実行：2022年7月20日午後12時

UPDATED_AT EXTERNAL_ID PAYLOAD

2022-07-17 08:30:00

customer_1234

1
2
3
4
5
6
7
8
{
    "attribute_1":"abcdefg",
    "attribute_2": {
        "attribute_a":"example_value_2",
        "attribute_b":"example_value_2"
    },
    "attribute_3":"2019-07-16T19:20:30+1:00"
}

2022-07-18 11:59:23

customer_3456

1
2
3
4
5
6
{
    "attribute_1":"abcdefg",
    "attribute_2":42,
    "attribute_3":"2019-07-16T19:20:30+1:00",
    "attribute_5":"testing"
}

2022-07-19 09:07:23

customer_5678

1
2
3
4
5
{
    "attribute_1":"abcdefg",
    "attribute_4":true,
    "attribute_5":"testing_123"
}

2022-07-16 00:25:30

customer_9012

1
2
3
4
5
{
    "attribute_1":"abcdefg",
    "attribute_4":false,
    "attribute_5":"testing_123"
}

customer_9012の新しい行が追加されましたが、そのUPDATED_ATの値（2022-07-16 00:25:30）は保存されたタイムスタンプ（2022-07-19 09:07:23）よりも前であるため、同期されません。ただし、customer_5678の既存の行は保存されたタイムスタンプと等しいUPDATED_ATの値を持つため、包含境界により再同期されます。この動作の詳細については、UPDATED_ATの時間が同期の時間と同じでないことを確認するを参照してください。保存されたUPDATED_ATは2022-07-19 09:07:23のままです。

定期的な同期、3回目の実行：2022年7月21日午後12時

UPDATED_AT EXTERNAL_ID PAYLOAD

2022-07-17 08:30:00

customer_1234

1
2
3
4
5
6
7
8
{
    "attribute_1":"abcdefg",
    "attribute_2": {
        "attribute_a":"example_value_1",
        "attribute_b":"example_value_1"
    },
    "attribute_3":"2019-07-16T19:20:30+1:00"
}

2022-07-18 11:59:23

customer_3456

1
2
3
4
5
6
{
    "attribute_1":"abcdefg",
    "attribute_2":42,
    "attribute_3":"2019-07-16T19:20:30+1:00",
    "attribute_5":"testing"
}

2022-07-19 09:07:23

customer_5678

1
2
3
4
5
{
    "attribute_1":"abcdefg",
    "attribute_4":true,
    "attribute_5":"testing_123"
}

2022-07-16 00:25:30

customer_9012

1
2
3
4
5
{
    "attribute_1":"xyz",
    "attribute_4":false,
    "attribute_5":"testing_123"
}

2022-07-21 08:30:00

customer_1234

1
2
3
4
5
6
7
8
{
    "attribute_1":"abcdefg",
    "attribute_2": {
        "attribute_a":"example_value_2",
        "attribute_b":"example_value_2"
    },
    "attribute_3":"2019-07-20T19:20:30+1:00"
}

この3回目の実行では、customer_1234の新しい行が追加され、そのUPDATED_ATの値（2022-07-21 08:30:00）は保存されたタイムスタンプよりも後です。この新しい行と、customer_5678の既存の行（保存されたタイムスタンプと等しいUPDATED_ATを持つ）の両方が同期されます。保存されたUPDATED_ATは2022-07-21 08:30:00に設定されます。

注

UPDATED_ATの値は、特定の同期の実行開始時刻よりもさらに後の時刻であっても構いません。ただし、これは推奨されません。最後のUPDATED_ATタイムスタンプが「未来に押しやられる」ことになり、その後の同期ではそれ以前の値が同期されなくなるためです。

`UPDATED_AT`列にUTCタイムスタンプを使用する

夏時間に関する問題を防ぐために、UPDATED_AT列はUTCにする必要があります。できる限り、CURRENT_DATE()ではなくSYSDATE()など、UTCのみの関数を使用してください。

重複タイムスタンプによる行の再同期を避ける

CDIは、最後に同期されたUPDATED_ATタイムスタンプにおける行数を追跡します。CDIが前回の実行以降に同じタイムスタンプで新しい行が追加されたことを検出すると、包含境界（>=）を使用してそのタイムスタンプのすべての行（すでに処理済みのものを含む）を再選択します。それ以外の場合、CDIは排他境界（>）を使用し、最後に同期された値よりも厳密に後の行のみを選択します。

例えば、同期がUPDATED_AT = 2025-04-01 00:00:00の5行を処理し、後から同じタイムスタンプで6行目が追加された場合、次の同期はカウントの変化を検出し、6行すべてを再同期します。これにより、重複データや不要なデータポイント消費が発生する可能性があります。

これを避けるには：

VIEWに対して同期を設定する場合、デフォルト値としてCURRENT_TIMESTAMPを使用しないでください。使用すると、同期が実行されるたびにすべてのデータが同期されます。これは、UPDATED_ATフィールドの評価結果がクエリの実行時間になるためです。
長時間実行されるパイプラインやクエリがソーステーブルにデータを書き込んでいる場合、同期と同時に実行することを避けるか、挿入される各行に同じタイムスタンプを使用することを避けてください。
トランザクションを使用して、同じタイムスタンプを持つすべての行を書き込みます。
ユニークで単調増加するUPDATED_ATの値を使用して、処理済みの行が再選択されることを防ぎます。

例：その後の更新を管理する

この例では、最初にデータを同期し、その後の更新では変更されたデータ（差分）のみを更新する一般的なプロセスを説明します。いくつかのユーザーデータを含むテーブルEXAMPLE_DATAがあるとします。1日目のテーブルには次の値があります。

例：その後の更新を管理する
external_id	attribute_1	attribute_2	attribute_3	attribute_4
12345	823	blue	380	FALSE
23456	28	blue	823	TRUE
34567	234	blue	384	TRUE
45678	245	red	349	TRUE
56789	1938	red	813	FALSE

このデータをCDIが期待する形式に変換するには、次のクエリを実行します。

SELECT
    CURRENT_TIMESTAMP AS UPDATED_AT,
    EXTERNAL_ID AS EXTERNAL_ID,
    TO_JSON(
        OBJECT_CONSTRUCT(
            'attribute_1', attribute_1,
            'attribute_2', attribute_2,
            'attribute_3', attribute_3,
            'attribute_4', attribute_4
        )
    ) AS PAYLOAD
FROM EXAMPLE_DATA;

このデータはどれもBrazeに同期されていないため、CDIのソーステーブルにすべて追加します。

UPDATED_AT EXTERNAL_ID PAYLOAD

2023-03-16 15:00:00 12345 { "ATTRIBUTE_1": "823", "ATTRIBUTE_2":"blue", "ATTRIBUTE_3":"380", "ATTRIBUTE_4":"FALSE"}

2023-03-16 15:00:00 23456 { "ATTRIBUTE_1": "28", "ATTRIBUTE_2":"blue", "ATTRIBUTE_3":"823", "ATTRIBUTE_4":"TRUE"}

2023-03-16 15:00:00 34567 { "ATTRIBUTE_1": "234", "ATTRIBUTE_2":"blue", "ATTRIBUTE_3":"384", "ATTRIBUTE_4":"TRUE"}

2023-03-16 15:00:00 45678 { "ATTRIBUTE_1": "245", "ATTRIBUTE_2":"red", "ATTRIBUTE_3":"349", "ATTRIBUTE_4":"TRUE"}

2023-03-16 15:00:00 56789 { "ATTRIBUTE_1": "1938", "ATTRIBUTE_2":"red", "ATTRIBUTE_3":"813", "ATTRIBUTE_4":"FALSE"}

同期が実行され、Brazeにより「2023-03-16 15:00:00」まで利用可能なすべてのデータを同期したと記録されます。次に、2日目の朝にETLが実行され、ユーザーテーブルの一部のフィールドが更新されます（*で示されています）。

例：その後の更新を管理する。*は前回の同期以降に更新されたフィールドを示します。
external_id	attribute_1	attribute_2	attribute_3	attribute_4
12345	145*	red*	380	TRUE*
23456	15*	blue	823	TRUE
34567	234	blue	495*	FALSE*
45678	245	green*	349	TRUE
56789	1938	red	693*	FALSE

ここで、変更された値のみをCDIソーステーブルに追加する必要があります。古い行を更新するのではなく、これらの行を追加できます。そのテーブルは次のようになります。

UPDATED_AT EXTERNAL_ID PAYLOAD

2023-03-16 15:00:00 12345 { "ATTRIBUTE_1": "823", "ATTRIBUTE_2":"blue", "ATTRIBUTE_3":"380", "ATTRIBUTE_4":"FALSE"}

2023-03-16 15:00:00 23456 { "ATTRIBUTE_1": "28", "ATTRIBUTE_2":"blue", "ATTRIBUTE_3":"823", "ATTRIBUTE_4":"TRUE"}

2023-03-16 15:00:00 34567 { "ATTRIBUTE_1": "234", "ATTRIBUTE_2":"blue", "ATTRIBUTE_3":"384", "ATTRIBUTE_4":"TRUE"}

2023-03-16 15:00:00 45678 { "ATTRIBUTE_1": "245", "ATTRIBUTE_2":"red", "ATTRIBUTE_3":"349", "ATTRIBUTE_4":"TRUE"}

2023-03-16 15:00:00 56789 { "ATTRIBUTE_1": "1938", "ATTRIBUTE_2":"red", "ATTRIBUTE_3":"813", "ATTRIBUTE_4":"FALSE"}

2023-03-17 09:30:00 12345 { "ATTRIBUTE_1": "145", "ATTRIBUTE_2":"red", "ATTRIBUTE_4":"TRUE"}

2023-03-17 09:30:00 23456 { "ATTRIBUTE_1": "15"}

2023-03-17 09:30:00 34567 { "ATTRIBUTE_3":"495", "ATTRIBUTE_4":"FALSE"}

2023-03-17 09:30:00 45678 { "ATTRIBUTE_2":"green"}

2023-03-17 09:30:00 56789 { "ATTRIBUTE_3":"693"}

CDIは新しい行だけを同期するので、次に実行される同期では最後の5行のみが同期されます。

追加のヒント

消費を最小限に抑えるために、新規の属性または更新された属性のみを書き込む

同期が実行されるたびに、Brazeは以前に同期されていない行を調べます。このときに、テーブルまたはビューのUPDATED_AT列がチェックされます。Brazeは、最後に同期されたUPDATED_ATの値よりも後のUPDATED_ATを持つ行を、ユーザープロファイル上の現在の内容と同一かどうかにかかわらず、選択してインポートします。境界タイムスタンプの行も、新しい行がそのタイムスタンプを共有している場合、再同期される可能性があります。そのため、追加または更新する属性のみを同期することをお勧めします。

CDIを使用したデータポイント使用量は、REST APIやSDKなどの他の取り込み方法と同じです。したがって、ソーステーブルに追加するのは新規または更新された属性のみであることを確認するのは、お客様の責任です。

`EXTERNAL_ID`を`PAYLOAD`列から分離する

PAYLOADオブジェクトには、external IDまたはその他のIDタイプを含めないでください。

属性を削除する

ユーザーのプロファイルから属性を省略する場合は、nullに設定できます。属性を変更せずに残す場合は、更新されるまでBrazeに送信しないでください。属性を完全に削除するには、TO_JSON(OBJECT_CONSTRUCT_KEEP_NULL(...))を使用します。

増分更新を行う

データの増分更新を行うことで、同時更新時の意図しない上書きを防ぐことができます。

重要

異なる属性の更新： ほとんどの場合、2つの更新がユーザーの同じ属性に影響を与えないなら、それらの結果は完全に独立しています。例えば、あるユーザーのColor属性を更新し、別にSize属性を更新した場合、たとえ両方の更新が数秒以内に発生したとしても、両方の更新は正しく適用されます。
同じ属性への更新： 複数の更新が単一の同期実行内で同じ属性を対象とする場合、競合が発生する可能性があります。こうした稀なケースでは、ある更新が別の更新を上書きすることがあります。この動作を防ぐ最善の方法は、CDI同期のソースデータが各ユーザーの最新の状態のみを反映していること、あるいは特定のユーザーまたはユーザーと属性の組み合わせに対するすべての更新が単一の行に収められていることを保証することです。
オブジェクト配列演算子： 独立した更新の唯一の例外は、オブジェクト配列に対する$add、$remove、$update演算子による更新です。これらの演算子では、同一の配列に対する更新が互いに干渉し合う可能性があります。
イベント： 競合はイベントに影響を与えません。各イベントはユニークであり、それにタイムスタンプが関連付けられているためです。

この動作を防ぐ最善の方法は、CDI同期のソースデータが各ユーザーの最新の状態のみを反映していること、あるいは特定のユーザーまたはユーザーと属性の組み合わせに対するすべての更新が単一の行に収められていることを保証することです。

別のテーブルからJSON文字列を作成する

各属性を内部的に独自の列に格納している場合は、それらの列をJSON文字列に変換してBrazeとの同期に使用する必要があります。そのために、次のようなクエリを使用できます。

このクエリをSnowflakeで使用して、ソース列をCDIフィールドにフォーマットします。

CREATE TABLE "EXAMPLE_USER_DATA"
    (attribute_1 string,
     attribute_2 string,
     attribute_3 number,
     my_user_id string);

SELECT
    CURRENT_TIMESTAMP as UPDATED_AT,
    my_user_id as EXTERNAL_ID,
    TO_JSON(
        OBJECT_CONSTRUCT (
            'attribute_1',
            attribute_1,
            'attribute_2',
            attribute_2,
            'yet_another_attribute',
            attribute_3)
    )as PAYLOAD FROM "EXAMPLE_USER_DATA";

このクエリをRedshiftで使用して、ソース列をCDIフィールドにフォーマットします。

CREATE TABLE "EXAMPLE_USER_DATA"
    (attribute_1 string,
     attribute_2 string,
     attribute_3 number,
     my_user_id string);

SELECT
    CURRENT_TIMESTAMP as UPDATED_AT,
    my_user_id as EXTERNAL_ID,
    JSON_SERIALIZE(
        OBJECT (
            'attribute_1',
            attribute_1,
            'attribute_2',
            attribute_2,
            'yet_another_attribute',
            attribute_3)
    ) as PAYLOAD FROM "EXAMPLE_USER_DATA";

このクエリをBigQueryで使用して、ソース列をCDIフィールドにフォーマットします。

CREATE OR REPLACE TABLE BRAZE.EXAMPLE_USER_DATA (attribute_1 string,
     attribute_2 STRING,
     attribute_3 NUMERIC,
     my_user_id STRING);

SELECT
    CURRENT_TIMESTAMP as UPDATED_AT,
    my_user_id as EXTERNAL_ID,
    TO_JSON(
      STRUCT(
        'attribute_1' AS attribute_1,
        'attribute_2'AS attribute_2,
        'yet_another_attribute'AS attribute_3
      )
    ) as PAYLOAD
  FROM BRAZE.EXAMPLE_USER_DATA;

このクエリをDatabricksで使用して、ソース列をCDIフィールドにフォーマットします。

CREATE OR REPLACE TABLE BRAZE.EXAMPLE_USER_DATA (
    attribute_1 string,
    attribute_2 STRING,
    attribute_3 NUMERIC,
    my_user_id STRING
);

SELECT
    CURRENT_TIMESTAMP as UPDATED_AT,
    my_user_id as EXTERNAL_ID,
    TO_JSON(
      STRUCT(
        attribute_1,
        attribute_2,
        attribute_3
      )
    ) as PAYLOAD
  FROM BRAZE.EXAMPLE_USER_DATA;

このクエリをMicrosoft Fabricで使用して、ソース列をCDIフィールドにフォーマットします。

CREATE TABLE [braze].[users] (
    attribute_1 VARCHAR,
    attribute_2 VARCHAR,
    attribute_3 VARCHAR,
    attribute_4 VARCHAR,
    user_id VARCHAR
)
GO

CREATE VIEW [braze].[user_update_example]
AS SELECT
    user_id as EXTERNAL_ID,
    CURRENT_TIMESTAMP as UPDATED_AT,
    JSON_OBJECT('attribute_1':attribute_1, 'attribute_2':attribute_2, 'attribute_3':attribute_3, 'attribute_4':attribute_4) as PAYLOAD

FROM [braze].[users] ;

`UPDATED_AT`タイムスタンプを使用する

BrazeはUPDATED_ATタイムスタンプを使用して、正常に同期されたデータを追跡します。CDIは最後に同期されたタイムスタンプにおける行数も追跡します。同じタイムスタンプで新しい行が実行間に追加された場合、CDIはそのタイムスタンプのすべての行を再同期するため、重複データが発生する可能性があります。詳細とヒントについては、重複タイムスタンプによる行の再同期を避けるを参照してください。

テーブル設定

お客様がベストプラクティスやコードスニペットを共有できるように、GitHubリポジトリを公開しています。独自のスニペットを投稿するには、プルリクエストを作成してください。

データのフォーマット

クラウドデータ取り込みのテーブル設定要件とペイロードのフォーマット要件は、クラウドデータ取り込みのテーブル設定に記載されています。

このページを使用して、以下を区別してください。

ソーステーブルの要件（必須列、識別子列、UPDATED_ATの動作）
ペイロードの要件（各データタイプで/users/trackオブジェクト形式に一致する必要があるフィールド）

データウェアハウスクエリのタイムアウトを避ける

最適なパフォーマンスを実現し、潜在的なエラーを回避するために、クエリは1時間以内に完了することをお勧めします。クエリがこの時間枠を超える場合は、データウェアハウスの設定を見直すことを検討してください。ウェアハウスに割り当てられたリソースを最適化することで、クエリ実行速度を向上させることができます。

製品の制限事項

制限	説明
統合の数	設定できる統合の数に制限はありません。ただし、テーブルまたはビューごとに1つの統合しか設定できません。
行数	デフォルトでは、1回の実行で最大5億行まで同期できます。Brazeは新規行が5億を超える同期を停止します。これよりも高い制限が必要な場合は、BrazeカスタマーサクセスマネージャーまたはBrazeサポートにお問い合わせください。
行ごとの属性	各行には単一のユーザーIDと最大250の属性を持つJSONオブジェクトが含まれている必要があります。JSONオブジェクトの各キーは1つの属性としてカウントされます（つまり、配列は1つの属性としてカウントされます）。
ペイロードサイズ	各行に最大1 MBのペイロードを含めることができます。Brazeは1 MBを超えるペイロードを拒否し、同期ログに「Payload was greater than 1MB」というエラーを、関連するexternal IDと切り詰められたペイロードと共に記録します。
データタイプ	クラウドデータ取り込みを通じて、ユーザー属性、イベント、および購入を同期できます。
Brazeリージョン	この製品はすべてのBrazeリージョンで利用可能です。任意のBrazeリージョンを任意のソースデータリージョンに接続できます。
ソースリージョン	Brazeは、あらゆるリージョンまたはクラウドプロバイダーのデータウェアハウスやクラウド環境に接続できます。

New Stuff!

ベストプラクティス

UPDATED_AT列を理解する

例：定期的な同期

サポートされるデータタイプ

データタイプの問題を回避する

同期されるデータ

UPDATED_AT列にUTCタイムスタンプを使用する

重複タイムスタンプによる行の再同期を避ける

例：その後の更新を管理する

追加のヒント

消費を最小限に抑えるために、新規の属性または更新された属性のみを書き込む

EXTERNAL_IDをPAYLOAD列から分離する

属性を削除する

増分更新を行う

別のテーブルからJSON文字列を作成する

UPDATED_ATタイムスタンプを使用する

テーブル設定

データのフォーマット

データウェアハウスクエリのタイムアウトを避ける

製品の制限事項

`UPDATED_AT`列を理解する

`UPDATED_AT`列にUTCタイムスタンプを使用する

`EXTERNAL_ID`を`PAYLOAD`列から分離する

`UPDATED_AT`タイムスタンプを使用する