Azure SearchまたはSolrでxDB検索インデックスを再構築した際に長い単語によりエラーが発生する


解説

32766バイトを超える長い単語(Terms)を処理する場合、xDB検索インデックスの再構築がエラーで失敗する可能性があります。これは、Azure SearchおよびSolrプロバイダーが、検索インデックス内の単一の単語の最大サイズに制限があるために発生します。以下のようなエラーがログに記録されます:

Failed to repeat processing: key: c315df92-d019-0000-0000-054e908dff7c
msg: Field 'facets_keybehaviorcache_pageevents_data_ss' contains a term that is too large to process. The max length for UTF-8 encoded terms is 32766 bytes. The most likely cause of this error is that filtering, sorting, and/or faceting are enabled on this field, which causes the entire field value to be indexed as a single term. Please avoid the use of these options for large fields.

解決策

この問題を解決するには、以下のいずれかのオプションを検討してください: