HubSpotやSalesforceへ移行する直前、旧システムのデータを確認したら「想像以上に汚れていた」という経験をした担当者は少なくないはずです。重複したレコード、法人格の表記ゆれ、空欄だらけの電話番号欄。放置したまま移行してしまうと、問題がそのまま新システムに引き継がれます。
かといって、1,000件を手作業で整理しようとすると40〜80時間かかる。担当者が確保できない、スキルも足りない。そういうタイミングに、顧客DB整理の代行依頼という選択肢が現実的になります。
この記事では、顧客DB整理の代行に出すときの業務範囲・4工程フロー・料金相場・発注前のチェックポイントを、実務担当者が社内稟議に使えるレベルで解説します。
顧客DBが「汚染」されると何が起きるか
データが「じわじわ腐る」メカニズム
顧客DBの品質は、意識して手を入れなければ時間とともに劣化します。退職・部署異動・社名変更・合併。こうした変化がBtoBの取引先では常時発生しており、過去に正確だったレコードが徐々に実態と乖離し、精度が落ちます。
業界統計では、BtoBの顧客データは年間20〜30%のペースで陳腐化するといわれています。3年前に構築したDBであれば、半数近くのレコードが何らかの形で情報が古くなっていても不思議ではありません。
さらに、複数の営業担当や複数のシステムからデータが入ってくると、同一企業が「株式会社ABC」「ABC株式会社」「(株)ABC」として別々のレコードで登録されていくパターンが積み重なります。意図して重複を作っているわけではなく、運用の過程でじわじわと汚染が進むのがやっかいなところです。
重複・表記ゆれ・欠損が引き起こす3つのトラブル
品質が劣化した顧客DBを使い続けると、具体的に3つの問題が発生します。
トラブル①:重複メール送信による顧客体験の毀損
同一の担当者に同じ件名のメールが2通届くことがあります。「また来た」という印象を与えるだけでなく、重要なコミュニケーションの信頼性まで下がるリスクがあります。
トラブル②:営業チームの二重アプローチ
同じ企業に別の営業担当が別々にコンタクトしているケース。社内で情報が共有されていれば防げるはずの動きが、重複レコードによって把握できない状態になっています。顧客側からすると「御社の組織管理はどうなっているのか」という印象につながります。
トラブル③:CRM移行後の品質問題が露出して工数爆発
移行前に整備せずにそのまま新システムへ持ち込んだ場合、移行後にはじめて重複・欠損の多さに気づき、移行後の作業が膨大になるパターンです。HubSpotの重複管理ツールは手動マージが基本なので、数千件の重複があると現実的に対処しきれない工数になります。
未整備のDBでは重複レコードが全体の15〜30%に達することも珍しくありません。1万件のDBであれば、1,500〜3,000件が重複している計算です。
顧客DB整理代行の業務範囲 — 何を・どこまでやってくれるか
代行で対応できる6工程
「DB整理」と一口に言っても、代行サービスが対応する内容は多岐にわたります。主な工程は以下の6つです。
①重複削除(名寄せ):同一企業・同一人物として登録されているレコードを統合します。表記が異なっても「実質同一」と判断できるレコードをまとめる「曖昧一致の名寄せ」まで対応できる業者を選ぶことが重要です。
②表記ゆれ統一:「株式会社」「㈱」「(株)」の法人格表記、全角・半角の混在、ひらがな・カタカナのゆれを統一します。入力担当者が変わるたびにばらつきが生まれる部分で、手作業ではパターン出しだけで時間がかかります。
③欠損補完:メールアドレス・電話番号・郵便番号・業種など、空欄になっているフィールドを補完します。外部データソースとの照合で補完率を上げられる業者もあります。
④法人番号付与:国税庁の法人番号公表サイトAPIを使って、企業名から法人番号を自動付与します。法人番号があると、表記ゆれのある複数レコードが同一企業かどうかを確定的に識別できるため、名寄せ精度が大幅に向上します。
⑤フォーマット統一:電話番号のハイフン有無、日付形式(2024/01/01 vs 2024-01-01)、住所表記の統一など、同じ情報でも書き方がばらついている部分を標準化します。
⑥HubSpot/SFDC対応の納品形式変換:整理後のデータを、インポート先のCRM/MAのフィールド定義に合わせたCSV形式に変換して納品します。これを省くと、インポート後にフィールドマッピングのズレが発生します。
名寄せ(重複削除)はどこまで対応するか
名寄せには「完全一致の重複」と「曖昧一致の重複」の2種類があります。
完全一致の重複(まったく同じ文字列のレコードが複数ある状態)は、HubSpotやSalesforceの標準機能でも検出できます。問題は曖昧一致の重複です。表記が異なるために別企業として登録されているレコードは、自動検出してもルール定義が複雑で、人の判断を伴う処理が必要になります。
代行を選ぶ際は、「完全一致のみか、曖昧一致まで含むか」を確認してください。曖昧一致まで対応しているかどうかで、整理後のDB品質に大きな差が出ます。
法人番号付与を整理工程に含める意味
法人番号付与は、名寄せ精度の「土台」を固める工程です。法人番号が付いていない状態では、表記が異なる同一企業レコードを確定的に結びつける根拠がありません。逆に、法人番号が付与されていれば「番号が一致 = 同一企業」と機械的に判断できるため、曖昧一致名寄せの漏れを大幅に減らせます。
国税庁の法人番号公表サイトAPIは無償公開されているため、代行費用の中に含まれているかどうかを見積もり段階で確認しておくとよいでしょう。
代行の4工程フロー — 依頼から納品まで何日かかるか
事前精度調査とは何か
代行を依頼してから納品まで、一般的には以下の4工程で進みます。
工程①:ヒアリング・サンプル精度調査(2〜5営業日)
件数・フィールド構成・品質の現状を確認するフェーズです。多くの業者は、この段階でサンプルデータ(100〜500件程度)を受け取り、無料で精度調査を行います。どの程度の重複・表記ゆれ・欠損があるかを可視化したうえで、本見積もりが出てきます。
「費用をかけてみないとわからない」という状態で依頼を躊躇している担当者にとって、無料の精度調査は現実的な第一歩になります。事前精度調査を無料提供している業者を最初の候補に入れると、判断がしやすくなります。
工程②:本見積もり・契約(1〜3営業日)
件数・工程数・納品形式・納期を確定し、NDAを締結したうえで正式契約します。この段階で、「どのフィールドをどのルールで統一するか」を文書化しておくと、後工程での認識ずれを防げます。
工程③:処理・クレンジング(5〜15営業日)
合意した仕様に基づき、全件のクレンジングを実施します。件数と工程数によって期間は変動し、5,000件以下のスポット整備であれば5〜10営業日が目安です。進捗確認のタイミングを業者と事前に決めておくと、スケジュール管理がしやすくなります。
工程④:Before/After差分レポート付き納品(1〜2営業日)
クレンジング済みのCSVと、処理前後の変化を可視化した差分レポートをセットで納品します。全体のリードタイムは、小規模(5,000件以下)で2〜3週間、大規模(1万件超)は別途相談が一般的です。
Before/After差分レポートで確認すべき3項目
Before/Afterレポートは、クレンジングの品質を検証するための監査用資料です。受け取ったら以下の3点を必ず確認してください。
- 重複削除件数と統合ルール:何件が削除・統合されたか。また、どのルールで統合判断をしたか。削除ルールを確認しておかないと、本来別企業だったレコードが誤って統合されていても気づけません。
- 表記ゆれ統合パターン:どの表記がどのように統一されたか。業種や取引先の特性によっては「この表記は統一してほしくなかった」というケースが出ることもあります。
- 欠損補完率:補完前後の充足率(例:法人番号付与率 72% → 94%)。補完率が目標に達していない場合は追加処理を依頼できる業者もあります。
Before/After事例 — 整理前後の変化を数字で見る
重複削除だけで何件減るか(15,000件DBの場合)
実際の顧客DB整理でよく見られるパターンを、代表的なケース例として示します。
Before(整理前)
- 総レコード数:15,000件
- 重複レコード:約3,300件(重複率22%)
- 法人電話番号の欠損:約4,650件(欠損率31%)
- 表記ゆれパターン:140種類以上(法人格・全角半角・ひらがなカタカナ)
After(整理後)
- 実質レコード数:11,700件(重複削除3,300件)
- 電話番号の補完率:84%(欠損4,650件 → 補完後748件の欠損)
- 法人番号付与率:97%
- 表記ゆれ:0件(全パターン統一済み)
3,300件の重複削除により、MAのメール配信リストが実質21%圧縮されます。同一の担当者に複数回メールが届くリスクが解消されるだけでなく、配信コスト自体も削減されます。
CRM移行前 vs 移行後にクレンジングする場合の工数差
同じクレンジング作業でも、CRM移行前に実施するか移行後に実施するかで、総工数に大きな差が出ます。
移行前に一括クレンジングする場合、外部の代行業者が整備済みのCSVを作成し、それを一度インポートするだけで済みます。
移行後にHubSpotの標準機能でマージしようとすると、重複管理ツールで1件ずつ「どちらを残すか」を手動で判断する作業が発生します。3,300件の重複があれば、3,300回の判断操作が必要になるため、現実的ではない工数になります。
整備のタイミングとして「移行前の代行整備」が強く推奨される理由はここにあります。
料金相場 — 件数・工程数・業者選択で変わる費用の目安
主な料金体系4タイプ
顧客DB整理代行の料金体系は、大きく4つに分かれます。
①件数従量課金(5〜50円/件):最も一般的なモデルです。処理工程数によって単価が変わります。
| 工程の範囲 | 単価目安 |
|---|---|
| 重複削除のみ | 5〜15円/件 |
| 表記ゆれ統一+重複削除 | 15〜30円/件 |
| フル工程(法人番号付与含む) | 30〜50円/件 |
②月額固定(5〜30万円/月):定期的にデータが入ってくる場合に向く契約形式です。優先処理・担当者固定・品質保証が期待できますが、データ量が少ない月も固定費が発生します。
③プロジェクト一括(10万〜100万円):初期一括クレンジングや、移行プロジェクトに紐づく大規模整備に使われる形式です。規模と複雑さ次第で大きく変動します。
④時間単価(1,500〜3,000円/時間):作業量が読みにくい場合やフリーランス系の業者に多いモデルです。
見積もりに含まれているか確認すべき6項目
複数業者から見積もりを取る際、単純な金額比較では判断を誤るケースがあります。以下の6項目が見積もりに含まれているかを必ず確認してください。
- 工程の範囲:重複削除のみか、法人番号付与・欠損補完まで含むか
- Before/Afterレポートの有無:差分レポートが標準提供か、別途オプションか
- 納品形式のCRM対応:HubSpot・Salesforceのインポートフォーマットに合わせた納品が可能か
- 修正対応の回数:納品後の修正依頼が何回まで含まれるか
- セキュリティ対応:NDA締結・Pマーク取得・作業終了後のデータ廃棄証明の有無
- スポット対応可否:継続契約が必須か、単発・一括整備のみでも受け付けるか
「重複削除のみ」と「フル工程」では単価が3〜4倍異なります。見積もり比較は、工程の範囲を揃えたうえで行うことが前提です。
月額固定契約が向くケース・向かないケース
月額固定が向くケース:毎月500件以上の新規データが入ってくる、定期的に名刺やフォーム入力から顧客情報が追加される、CRM運用の一部として常時クレンジングが必要なケース。
月額固定が向かないケース:CRM移行前の一括整備だけが目的で、移行後は新規データの流入が少ないケース。この場合はスポット依頼で十分で、月額契約にする必要はありません。
SFDC・HubSpot対応の顧客DB整理とは何が違うか
HubSpotの標準重複管理機能と外部整備の使い分け
HubSpotには「データ品質自動化(Data Hub)」が搭載されており、空白除去・大文字小文字の修正・電話番号フォーマット統一・完全一致の重複検出といった機能を備えています。
ただし、大量の曖昧一致重複を一括処理する機能は持っていません。重複として検出されたコンタクトのマージは1件ずつの手動操作が基本で、数百〜数千件規模の重複を移行後にHubSpot上でマージしようとすると、現実的ではない工数になります。
詳しい機能の限界と対処法については、HubSpotのデータクレンジング詳細ガイドで解説しています。
HubSpotの標準機能が得意なこと:
- 完全一致の重複コンタクトの検出
- プロパティ値の書式統一(電話番号・メールアドレス)
- 入力時のバリデーション設定
外部整備が必要な場面:
- 表記ゆれを伴う曖昧一致の大量重複(数百件以上)
- 法人番号の付与と正式社名・住所の最新化
- 全角半角・法人格・ひらがなカタカナの一括統一
- 移行前の初期一括クレンジング
SalesforceのデータクレンジングでSFDC標準機能が追いつかない場面
Salesforceには重複管理ルールとマッチングルールが用意されており、一定の自動化は可能です。しかし、重複管理ルールは「新規登録時の重複防止」が主な用途で、既存の蓄積済み重複を遡って一括解消する機能としては制限があります。
特に以下の場面では、外部整備が有効です。
- 過去数年分の蓄積データに積み重なった曖昧一致重複の一括解消
- 法人番号が未付与のまま登録されている既存レコードへの一括付与
- 複数のデータソース(名刺入力・フォーム・インポート)から生まれた重複の整理
納品形式がCRM対応でないと何が起きるか
クレンジング済みのデータをCRMにインポートする際、CSVのフィールド名がCRMのプロパティ名と一致していないと、インポートエラーや「空白のフィールドに上書きされる」といった問題が発生します。
HubSpotへのインポートであれば、CSVの列名がHubSpotのプロパティのinternalNameと一致している必要があります。代行業者に依頼する際は、「HubSpot/SFDCのどのフィールドに対応したCSVで納品するか」を契約前に確認しておくと、インポート後のトラブルを防げます。
発注前に確認すべき5つのチェックポイント
顧客DB整理代行を依頼する前に、以下の5点を確認してください。データクレンジングの基本的な考え方については、データクレンジングの基本工程ガイドも参考になります。
チェックポイント①:対応工程の範囲
重複削除のみか、法人番号付与・欠損補完まで含むかを確認します。「DB整理代行」という名称でも、実際には重複削除と表記ゆれ統一のみで、欠損補完や法人番号付与は別料金・別サービスというケースがあります。
目的がCRM移行前の一括整備であれば、フル工程(重複削除+表記ゆれ統一+欠損補完+法人番号付与)に対応しているかを確認してください。
チェックポイント②:Before/Afterレポートの有無
処理内容を監査・確認できる差分レポートを標準提供しているかどうかを確認します。レポートがない場合、「何件が削除されたのか」「どのルールで処理されたのか」を後から検証できません。
Before/Afterレポートを標準提供として明記している業者は、まだ多くありません。契約前に「差分レポートは標準で含まれますか」と確認しておく価値があります。
チェックポイント③:納品形式のCRM対応
HubSpot・Salesforce・Zoho CRMなど、インポート先のツールに合わせたCSV形式で納品できるかを確認します。フィールドマッピングが対応していない場合、インポート後に手動で列名を修正する作業が発生します。
チェックポイント④:セキュリティ・守秘義務
顧客データは個人情報・機密情報を含むケースがほとんどです。以下を契約前に必ず確認してください。
- NDA(秘密保持契約)の締結可否
- Pマーク取得またはISO 27001認証の有無
- データの保管・処理環境のアクセス制限
- 作業完了後のデータ廃棄方法と廃棄証明の提供可否
Pマークや情報セキュリティ認証を取得していない業者への顧客データの提供は、内部規程や取引先との契約上リスクになる場合があります。
守秘義務・セキュリティ認証の確認方法
業者のWebサイトで確認できない場合は、問い合わせ時に「NDAを締結できますか」「Pマーク取得状況を教えていただけますか」と直接聞くのが最も確実です。正式な資料として「セキュリティポリシー」の開示を求めることもできます。
チェックポイント⑤:スポット対応可否
継続契約が必須か、単発・一括整備のみでも受け付けるかを確認します。CRM移行前の一括整備が目的であれば、継続契約を前提とする業者よりも、スポット依頼に対応している業者の方が実態に合います。
「事前精度調査が無料の業者を最初に試す」というアプローチが、コストをかけずに業者との相性を確認する最も現実的な方法です。精度調査の段階で対応品質・コミュニケーションの速さ・レポートの見やすさが確認できます。
スポット依頼と継続契約はどちらがコストを抑えられるか
単純な件数コストで比較すると、継続契約は月額割引が入るため1件あたりの単価は下がります。ただし、月次の最低処理件数が設定されている契約では、データ量が少ない月も固定費が発生します。
目的が初期一括整備の場合はスポット依頼、継続的にデータが入ってくる場合は継続契約が、それぞれ実態に合った選択です。
Dr.Wallet BPOの顧客DB整理代行サービス
Dr.Wallet BPOは、顧客DBの重複削除・表記ゆれ統一・欠損補完・法人番号付与の4工程を代行します。
サービス概要
- 対応工程:①重複削除(名寄せ)②表記ゆれ統一 ③欠損補完 ④法人番号付与
- 納品物:整理済みCSV(HubSpot/Salesforce/Zoho CRM対応フォーマット)+ Before/After差分レポート
- 料金の目安:1件¥15〜、最低¥30,000〜(スポット対応可)
- 対応ファイル形式:CSV・Excel・HubSpot・Salesforce・Zoho CRM
- 対応件数:500件〜(スポット整備・定期メンテナンス両対応)
お問い合わせから最短5営業日でサンプルデータの精度確認結果をお返しします。まずはサンプルデータ500件からのトライアルでご確認ください。データ収集代行との組み合わせで、収集からクレンジング・納品までのワンストップ対応も可能です。
よくある質問(FAQ)
データクレンジングと名寄せはどう違いますか?
名寄せは重複する複数レコードを1件に統合する作業で、データクレンジングに含まれる工程の一つです。データクレンジングはそれに加えて、表記ゆれ統一・欠損補完・フォーマット標準化など、DB全体の品質向上を指します。
何件から代行に出す価値がありますか?
目安として500件以上・表記ゆれパターンが複数混在している場合は、費用対効果で代行が有利になるケースが多いです。件数が多いほど単価が下がり、手作業ミスのリスクも減ります。
HubSpotに移行する前にクレンジングは必要ですか?
強く推奨します。HubSpot移行後に重複マージしようとすると、標準の重複管理ツールで件数分の手動マージが必要になり、工数が移行前整備の数倍になるケースがあります。
法人番号が付いていないデータでも名寄せできますか?
対応可能ですが、法人番号なしでの名寄せは表記ゆれが多いほど漏れが増えます。国税庁の法人番号公表サイトAPIを使って自動付与することで、同一法人を確定的に識別でき精度が向上します。
セキュリティ面はどう担保されますか?
信頼できる代行業者はNDA締結・Pマーク取得・作業終了後のデータ廃棄証明を標準提供します。依頼前にNDAの締結可否と廃棄ルールを必ず確認してください。