【企業連携】コンビニエンスストア有力出店地を探せ

研究の概要

背景と課題

・コロナ禍も終焉となり、新しいライフスタイルが定着し、ネットショッピングや宅配サービスのニーズが高まるなか、店舗型の小売業であるコンビニストアは、新たな出店候補地や出店計画の立案を合理的に進めたいと考えている。

・人口や道路流量、POSデータなどから出店有望度を算出するなどの方法で、出店計画を立てたいと考えた。

アプローチ方法

新規店舗の出店地を選定するために、以下の二つの方法を採用し、それぞれの結果を統合して新規出店可能な商圏内の有望度の高い候補地を特定した。

アプローチ1: 新規出店可能な商圏の選出

商圏の属性を分析し、LightGBMやCNNを活用し、商圏全体の出店ポテンシャルを評価し、新規出店が可能なエリアを特定した。

アプローチ2: 有望度の高い候補地の選出

既存店舗データを基に、出店候補地の成功可能性を評価する機械学習モデルを構築し、さらにAHP/TOPSISを用いて候補地をランキングした。

この2つのアプローチを統合することにより、「新規出店可能な商圏」の中から「存続可能性が高く、長期間営業が見込まれる候補地」を特定した。このプロセスにより、単に出店可能なエリアを選ぶだけでなく、その中で最もポテンシャルの高い地点を「出店地」として選出することが可能となった。

アプローチ1: 新規出店可能な商圏の選出

データを活用したLightGBMとCNNの機械学習モデル

目的変数

  • 予測されたコンビニ店舗数(1, 2, 3, …, 9)

説明変数名(元データ源)

  • 競合店から100mメッシュ中心までの距離
  • 半径350m内の競合店数(NTTデータ)
  • 人気のある時間帯ごとの訪問者数分析(NTTデータ)
  • 居住者の人口分布(モバイル空間統計データ)
  • 世帯主の分析(モバイル空間統計データ)
  • 競合店の特徴(駐車場、ATM、営業時間など)(NTTデータ)
  • 交差エリアの人口密度(Huffモデル)
図1:茨城県内の予測された全コンビニ店舗の場所と新しいコンビニ店舗の予測場所の比較

まとめ

アプローチ1では、機械学習モデルであるLightGBMとCNNを活用し、人間の視点による評価を組み合わせることで、 半径350mと700m以内の店舗数を基にポテンシャルエリアをランク付けしました。このアプローチにより、 不採算なロケーションを選択するリスクを大幅に軽減できます。

アプローチ1の結果は、競合店の存在、人口分布、アクセス性といったデータを分析する上で、 機械学習の強みを示しています。また、人間の視点を加えることで、重要な基準に重み付けを行い、 ランキングをさらに洗練しました。

最終的に、このアプローチは新しいコンビニ店舗の最も魅力的なロケーションを特定するだけでなく、コンビニ以外のビジネスが新しい店舗を設置するための貴重な洞察も提供します。

アプローチ2: 有望度の高い候補地の選出

XGBoostを活用した機械学習モデル

目的変数

  • 存続有無(0: 存続なし、1: 存続あり)
  • 存続期間(0: 3年未満、1: 3〜5年、2: 5年以上)

説明変数名(元データ源)

  • 居住者数(国勢調査データ)
  • 競合店数(NTT DATA様)
  • 時間毎の滞在者数(NTT DATA様)
  • 病院数(国土交通省)
  • 学校数(国土交通省)
  • バス停数(国土交通省)
  • 時系列滞在者動向(NTT DATA様)
  • 時間帯別滞在者動向(NTT DATA様)

AHP/TOPSISを活用したランキング付け

AHP:(Analytic Hierarchy Process)

  • 基準の設定:居住者数、競合店数、時間毎の滞在者数、病院数、バス停数(機械学習の特徴重要度上位5位から選定)。
  • 各基準の重要度をペアワイズ比較し、重み付けを実施。

TOPSIS:(Technique for Order Preference by Similarity to Ideal Solution)

  • 正規化された候補地スコアを基に、理想解(最良の条件)に最も近い条件と、非理想解(最悪の条件)から最も遠い条件の両方を考慮。
  • 候補地ごとの距離を計算し、総合的に最適な候補地を特定。
  • 正規化された候補地スコアを基に、理想解(最良の条件)に最も近い条件と、非理想解(最悪の条件)から最も遠い条件の両方を考慮。
  • 候補地ごとの距離を計算し、総合的に最適な候補地を特定。
分析結果画像

図2:ランキング結果

まとめ

アプローチ2では、機械学習モデルを活用して、候補地ごとの特徴量を定量化し、「存続可能性が高く、長期間営業が見込まれる候補地」を特定した。

その後、AHP/TOPSISを組み合わせることで、各候補地を多角的に評価し、有望度の高い候補地を効率的に特定することが可能になった。

データ分析

データ分析

居住者数や競合店数、時間毎の滞在者数など機械学習説明変数の計算と可視化

  • 茨城県を100メートル毎に区切り、計62.2万件の仮出店ポイントを作成。
  • 仮出店ポイントを中心に半径350メートルの円を商圏として設定。
  • 全ての商圏について、居住者数や競合店数、時間毎の滞在者数など複数の指標を計算。
  • 計算したデータを基に、QGISを使用して商圏内の可視化を実施。
図3:各仮出店ポイントの商圏内の居住者数をQGISで可視化
   (居住者数が多いほど青色が濃い設定)

まとめ

本データ分析では、茨城県内の62.2万件の仮出店ポイントを対象に、複数の商圏指標を計算し、QGISによる商圏の可視化を実施した。このアプローチにより、商圏内の人口分布や競合環境、インフラ環境を正確に把握することが可能になった。

結果

商圏分析の結果

筑波大学付近の例

図例:

red cross 既存のコンビニ
green circle 有望度の高い商圏(CNN)
purple circle 有望度の高い商圏(LightGBM)
blue circle 候補地(XGBoost+AHP/TOPSIS)
yellow star 有望度の高い商圏内の候補地
商圏内の数字は、その商圏内に存在し得るコンビニ数の最大値を示す

まとめ

  • 可能な店舗数に基づいて機械学習モデルの助けを借りてエリアをランク付けしました。このランキングは、新しいコンビニ店舗のためのエリアのポテンシャルを理解するのに役立ちます。最終的に、最も魅力的な予測地点を強調しました。​
  • さらに、魅力的でないエリアでも、そこにもう少し店舗がある可能性が見つかりました。​
  • したがって、この研究は茨城で新しいコンビニ店舗の立地を案内するだけでなく、他のビジネスが新しい店舗を設置するための魅力的なエリアを特定するのにも役立ちます。

リファレンス

  1. Roig-Tierno, N., Baviera-Puig, A., Buitrago-Vera, J., & Mas-Verdu, F. (2013). The retail site location decision process using GIS and the analytical hierarchy process. Applied Geography, 40, 191-198.​
  2. https://www.nli-research.co.jp/files/topics/36497_ext_18_0.pdf
  3. S. A. Shaikh, M. A. Memon, M. Prokop and K. -s. Kim, “An AHP/TOPSIS-Based Approach for an Optimal Site Selection of a Commercial Opening Utilizing GeoSpatial Data,” 2020 IEEE International Conference on Big Data and Smart Computing (BigComp), Busan, Korea (South), 2020, pp. 295-302​

後記

所属や研究室での活動を超えた学びを通して得られた成果は,履修前の予想を遥かに越え,研究活動にも良い影響を与えながら進めることができました.パートナー企業との対話を通じて,現場のニーズを理解し,それに応じた実現可能な解決策を提案する貴重な経験を積むことができました.また、データサイエンティストからさまざまな助言や具体的な方法を教えていただいたおかげで,自分自身の考えに固執せず,現状に即した実践的な視点を持つことの重要性を学びました.
これらの知識や経験を活かし,今後の研究活動に精一杯取り組んでまいります.

株式会社NTTデータから分析に有効な貴重なデータを提供いただき,誠にありがとうございました.