テーマ概要

ビッグデータ・AIコンペティションの第1回目のテーマは
「陳列された商品の撮影画像から正解の商品を求める」です。

スーパーマーケットやドラッグストア等の小売店の陳列棚を撮影した画像から、商品画像を切り抜いた画像セットを提供しますので、これらの画像から正しい商品を類推する仕組みを構築していただきます。

背景

小売店の販売結果を分析するうえで、商品がどのように陳列されていることはマーケッターとしては重要な指標となりますが、雑多に並べられた商品画像から正しい商品を特定することの人的コストの問題で正しい分析ができていない実情があります。近年成長が著しいAI技術を活用して、迅速かつ正確に画像から商品を特定することができれば、分析業務のさらなる発展が期待できます。

提供データと回答形式

提供データ

提供データの配布タイミングは申し込み時および各課題発表時とします。
提供データは下記を予定しています。

  • 商品情報CSV(JANコード、商品名、サイズ等各種情報)
  • お手本画像サムネイル
  • フェイス画像

課題出題形式

課題は合計4回実施します。各回、1000点ほどの画像群を公開しますので、それぞれの画像に対する商品を推測して正解を求めてください。
エンジンによっては正解候補が複数抽出することもあり得ると思いますので、正解と思われる候補を1位~10位まで推測した結果をJSONファイルとしてアップロードしてください。
結果データのアップロードURLは後日ご提示します。

回答形式

  • 応募者には、フェイス画像ごとに、どの商品が該当するかを順位付けしたデータとして回答して頂きます。
  • 何位までを返すかは回答者の選択ですが、10位以上が有利です。
    ※ただし、20位までを上限とします。
  • 出題されるフェイス画像には、正解となる標本画像がない場合もあり得ます。該当なしと判断される場合は、「該当なし」の商品コード(9999999999999)を1位にして回答します。
    ※「該当なし」が1位の場合は2位以下に商品がある回答は認められません。同様に2位以下に「該当なし」がある回答も認められません。(配点が0点となります。)
  • 1つのフェイス画像に対する回答の配点は以下のとおりです:
    • 1位が正解の場合、2点。
    • n位に正解がある場合、1/n点。

結果データのフォーマットは以下の通りとします。

[{"image": "画像ファイル名1",
         "result": [{"rank":"1", "jan_cd":"0000000000000", "score": "0.8"},
                    {"rank":"2", "jan_cd:"1111111111111", "score": "0.6"}]
        }, 
        {"image": "画像ファイル名2",
         "result": [{"rank":"1", "jan_cd":"2222222222222", "score": "0.8"},
                    {"rank":"2", "jan_cd":"3333333333333", "score": "0.6"}]
        }] 

※ 回答データ形式が当初ご案内していたものから変更されていますのでご注意ください(2020.08.05)

採点方式

審査においては、以下の配点に従って総合的に採点します。

  • 判別精度(結果ファイルで採点)            7点
  • 判別の速度・CPU負荷(提案書記載内容にて評価)    2点
  • データ更新制・再学習コスト( 提案書記載内容にて評価 )1点

判別精度の採点は上述のルールで自動採点します。

  • 1位が正解の場合、2点。
  • n位に正解がある場合、1/n点。

想定されるハードル

商品画像から商品を特定する手法には、以下のような課題が考えられます。これら課題を克服して正解商品を特定する技術を競ってください。

ハードル1:撮影品質の問題

実店舗で撮影された画像は、店内の照明や撮影者の技術等に起因する問題から、画像が不鮮明な場合があります。明度・彩度が十分ではない、棚に対して商品が小さいため商品部分を抜き出した画像は不鮮明である、、、などといった低品質の画像からも正解商品を特定することが求められます。

ハードル2:陳列状態の問題

実際の陳列棚を撮影しているため、倒れている、横を向いている、パッケージが折れ曲がっている等の状態の商品が数多くあります。ECサイトに掲載されているような正面画像のみではないことから、さまざまな角度で撮影されている画像を正しく読み取ることが求められます。

ハードル3:類似商品の問題

同一ブランドのシャンプー・リンス、ビールの350ml缶と500ml缶など、ほぼ同じようなパッケージだが、大きさや色が異なる別商品が存在します。人の目で見比べたり、左右前後の陳列商品からの関係を比較することなく、商品画像だけでこれらの違いを特定することの困難さがあります。

ハードル4:流通商品の膨大さ

世の中に流通している商品は膨大です。画像の正解を膨大な商品の海を探して見つける必要があります


上記に挙げた技術課題はほんの一例となります。この他にも様々な技術課題がありますので、皆さんの技術力でこれら課題を克服することを期待しています。