none
【マイニング】1件しか予測されない訳 RRS feed

  • 質問

  • はじめまして。

     

    Excel + SQL Serverのデータマイニング「予測」機能を、自社および顧客の実際の過去売上データ

    に使用すると、5件の結果が必要なところ、1件しか返ってこなかったり、2件飛んで3件返ってきたり。

    セルは5件分が黄色になったのですが、値が入っていない状態です。

     

    必要な件数の結果が返ってこない原因はどこにあるのでしょうか?

    ご教授いただければ幸いです。

     

    ■環境

    EXCEL2007にデータマイニングのアドインをインストールし、使用しております。

    書籍「ひと目でわかる Microsoft Office Excel 2007- データマイニングアドインを使用したビジネスデータ簡単分析術」

    の手順どおりサンプルデータで実施すると、予測を5件要求すると5件分結果が返ってきます。

     

    ■データ

    予測に使用する情報は企業の実データのため公開出来ません。すみません。

     

    ■5件の結果が返って来る時

    過去3年分の月毎の売上データ(36件)を使用して「予測」すると、残念ながら1件しか結果が返ってきません。

    しかし、月毎の売上データの数を10件くらいにして「予測」すると、5件の結果が返ってきます。

     

    ■その他

    A社、B社、C社とデータを1シート3列にした場合と、A社のみ1シートに1列の場合では結果は同じでした。

    上限値、下限値の設定を変更しても結果は同じでした。

    予測しようとしている元データが悪いのでしょうか?

     

     

     

     

    2008年1月7日 14:28

回答

  • Excel 2007- データマイニングアドインを使用したことがないので見当はずれカモしれませんが。

     

    過去3年分の月毎の売上データ(36件)を使用して「予測」すると、残念ながら1件しか結果が返ってきません。

    しかし、月毎の売上データの数を10件くらいにして「予測」すると、5件の結果が返ってきます。

    SQL Server Analysis Servicesのアソシエーションモデルを使用しているのであり、このような挙動が

    得られたのであれば、恐らくですがデータが増えたことによりルールが適用される例の確率が全体的に

    下がり、パラメータの閾値が満たされなくなったのだと推測されます。

     

    # 「予測」機能でググっても出てこなかったので・・・・

     

    >> Microsoft アソシエーション アルゴリズム

    > http://technet.microsoft.com/ja-jp/library/ms174916.aspx

    上記ページにあるMINIMUM_PROBABILITYの値がルールを破棄するか否かを判断するパラメータと

    なるので、これを調整する必要があるかと思われます。

     

    (追記)

    結果が得られる方向に動かすのであれば、値を下げれば出ると思われます。

     

    予測しようとしている元データが悪いのでしょうか?

    私的にはデータが悪い良い、というよりは、運悪く?データの関連性が薄いのではと思います。

    データマイニング全般に言えますがパラメータ調整は非常にシビアであるということと、

    パラメータを調整したことによって得られた結果が何を意味するか(単に結果が出る出ないの話ではない)を

    十分に考慮しないと、事実と異なった結果をユーザに示すことになると思われます。

     

    # 「SQL Server」というよりは、その下にある「SQL Server Business Intelligence」側のスレッド

    # であると思います。

    2008年1月8日 9:06

すべての返信

  • Excel 2007- データマイニングアドインを使用したことがないので見当はずれカモしれませんが。

     

    過去3年分の月毎の売上データ(36件)を使用して「予測」すると、残念ながら1件しか結果が返ってきません。

    しかし、月毎の売上データの数を10件くらいにして「予測」すると、5件の結果が返ってきます。

    SQL Server Analysis Servicesのアソシエーションモデルを使用しているのであり、このような挙動が

    得られたのであれば、恐らくですがデータが増えたことによりルールが適用される例の確率が全体的に

    下がり、パラメータの閾値が満たされなくなったのだと推測されます。

     

    # 「予測」機能でググっても出てこなかったので・・・・

     

    >> Microsoft アソシエーション アルゴリズム

    > http://technet.microsoft.com/ja-jp/library/ms174916.aspx

    上記ページにあるMINIMUM_PROBABILITYの値がルールを破棄するか否かを判断するパラメータと

    なるので、これを調整する必要があるかと思われます。

     

    (追記)

    結果が得られる方向に動かすのであれば、値を下げれば出ると思われます。

     

    予測しようとしている元データが悪いのでしょうか?

    私的にはデータが悪い良い、というよりは、運悪く?データの関連性が薄いのではと思います。

    データマイニング全般に言えますがパラメータ調整は非常にシビアであるということと、

    パラメータを調整したことによって得られた結果が何を意味するか(単に結果が出る出ないの話ではない)を

    十分に考慮しないと、事実と異なった結果をユーザに示すことになると思われます。

     

    # 「SQL Server」というよりは、その下にある「SQL Server Business Intelligence」側のスレッド

    # であると思います。

    2008年1月8日 9:06
  • 返信ありがとうございます。

    ※他のスレに比べて明らかに閲覧も回答数も少なく、少々淋しくなっておりました。

     

    さて、以下インラインにて失礼いたします。

    >> Microsoft アソシエーション アルゴリズム

    なるほど。

    「解析結果は出たが、信頼度が低いため出力しない」ということですね。

     

    >>事実と異なった結果をユーザに示すことになると思われます。

    確かに仰るとおりです。

    ユーザは簡易的にマイニングをし、参考情報としようと考えております。

    私もそのひとりです。

     

    >SQL Server Business Intelligence

    了解です。早速覗いてみます。

    2008年1月11日 3:34
  • 今更気がついたのですが、MINIMUM_PROBABILITYを変更しても変化がないカモしれません(汗

    以下、部分レスポンスです。

     

    ※他のスレに比べて明らかに閲覧も回答数も少なく、少々淋しくなっておりました。

    Analysis Servicesは特にその様カモしれません。まして、マイニングモデルについては

    OLAP以下の注目度な気がします。なので、Technetのバーチャルラボにリクエストをして

    おきました。

     

    本題で、MINIMUM_PROBABILITYを下げても結果に変化がない場合は一度設定を消してから、

    MINIMUM_SUPPORTの値を下げる方向で調節してみてください。

     

    >> Microsoft アソシエーション アルゴリズム

    > http://technet.microsoft.com/ja-jp/library/ms174916.aspx

     

    上記のドキュメントにあるように、1を境にパラメータの意味がまったく異なるので

    注意してください。

    2008年1月14日 7:06
  • こんにちは、フォーラム オペレータ大久保です。

     

    st.lain さん、アドバイスありがとうございます。

    214798 さん、その後状況はいかがでしょうか?

    データの内容が公開できないとのことですので、フォーラムでのやりとりだけでの問題解決は難しいかもしれませんが、もし何か結論が出ましたらご投稿いただけると、皆様の参考になるかと思いますので是非よろしくお願いします。

     

    なお、勝手とは思いましたが、アドバイスをくださった st.lain さんの回答に回答済みチェックをつけさせていただきました。

    チェックがついてもスレッドが終了したわけではありませんし、214798 さんはチェックを解除することもできますので、引き続きご利用お待ちしております。

     

    それでは。

    2008年2月5日 3:49