よくデータサイエンスや機械学習などの技術を使い予測モデルを構築するケースも増えています。その中でよく目にするのが点予測です。点予測とは、「点」(1つのある数値)を予測することです。例えば、来年のこの事業の売上は100億であるとか、来月の店舗日販は50万円であるとか、そういったものです。
正直言って、点予測は当たることはありません。構築した予測モデルが悪いというのではなく、そういうものなのです。問題は、点予測を真であるかのように物事を進めることです。今回は、「点予測は100発0中が当たり前、であれば区間予測」というお話しをします。
【目次】
1.点予測は100発0中が当たり前 (1)区間予測とは? (2)点予測は扱いやすい (3)何が問題なのか? 2.区間予測の仕方
1.点予測は100発0中が当たり前
点予測とは、「点」(1つのある数値)を予測することです。例えば、明日の売上が53万2,871円(予測)である、といった感じで予測します。よくできた予測モデルであれば、近しい値になることでしょう。例えば、その日の売上が53万2,615円(実績)だった、という感じです。
しかし、予測と実績がどんなに近しい値になろうとも、ぴったり当たらなければ、予測結果が当たったとは言いません。要するに、このような点予測は100発0中が当たり前なのです。
(1)区間予測とは?
予測には、点予測だけではありません。区間予測というものもあります。
区間予測とは、「点」(1つのある数値)の予測ではなく、幅のある予測をすることです。例えば、明日の売上が51万8,189円から54万1,178円(予測)である、といった感じで予測します。区間予測であれば、その日の売上が53万2,615円(実績)だった場合、予測結果が当たったと言えることでしょう。
(2)点予測は扱いやすい
正直、区間予測よりも点予測の方が分かりやすく説明しやすく、そして扱いやすいです。
明日の売上が53万2,871円(予測)である、といった感じで予測した場合、この売上の数値を前提に物事を計画し進めればいいからです。例えば、明日の売上が51万8,189円から54万1,178円(予測)である、といった感じの場合、この売上の区間を前提に物事を計画し進める必要があり、下限で物事を進めればいいのか、上限で物事を進めればいいのか、迷います。
(3)何が問題なのか?
点予測は何が問題なのでしょうか?
問題は、点予測を真であるかのように物事を進めることです。点予測の結果を真として、設備投資や広告宣伝などを考え痛い目に合うことがあります。例えば、広告宣伝に30億円かければ売上が100億円と予測したとしてます。100億円は点予測です。仮に区間予測したとき、90億円から110億円であれば点予測の結果を使っても問題ないかもしれません。
しかし、区間予測したら20億円から180億円だったらどうでしょうか。下手をすると、30億円の広告宣伝費で20億円の売上ということもあります。同じ点予測の値でも、区間予測したら幅が大きく異なることがあります。
区間予測の幅が小さいのであれば、点予測の値を真として物事を進めても問題ないかもしれませんが、区間予測の幅が広いとき気を付けた方がいいです。そのようなことを見極めるためにも、点予測だけでなく区間予測も見ておくといいでしょう。
2.区間予測の仕方
伝統的な統計学的な予測モデルの場合、ダイレクトに「予測区間」(信頼区間と予測区間は別ものです。混同されやすいので注意しましょう)というものを出力することができます。この「予測区間」を区間予測として利用するのが手っ取り早いです。多くの統計解析用のツールの場合、点予測と一緒に出力されます。
他には、感度解析することで区間予測する場合も多いです。昔からデータ分析を実施した人の多くは、普通に感度解析をしていましたが、最近は時間の都合なのか知らないだけなのか分かりませんが、感度解析する人の割合が微妙に減っている気がします。
感度解析とは、予測モデルの説明変数(...
特徴量)やパラメータなどを色々変化させ、その予測結果の下限と上限を使い区間予測とするやり方です。
例えば、店舗のある日の売上をするとき、降雨量という説明変数(特徴量)を「0 mm/h」(晴れ)、「1 mm/h」(小雨)、「1 mm/h」(小雨)、「5 mm/h」(雨)、「10 mm/h」(やや強い雨)などと変化させて、日販予測をします。
この場合、幾つかのシナリオを作っておく必要があります。ちょっと敷居が高いですが、MCMC(Markov chain Monte Carlo methods、マルコフ連鎖モンテカルロ法)などで代表される乱数を使ったベイズ推定し求める予測モデルの場合、予測分布を出力することができます。この予測分布をもとに区間予測をすることもできます。
(その1)
(その2)
(その3)
(その4)
(その5)
(その6)
(その7)
(その8)
(その9)
(その10)
(その11)
(その12)
(その13)
(その14)
(その15)
(その16)
(その17)
(その18)
(その19)
(その20)
(その21)
(その22)
(その23)
(その24)
(その25)
(その26)
(その27)
(その28)
(その29)
(その30)
(その31)
(その32)
(その33)
(その34)
(その35)
(その36)
(その37)
(その38)
(その39)
(その40)
(その41)
(その42)
(その43)
(その44)
(その45)
(その46)
(その47)
(その48)
(その49)
(その50)
(その51)
(その52)
(その53)
(その54)
(その55)
(その56)
(その57)
(その58)
(その59)
(その60)
(その61)
(その62)
(その63)
(その64)
(その65)
(その66)
(その67)
(その68)
(その69)
(その70)
(その71)
(その72)
(その73)
(その74)
(その75)
(その76)
(その77)
(その78)
(その79)
(その80)
(その80)
(その81)
(その82)
(その83)
(その84)
(その85)
(その86)
(その87)
(その88)
(その89)
(その90)
(その91)
(その92)
(その93)
(その94)
(その95)
(その96)
(その97)
(その98)
(その99)
(その100)
(その101)
(その102)
(その103)
(その104)
(その105)
(その106)
(その107)
(その108)
(その109)
(その110)
(その111)
(その112)
(その113)
(その114)
(その115)
(その116)
(その117)
(その118)
(その119)
(その120)
(その121)
(その122)
(その123)
(その124)
(その125)
(その126)
(その127)
(その128)
(その129)
(その130)
(その131)
(その132)
(その133)
(その134)
(その135)
(その136)
(その137)
(その138)
(その139)
(その140)
(その141)
(その142)
(その143)
(その144)
(その145)
(その146)
(その147)
(その148)
(その149)
(その150)
(その151)
(その152)
(その153)
(その154)
(その155)
(その156)
(その157)
(その158)
(その159)
(その160)
(その161)
(その162)
(その163)
(その164)
(その165)
(その166)
(その167)
(その168)
(その169)
(その170)
(その171)
(その172)
(その173)
(その174)
(その175)
(その176)
(その177)
(その178)
(その179)
(その180)
(その181)
(その182)
(その183)
(その184)
(その185)
(その186)
(その187)
(その188)
(その189)
(その190)
(その191)
(その192)
(その193)
(その194)
(その195)
(その196)
(その197)
(その198)
(その199)
(その200)
(その201)
(その202)
(その203)
(その204)
(その205)
(その206)
(その207)
(その208)
(その209)
(その210)
(その211)
(その212)
(その213)
(その214)
(その215)
(その216)
(その217)
(その218)
(その219)
(その220)
(その221)
(その222)
(その223)
(その224)
(その225)
(その226)
(その227)
(その228)
(その229)
(その230)
(その231)
(その232)
(その233)
(その234)
(その235)
(その236)
(その237)
(その238)
(その239)
(その240)
(その241)
(その242)
(その243)
(その244)
(その245)
(その246)
(その247)
(その248)
(その249)
(その250)
(その251)
(その252)
(その253)
(その254)
(その255)
(その256)
(その257)
(その258)
(その259)
(その260)
(その261)
(その262)
(その263)
(その264)
(その265)
(その266)
(その267)
(その268)
(その269)
(その270)
(その271)
(その272)
(その273)
(その274)
(その275)
(その276)
(その277)
(その278)
(その279)
(その280)
(その281)
(その282)
(その283)
(その284)
(その285)
(その286)
(その287)
(その288)
(その289)
(その290)
(その291)
(その292)
(その293)
(その294)
(その295)
(その296)
(その297)
(その298)
(その299)