Reveal の統計関数
Reveal の統計関数を使用すると、表示形式からより多くの気付きを得ることができます。3 種類の高度な予測分析を提供します。時系列予測、線形回帰、および外れ値の検出を使用して、データ シリーズで予測を行い、傾向を認識して評価し、外れ値を検出できます。
統計関数へのアクセス
3 つの統計関数の 1 つを表示形式に適用するには、以下を行う必要があります。
-
ダッシュボードのビュー モードでダッシュボードを開きます。
-
表示形式を最大化します (右上隅の矢印アイコンをクリックします)。
-
画面の右上に表示されるアイコンをクリックまたはタップします (以下を参照)。
関数の有効/無効: 表示形式に 3 つの関数のうち有効にできるのは 1 つのみです。有効な関数を再度クリックして無効にするか、あるいはリストから別の関数を選択して切り替えます。
統計関数タイプ
以下の表は、すべての関数の用途、関数が使用するアルゴリズム、および関数を有効にできる表示形式について説明します。
関数 | アルゴリズム | 使用方法 | それをサポートする表示形式 it? |
---|---|---|---|
時系列予測 | 指数平滑法 | 特定のデータ系列について、データの予測を行うこと。ーザーは将来の時間範囲を選択できます。 | カテゴリ チャート: エリア、棒、柱状、折れ線、スプライン、スプライン エリア、ステップ エリア、ステップ折れ線 |
線形回帰 | 線形回帰 | 2 つの変数間の線形関係を見つけることによって傾向を評価すること。アルゴリズムは、チャートのほとんどのポイントに近い線を計算して、進行中の傾向を示します。 | カテゴリ チャート: エリア、棒、柱状、折れ線、スプライン、スプライン エリア、ステップ エリア、ステップ折れ線 |
外れ値の検出 | 四分位範囲ルール | ランダム要因のために他のデータから際立っているデータを検出するため。 | カテゴリ チャート: エリア、柱状、折れ線、スプライン、スプライン エリア、ステップ エリア、ステップ折れ線; 散布図 |
時系列予測
時系列予測関数は、特定のデータ シリーズのデータを予測するために使用します。以下の例では、関数が次の 12 か月間の 2 つの製品の売上予測を提供するために使用されています。
上記の予測を実現するには、以下の手順を実行します。
-
[統計関数] メニューから [時系列予測] を選択します。
-
以下の設定ダイアログが開きます。
ここで、季節の長さと期間予測を構成する必要があります。
-
季節の長さ - 表示形式のために季節の日数、月数、年数を選択します。季節の長 さの時間単位は、[日付] フィールドが日、月、または年のいずれで測定されるかに基づいて決定されます。
時系列データでは、季節が変動が発生する特定の定期的な間隔です。Reveal の指数平滑法アルゴリズムは、進化トレンドを計算し、季節調整を使用してそれを等しくします。
たとえば、スキー用品の販売は 1 年以内に変動します - 11 月と 12 月にピークに達し、4月に大幅に減少する場合があります。この傾向は来年も繰り返されます。つまり、この例の季節の長さは 12 か月です。
-
予測期間 - データを予測する日、月、または年を選択します。期間の長さの時間単位は、[日付] フィールドが日、月、または年のいずれで測定されるかに基づいて決定されます。
-
時系列関数で使用可能な最小データ: 表示形式には 2 つの季節以上のデータが含まれている必要があります。含まれていない場合、時系列関数を使用でき ません。つまり、季節の期間が 12 か月の場合は少なくとも 24 か月、6 か月の場合は 12 か月以上のデータが必要です。
予測は線とその周りの網掛け領域で可視化されます。線は予測を表示し、網掛け領域は将来のデータセットが入ると予想される範囲を示します。
時系列関数を適用した後に表示形式の基になるデータを確認すると、予測値が黄色で強調表示されます (以下を参照)。
時系列関数は時系列のチャートでのみ使用できます。: 表示形式に日付フィールドが含まれていない場合、時系列関数を使用しようとするとエラーが表示されます。
線形回帰
線形回帰は、2 つの変数間の関係を線形方程式で示すための統計モデルです。回帰分析の結果、表示形式の上に折れ線グラフが作成され、進行中の傾向を評価します。線はデータセット内のほとんどのポイントに近づくように計算され、データの全体形状に適合します。
線形回帰関数では、選択した期間のデータの線形予測を含めることもできます。[統計関数] メニューから [線形回帰] 関数を選択すると、以下のダイアログが表示されます。
予測期間には、データを予測する日、月、または年を選択します。期間の長さの時間単位は、日付フィールドが日、月、または年のいずれで測定されるかに基づいて決定されます。
以下は、線形回帰関数を表示形式に適用します。この場合、観測された傾向に基づいた予測を示すために線が 6 か月間延長されます。
上記の表示形式で描画される線は、売上 (Y 軸に配置された変数) の変化が時間 (または X 軸に配置された他の変数) に起因する範囲を示します。売上データと時間データの間の線形関係が折れ線を決定します。これにより、売上が徐々に低下する傾向がより明確になります。
線形回帰を適用した後に表示形式の基本データを確認すると、時系列予測の最後のスクリーンショットに示すように、予測値が黄色で強調表示されます。
外れ値の検出
外れ値は、データの他の観測値から逸脱する極値です。外れ値の検出関数は、データ シリーズの残りのポイントの平均値から大幅に逸脱されたポイントを表示します。
上記の例では、検出されたデータ ポイントは分配の残りの部分から離れて位置し、特定の瞬間に売上の急上昇を示します。これは、売上の全体的なパターンとは大幅に異なります。
外れ値の検出関数を適用した後に表示形式の基になるデータを確認すると、外れ値として検出されたデータが黄色で強調表示されます。