チャート⇒FXブロードネット(勝率を上げるためのフィルタリングレポートプレゼント中)
【詳解】決定木分析とは?~長所・短所や活用シーンを徹底解説
決定木分析(Decision Tree)とは、ツリー構造(樹形図)によって想定しうる選択を全て行った場合の各結果を可視化することで、データを分析する機械学習の手法の一つです。決定木は結果の可視化以外にも、要因関係の可視化、データ分類のクラスタリングや予測・判別のモデリングなど、様々な分析目的で適用できる万能ともいえる分析手法であり、分類木と回帰木を総称して決定木といいます。名前の通り、分類木は対象を分類する問題を解き,回帰木は対象の数値を推定する問題を解きます。
決定木は通常、1つのノードから始まり、想定しうる結果へと分岐していきます。これらの結果はそれぞれ、他の可能性へと分岐する追加のノードへとつながります。結果として、木のような形が形成されます。アウトプットがツリー構造で可視化されるため、視覚的に目的変数と関係が強い要因を把握したり、その特徴が最も現れる条件ルールを把握することができます。複数の説明変数による条件でデータを分割していくことでそのデータ内における目的変数の特徴の濃度を高めていきます。そうして得られた説明変数の条件で構成されるデータの分岐ルールを生成する手法が決定木です。
決定木分析の活用シーン
- 自社商品・サービスの購入見込みが最も高い人は、どのような人であるかを知りたい
- 満足度やロイヤリティの高い生活者には、どのような属性があるのかを知りたい
- 商品が持つ要素のうち、生活者の満足度やロイヤリティに最も影響しているものを知りたい
- テニスの未経験者層において、今後テニスを行う見込みが高い層にはどのような特徴があるのかを知りたい
決定木分析のメリット
- “目的変数”に最も影響すると考えられる“説明変数”を、何度もクロス集計を繰り返すことなく解析可能
経験則といった主観的な仮説に基づいて、ある程度の見当を付けたうえでクロス集計を作るような場面に出くわすことは多いと思われますが、このような場合に決定木分析を用いると、網羅的に疑似クロス集計を行うことができ、得られた樹形図によってあらゆるシチュエーション (条件分岐) での結果を知ることができるので、経験則に基づくクロス集計よりもはるかに、結果に対してより詳しい考察をすることができます。つまり、分析者の仮説に基づいて分析の切り口を探した場合は人間ならではの経験や感覚のバイアスがかかったものとなりがちですが、決定木では最も注目したい領域の有力な切り口を、客観的にかつ複数階層で探すことができます。これにより、どのような顧客をターゲット (ペルソナ) にすべきか、どのような施策が効果を発揮するのかという戦略を講じることができます。このことは、ビジネスシーンにおいてはとても有用なことが多いと考えられます。
- 結果が可視化されていて、理解しやすい
決定木は分析過程や抽出ルールがツリー構造に可視化されて見やすくホワイトボックスなモデルであるため、その結果を理解・解釈しやすいこともメリットの一つです。例えば社内で分析に対して門外漢である人に、分析の結果や効果を説明するという場面においても、他の分析手法と比べて説明がしやすく、第三者からの理解も得られやすい分析手法であると考えられます。
- 説明変数・目的変数共にカテゴリー (質的) その理由とデイトレ手法を徹底解説 データと数値 (量的) データ双方について使用できる
もちろん、扱うことが可能な質的データには、名義尺度も順序尺度も含まれますし、量的データには間隔尺度と比例尺度も含まれます。
- 外れ値に対してロバストな (外れ値の影響を受けにくい) モデルを構築可能
決定木では、データを分割することによって特徴を顕在化させるため、データの中に外れ値となるような異常に高い値や異常に低い値があったとしても、単にそうした外れ値を含むデータブロックとして分割されたり、外れ値のある領域だけが除外されるように分割されたりするので、外れ値の影響が少ない手法といえます。 - 具体的なデータの有無にかかわらず利用でき、データの準備が最小限で済む・必要な前処理が少ない
決定木分析では、「データを分割する指標」として特徴量を使うので、データの前処理(スケーリングや定性データの数値化等の加工)に伴う負担がかなり軽減されます。 - ターゲットに対して量的説明変数の効果的な階級に自動で区分される
決定木ではこうした量的変数について、ターゲット(目的変数)に対して最も効果的な切り方の閾値を自動で計算することができ、その閾値も各条件によって最適なものを見つけてくれます。これは業務にデータ分析を活用する上でかなり強力な機能といえます。例えば機械の稼働ログデータから機械の故障予測や保守点検などに決定木を活用することを考えた場合、機械のどのセンサーの値がどれくらいの値を超えると故障率が上昇するか、つまりアラートを出すべきセンサの閾値はいくつかといったルールを見つけることができます。
決定木分析のデメリット
- 分類性能は低い
シンプルで分かりやすいモデルが得られる反面、SVM (サポートベクターマシン) やニューラルネットワークといった機械学習モデルと比較すると、やはり分類精度は劣ってしまいます。
- 過学習を起こしやすい
決定木分析はどうしても、モデル作成時に利用したデータに対して「過剰適合」してしまい、「汎化性能」も低くなりがちです。決定木分析において「汎化性能」を得るためには「剪定」をすることで木の深さを制限する必要があります。 「過剰適合」してしまい、木の深さがあまりにも深くなってしまった場合、結果の理解・解釈が難しくなってしまいます。その結果、決定木分析の最大のメリットと言っても過言ではない「可視化の容易性」という強みが失われてしまいます。
剪定をする際は、「木の深さ」、「終端ノード数」、「各ノードに含まれるデータ点数」、「誤り率」等の要素を考慮することが一般的です。 「木の深さ」、「終端ノード数」は大きくなりすぎないように、「各ノードに含まれるデータ点数」、「誤り率」は小さくなりすぎないようにすることが目的です。
- 線形性のあるデータにはあまり適していない
データに含まれる説明変数に線形関係が多く見られる場合は、素直に重回帰のような線形モデルを使う方がいいでしょう。
- ノード間の接続が AND に限定される、XORなど多変数を考慮した分類はできない
- 不確実性やリンクされた結果が多い場合の計算が複雑となる可能性がある
アンサンブル学習
アンサンブル学習は、弱学習器を多く使うことで精度を上げる手法のことをいいます。弱学習器自体は、決して精度が高くありません。しかしながら、それを多数集めると自然と精度が上がっていきます。つまり多数派の答えを採用すれば、正解を導き出せる可能性を高めることができます。
しかし結果が「〇」か「×」の二択のような選択肢ではない場合は、そのような学習方法は困難です。例えば、「1」や「7」といった数値が入力される場合は別の方法を考える必要があります。その場合は、平均値を最終予測値として採用します。
アンサンブル学習の種類
アンサンブル学習と一言にいっても、その手法にはいくつもの計算方法(アルゴリズム)が存在します。中でも代表的なのがバギングとブースティングです。これらは決定木の予測精度を向上させる特にメジャーな方法として、よく採用されています。
決定木分析におけるバギングは、ランダムフォレストとも呼ばれることがあります。すべてのデータで1つの決定木を生成するのではなく、データや説明変数の一部を抜き出して決定木を生成し、これを学習に使用するデータや説明変数を何度も入れ替えて多数の決定木を生成し、最後に得られたすべての決定木の結果を統合することで、1回の学習に依存しないで全体の予測精度を向上させるというものです。
バギングのアルゴリズムは以下のようになっています。
- 学習データの中から決められた回数分のデータを抽出し、このサンプルデータからそれぞれ「データセット」を作る
- データセットから弱学習器を作る
- 1~2を決められた回数分繰り返す
- 作成した弱学習器から結果を構築する
ブースティング
ブースティングはすべてのデータあるいは一部のデータでまず決定木を生成し、その予測結果で間違って予測されたデータの重みを重くして決定木を更新することで、その間違ったデータをうまく予測できるようにしていきます。この調整を繰り返して複数の決定木を生成し、最後にやはりそれらの結果を組み合わせることで予測精度を向上させるというものです。バギングは抽出したデータによって精度が下がってしまいますが、ブースティングは前のデータを再利用するので必然的に精度が上がります。しかしその反面、過学習が起きやすいことが弱点として挙げられます。
ブースティングのアルゴリズムは以下のようになっています。
- データの一部を決められた回数分抽出して弱学習器を作成する
- 学習器の誤った一つの結果と、正解のサンプルを比べる
- 誤り率と重要度を弱学習器ごとに計算する
- 計算毎に全体の重みを調節する (誤っているデータの重みを大きくする)
つまり、データの中の要因関係を理解することよりも予測精度の高さを追及する場合はバギングやブースティングを適用することはとても有効ですし、ある特定の効果を発揮する要因や条件を可視化してそのデータに潜む特徴や要因関係を理解したい場合は、予測精度は劣るかもしれませんがシンプルに一つの決定木をアウトプットするのが良いかと思います。
MACD(EMA)をチャートに表示したデイトレ手法
・短期線と長期線の細かいクロスがあったときにどう対処すべきか?
・短期戦と長期線が近づいたときにどう対処すべきか?
・0ラインのクロスは信じるべきか?
・マイナス圏とプラス圏をどう判断すべきか?
・強いトレンドの最中の戻りに反応してクロスしてしまい逆サインを出してしまう
・クロスのタイミングが実際のチャートのトレンドよりも遅くなってしまう
・0ラインがあまり機能しない(マイナス圏にあるからといって下げるとは限らない)
・移動平均線とのサインが一致しない
など、欠点はあるわけです。
これらの欠点によって、無駄な損切りが多く存在していました。
それでも、他のテクニカルより信頼できるテクニカルだったので必ず使ってた 。
がしかし、これらの欠点をどうにかできないかと考えてて、
その結果、 チャート上にMACDと同じラインを表示 させれば、
チャート上の値動き・トレンドライン・サポートライン・レジスタンスラインと
併用させることによって、よりシンプルに、そして、よりわかりやすくなるのではないか?
と考えたわけです。
そこで、MACDの基本を調べました。MACDには、EMAを使っているとの事。
EMAとは、指数平滑移動平均線といって、移動平均線とは計算式が違います。
一般的な移動平均線は、単純移動平均線と呼ばれてて、SMAと呼ばれてます。
ちなみに、EMAについて調べていたとき、書店である書籍に出会いました。
FX先生という書籍で、あの杉田勝さんの書籍でした。
この書籍によれば、EMAはSMAよりも早く動くという特徴があるとのこと。
これで尚更、EMAを使いたくなってきました。
結局、乱暴に解説すればMACDは EMA を使って平均値を出しているだけなので、
EMAをチャート上に出せば、私がやりたいことは解決するということがわかりました。
早速、 EMAを使えるチャート を探して、検証の日々です。
ここ最近、検証していると言ってたのは、この EMA についてでした。
EMAをチャート上に表示させると、
移動平均線よりも早くサインを出してくれてトレンドがつかみやすくなり、
MACDのような迷いが生じなくなり、だましに翻弄されることが少なくなりました。
つまり、 移動平均線(SMA)とMACDを融合させたようなシグナルになった わけです。
さて、ナニを表示させるかといいますと、 12EMAと20EMA です。
MACDの場合、クロスしていてもクロスした位置よりも値が高く・安くなって、
そのあとにクロスしているサインどおりに動いたりしますが、
EMAのクロスの場合は、こういったことが少ないです。
ちなみに、杉田さんのEMAの解説によると
20EMAの上か下でローソク足が推移してるかを見て、 その理由とデイトレ手法を徹底解説
買いで入るか・売りで入るかを判断するのですが、
それを視覚的にわかりやすくするために、12EMAを使ってます。
つまり、12EMAが20EMAをクロスしたときは、ほとんどの場合 その理由とデイトレ手法を徹底解説
20EMAよりも上・下にローソクが移動している状態なので、
杉田さんの20EMAの使い方としても、わかりやすくなります。
チャートに色々書き込んでみました↓
チャート⇒FXブロードネット(勝率を上げるためのフィルタリングレポートプレゼント中)
MACDは信頼できるテクニカルでしたが、
EMAをチャート上に表示することで、MACDよりもわかりやすくなり、
トレードに自信がもてるようになってます。
そういったときのために、 トレンドラインやサポートレジスタンスラインの確認、
他のテクニカルとの併用をオススメします 。
現状で、私が確認してる限りで、 EMA を搭載していて、
尚且つ、使いやすく、数本表示できたり、EMAの自由度が高いと感じてるのが
FXブロードネットです。
又、チャート画面は色々なカスタマイズが可能なので、かなり使えます。
FXブロードネットは一画面にチャートをたくさん表示することもできますし、
注文画面なども一緒にできたり、かなり自由度が高く、自分が使いやすい環境を
設定することができます。
スプレッドは、 「USD/JPY 0.5銭~」「EUR/USD 0.5pip~」「EUR/JPY 0.9銭~」
1000通貨単位の取引も可能!
5000円のキャッシュバックキャンペーンも実施中!
トレンドがわかりやすい 平均足(コマ足) も搭載!
【追伸】
利食いのポイントがまだはっきりとしておりません。
そのあたりは現在色々と検証しておりますので、これから公開していきます。
TradingViewのカスタムインジケータを利用したデイトレード手法をXMで試してみる
タートルズという投資集団について、名前だけは聞いたことがあるかもしれません。トレードで莫大な資産を築いた伝説の投資集団なのですが、彼らが利用していたロジックは驚くほどシンプルでした。それはこの記事で紹介している「過去〇〇の高値/安値を更新したらエントリーするというロジック」です。もちろん、タートルズは日足でトレードし、保有期間も1ヶ月~3ヶ月と長期期間でした。(実際、多くの人にとってFXで長期間保有しようとするのは難しいと思います。)
伝説の投資集団も利用していたシンプルなブレイクアウト手法ですが、極めると予想も付かないような結果が待っているのかもしれません。どのインジケータも TradingViewの公開ライブラリーで検索し、クリックするだけでチャートに表示できます。
ブレイクアウトだけでトレードしない【トレードルール】
デイトレードでエントリーする前に必ず決めておくべきトレードルールが「利益確定ラインとストップロス価格」です。
利益確定はPivotを利用する
上昇シグナルの場合、エグジット(利益確定目標)価格は、R1とR2です。デイトレードなので、ニューヨーク市場が終わるまでにはポジションを全て決済する方針にします。そのため、 着実に利益を積み重ねたい人はR1(下落の場合はS1)、積極的に利益を狙う場合はR2(下落の場合はS2)を利益目標 にすると良いでしょう。
ストップロスはドンチャンチャネルの中央線を利用する
トレードルールまとめ
公開ライブラリーには8,000種類以上のカスタムインジケータが用意されていますが、今回のチャネルブレイクアウト・ストラテジーのように シグナル配信をするカスタムインジケータ もあります。また、MACDやボリンジャーバンドなどの売買シグナルを配信するカスタムインジケータもありました。トレンドフォロー系の売買シグナルが多いように感じます。いろいろ試してみて、お気に入りの売買シグナルを見つけてみてください。
TradingViewとXMのハイレバレッジを活用する
ブレイクアウト手法は、勝率が低いと言われますが、 ブレイクアウトする確率が高いエントリー場面に絞ってエントリーすると、勝率を高めることができます。
スケールダウンピラミッディングとは?FXトレード手法のメリット・デメリットを知って、稼ぐ方法を増やそう!
スケールダウンピラミッディングとは、買い増し(売り増し)をして建玉操作のひとつで、 建玉の量を減らしながら買い増しや売り増しして全体のポジション量を増やしていく建玉操作 のことです。
スケールダウンピラミッディングを日本語で言い換えると「半規模積み増し型ピラミッディング」などと呼ばれることもあります。前の建玉数のおよそ半分を目安に積み増ししていくことが一般的な見解だと認識しています。
いくつか種類があるピラミッディングの中でもポピュラーなピラミッディングです。
下のイラストをご覧ください。
イラストを例にしてスケールダウンピラミッディングをお伝えしていきます。
【株FX】上がる株を厳選する条件【プロが徹底解説】
投資
【株FX】上がる株を厳選する条件
「どうして上がる株を教えてくれるの? こっそり自分だけ買えばもっと勝てるのに」っていうDMが来たので、記事にしたよ♪
※もう株価が上がっちゃった後でも役に立つ考え方(似た相場が来た時の思考法)その理由とデイトレ手法を徹底解説 も紹介しているから、2030年以降になっても読んでみてね♪
株を買いたいけど、戦略上、余剰資金を残しておきたい、そんな時に
「自分が買いたかった銘柄を皆に紹介する」という方針で行っているよ♪
今回教えるのは
①『上がる可能性が極めて高い銘柄』の見つけ方
②株価が上がった時の利確テクニック
③株価が下がった時の対処法
など、私(妹の中の人)の投資テクニックだよ♪
この記事の特に②③章は、元々「銘柄紹介記事」のオマケとして書いていた記事だよ♪
「過去の相場予想記事」を読んでもらえば分かる通り、2020年12月現在は「ほぼ全ての銘柄で予想が的中」しているよ♪
でも記事にしていない銘柄も含めると、実際の的中率は90%ぐらいなのでいつか記事にした銘柄が外れてしまうかもしれないね♪
そんな時に「課金してまでブログを支援してくれる熱心な妹ファンのお兄ちゃんだけは助けたい!」と思って、私の投資法の本質をそのまま書いた解説だったんだ♪
「銘柄紹介記事」では必ずつけているオマケ記事なので、紹介記事が出た時に読めば一緒についてくるけど、不定期更新なので「早く読みたい!」というお兄ちゃんはこのページから読んでみてね♪
「紹介記事からもう読んだよ!」というお兄ちゃんは、ダブリが生じないように「①上がる可能性が極めて高い銘柄』の見つけ方」を、さらにオマケでつけ加えているよ♪ この解説だけでとってもタメになる解説だから、ぜひ読んでみてね♪
コメント