KNIME 3.2 の新機能を試す (1) - Workflow Coach
Workflow Coach はワークフロー作成時に次に配置する候補となるノードを表示してくれます。どのような機能なのか実際に試してみます。
ノードを全く配置していないとどうなる?
ワークフローにノードを全く配置していない状態でのノードの候補を見てみます。Communityの欄に表示されている数字は、KNIMEコミュニティの利用統計からはじき出された値のようです。
データ入力系のノードが表示されています。データ処理はファイルの読み込みからということで、File Reader で iris.csv データを読み込みます。
File Reader ノードの次はどうなる?
File Readerノードを選択した状態でノードの候補を見てみます。
データの分割、結合、フィルタリングなどデータ操作系のノードが表示されています。k-Meansでクラスタリングする人も多いようです。次に Partitioning ノードを使ってデータを2分割してみます。
Partitioning ノードの次はどうなる?
Partitioningノードを選択した状態でノードの候補を見てみます。
Decision Tree や Naive Bayes といったデータマイニング系のノードが表示されています。データを分割しただけなのですが… 次に Decision Tree Learnerノードを使ってモデルを作成してみます。
Decision Tree Learnerノードの次はどうなる?
Decision Tree Learnerノードを選択した状態でノードの候補を見てみます。
Decision Tree Predictor が圧倒的です。モデルを作ったなら使えということでしょう。先ほど Partitioning ノードで分割したデータに対して Decision Tree Predictor で予測してみます。
Decision Tree Predictorノードの次はどうなる?
Decision Tree Predictorノードを選択した状態でノードの候補を見てみます。
Scorer や ROC Curve など予測モデル評価系のノードが表示されています。作ったモデルを評価せよということで、Scorer ノードを使ってモデルを評価してみます。
Scorerノードの次はどうなる?
Scorer ノードを選択した状態でノードの候補を見てみます。
ROC Curve ノードが第1候補となっていますが、今回のワークフローではScorerノードのデータを ROC Curveノードで処理できませんでした。(これ以上続かなくてよかった…)
まとめ
KNIME 3.2 の新機能 Workflow Coach の第1候補のノードを繋げていくと、Decision Treeのモデル作成と評価のワークフローに導かれるようです。
使っているうちに自分の知らないノードを発見できたり、意外なノードが候補に出てきたりして結構面白いですし、ノードを探す作業効率も上がりそうです。