KNIME 3.2 の新機能を試す (1) - Workflow Coach
Workflow Coach はワークフロー作成時に次に配置する候補となるノードを表示してくれます。どのような機能なのか実際に試してみます。
ノードを全く配置していないとどうなる?
ワークフローにノードを全く配置していない状態でのノードの候補を見てみます。Communityの欄に表示されている数字は、KNIMEコミュニティの利用統計からはじき出された値のようです。
データ入力系のノードが表示されています。データ処理はファイルの読み込みからということで、File Reader で iris.csv データを読み込みます。
File Reader ノードの次はどうなる?
File Readerノードを選択した状態でノードの候補を見てみます。
データの分割、結合、フィルタリングなどデータ操作系のノードが表示されています。k-Meansでクラスタリングする人も多いようです。次に Partitioning ノードを使ってデータを2分割してみます。
Partitioning ノードの次はどうなる?
Partitioningノードを選択した状態でノードの候補を見てみます。
Decision Tree や Naive Bayes といったデータマイニング系のノードが表示されています。データを分割しただけなのですが… 次に Decision Tree Learnerノードを使ってモデルを作成してみます。
Decision Tree Learnerノードの次はどうなる?
Decision Tree Learnerノードを選択した状態でノードの候補を見てみます。
Decision Tree Predictor が圧倒的です。モデルを作ったなら使えということでしょう。先ほど Partitioning ノードで分割したデータに対して Decision Tree Predictor で予測してみます。
Decision Tree Predictorノードの次はどうなる?
Decision Tree Predictorノードを選択した状態でノードの候補を見てみます。
Scorer や ROC Curve など予測モデル評価系のノードが表示されています。作ったモデルを評価せよということで、Scorer ノードを使ってモデルを評価してみます。
Scorerノードの次はどうなる?
Scorer ノードを選択した状態でノードの候補を見てみます。
ROC Curve ノードが第1候補となっていますが、今回のワークフローではScorerノードのデータを ROC Curveノードで処理できませんでした。(これ以上続かなくてよかった…)
まとめ
KNIME 3.2 の新機能 Workflow Coach の第1候補のノードを繋げていくと、Decision Treeのモデル作成と評価のワークフローに導かれるようです。
使っているうちに自分の知らないノードを発見できたり、意外なノードが候補に出てきたりして結構面白いですし、ノードを探す作業効率も上がりそうです。
KNIME Analytics Platform 3.2 について
#KNIME #Analytics Platform 3.2 has been released!
— KNIME (@knime) 2016年7月8日
Learn what is new from https://t.co/1c7zQZdB3k #datascience #opensource #ETL #data
個人的にお気に入りのソフトウェア「KNIME」の最新バージョン 3.2 がリリースされたようなので、新機能をチェックしてみることにしました。
UI and Workbench
KNIME File Extension
KNIME専用の拡張子が登場しました。ワークフローは*.knwf、ワークフローグループは*.knarとなります。これらの拡張子をもつファイルをダブルクリックすると、KNIME Analytics Platform が起動します。また、KNIME Explorerにドラッグ&ドロップするとワークフローがインポートできます。
Missing Node installation
開いたワークフローに自分が保有していないノードが含まれていた場合、すぐにダウンロードサイトからノードを取得できるようになりました。
続きを読む