たまにはちょっとソフトウェア

ワークフロー&スウィィート

KNIME 4.1 について

  

 

個人的にお気に入りのソフトウェア「KNIME Analytics Platform(以下 KNIME)」の最新バージョン 4.1.0 がリリースされました。早速新機能をチェックしてみましょう。

 

Navigation in the Workflow Canvas

ワークフローキャンバス上で Ctrl+F(Macの場合はCommand+F)を押して、ワークフロー内のノードを検索できるようになりました。ノード名、ノードID、コメントで検索できます。

f:id:tymsk3891:20191208015411p:plain

Ctrl+F を押すとワークフローのノード一覧が表示

f:id:tymsk3891:20191208015208p:plain

「抽出」をキーワードにして検索

 

Machine Learning

Binary Classification Inspector node

二項分類問題では、分類しきい値を調整して、分類タスクに合わせてモデルを最適化することが不可欠です。Binary Classification Inspectorノードは、機械学習アルゴリズムごとに最適なしきい値を適用することにより、二項分類子を比較するのを助けてくれます。

 

AWS Personalization Service

Amazon Personalize サービスと連携できるノード群がリリースされました。使用するには AWS 環境と資格情報が必要です。

aws.amazon.com

 

 

Components

 Component がワークフローと同様に KNIME Explorer 上でダブルクリックして編集できるようになりました。Component の説明に加え、カテゴリとアイコンも設定できるようになりました。 

f:id:tymsk3891:20191214143030p:plain

Component に色とアイコンを設定

 

Input Filtering and Validation

 Column Filter Configuration ノードと Column Selection Configuration ノードが拡張されました。選択対象とする列のタイプを選択したり、選択数の下限値を設定できるようになりました。

f:id:tymsk3891:20191214154432p:plain

KNIME 4.1 の設定画面

f:id:tymsk3891:20191214154519p:plain

KNIME 4.0 の設定画面

 

Nodes, Nodes, Nodes (新ノード)

MDF

 MDF(Measurement Data Format)はバイナリファイル形式で、測定およびキャリブレーションシステムの事実上の標準です。MDF Readerノードを使用すればMDF ファイルを読み込むことができます。

f:id:tymsk3891:20191214230503p:plain

.mf4 ファイルを読んだ状態

 Power BI

 Send to Power BI ノードを使えば、KNIMEで作成したデータをPower BIに簡単にアップロードできます。 ノードのダイアログでOAuthベースの認証を使用し、データをアップロードするワークスペース、データセット、およびテーブルを選択します。ノードを実行すると、すべてのデータがPower BIダッシュボードで利用可能になります。

 Row Filter (Labs)

Row Filter (Labs) ノードを使用すると、行インデックスや行IDなど、複数の列の条件で行をフィルターできます。 KNIME Labs Extensions として提供されているので、複数の条件に基づいてデータをフィルタリングする場合は、試してみると良いでしょう。

f:id:tymsk3891:20191214232247p:plain

複数条件を組み合わせてフィルター

 Webpage Retriever

 Webpage Retriever ノードは HTTP GET 要求を発行し、Webページを取得します。 XHTML 形式に変換できるので、XPath ノードを使用すれば取得した Web ページから必要な情報を抽出できます。 Web ページからCookieを抽出したり、リクエストにCookieを含めることもできます。

f:id:tymsk3891:20191215233858p:plain

得られた XHTMLXPath ノードで解析

 Top k Selector

 Top k Selector ノードを使えば、指定した並べ替え規則に従って上位 k 行を選択できます。Active Learning 拡張機能の Element Selector ノードをKNIME 標準ノードとして完全に書き直したものです。Sorter ノードと Row Filter ノードを1つにしたようなノードです。 

f:id:tymsk3891:20191215235859p:plain

上下とも同じ結果になる

 

KNIME Database Extension

 DB Connection Extractor ノードや DB Connection Closer ノードなどの実用的なノードが追加されましたが、大きな改良点はトランザクション管理ができるようになったことです。 DB Transaction Start ノードと DB Transaction End ノードでトランザクション限界を指定できるようになりました。

 

kni.me

 

 Technical Improvements

 Dynamic Ports

 一部のノード(Concatenateノードなど)でポート数が変更できるようになりました。 左下隅に3つの黒い点があるノードが対応しています。

f:id:tymsk3891:20191217001529p:plain

Concatenate のポートを増やした例

 New Flow Variable Types

KNIME Analytics Platform 4.1では、新しいタイプのフロー変数が導入されています。 これまでフロー変数は string、integer、および double が使用可能でしたが、新たにboolean、long、array タイプが使えるようになりました。

 

まとめ

 ユーザの使いやすさを向上させるアップデートとなりました。Component のアイコン部分に愛犬の写真など入れてみてはいかがでしょうか。