たまにはちょっとソフトウェア

ワークフロー&スウィィート

KNIME Analytics Platform 3.3 について

 個人的にお気に入りのソフトウェア「KNIME」の最新バージョン 3.3 がリリースされたようなので、新機能をチェックしてみることにしました。

tech.knime.org

 

Curved connections in workflow editor

ノードをつなぐ線が曲線になりました。KNIME 3.2 以前のバージョンで作成したワークフローは直線で表示されますが、ツールバーの設定で曲線に変更できます。

 

Excel Integration Reworked

Excel 関連ノードのアップデートにより、何十万行も何千もの列からなる巨大な Excel ファイルが処理できるようになりました。

 

Upgrade to Eclipse 4.6

最新の Eclipse Neon 4.6 ベースになりました。

 

New Variable Manipulation Nodes

String Manipulation ノードと Math Formula ノードが変数ノードとして利用できるようになりました。

 

Improvements to the Text Mining Extensions

Apache Tika Integration

Tika ノードがリリースされました。様々なファイル形式(.pdf、.doc、.ppt、.txt、zip、gt など)の読み込みや解析が可能です。

Stanford NER (Named Entity Recognizer) Learner and Stanford NE Tagger nodes

固有表現(Named Entity)を扱うためのノードがリリースされました。ドキュメントと固有表現のセット用いてモデルを作成し、Stanford NE Tagger ノードでタグ付けします。作成したモデルは Scorer ノードで評価することもできます。

 

Improvements to DeepLearning4J Integration

ディープラーニング関連ノードをリファクタリングし、クラス分類・クラスタリング・回帰など用途ごとにノードをリリースしました。また、すべての Leaner ノードのユーザーインターフェースがより理解しやすく改良されています。

 

New Cloud Connectors

Amazon S3 や Azure Blob Store に接続するためのノードがリリースされました。

 

個人の感想

ドキュメント読み込み・解析周りの大幅アップデートが印象的なリリースとなりました。たまってきた電子データを扱うニーズが増えているのかもしれません。また、ディープラーニング関連ノードの開発も依然活発なようで、このまま勢いを維持していってほしいものです。