arffとpandasのDataFrameを双方向変換できるライブラリarff2pandasをPyPIで公開しました

機械学習ツールWekaを使っていると、しばしば.arffのファイルフォーマットとpandasのDataFrameを行き来したくなります。

そこで普段はarff2pandasというパッケージを作って使っていたのですがせっかくなのでPyPIに公開してpipでインストールできるようにしました。

インストール

pip install arff2pandas

つかいかた

# インポート
from arff2pandas import a2p
# 読み込み
with open('sample.arff') as f:
    df = a2p.load(f)
    print(df)

# 書き込み
import pandas as pd
df = pd.DataFrame({
    'power@NUMERIC':[0.5,0.2],
    'label@{good,bad}':['good','bad']
})
with open('sample.arff','w') as f:
    a2p.dump(df,f)

なるべくjsonファイル入出力のスタイルに近づけているつもりです。

pandasがCSVにできるのでarffとcsvの行き来も簡単

with open('sample.arff') as f:
    a2p.load(f).to_csv('sample.csv')

PyPIのURLはこちらです

https://pypi.python.org/pypi?:action=display&name=arff2pandas

ソースコードはGitHubで公開しています。

https://github.com/garicchi/arff2pandas

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください