この記事を読む

python pandasのDataFrameをいい感じにmultiprocessingで並列処理する

pandasのDataFrameに文字列データとかを入れてるとなんとなく並列処理したくなります。そんな時のTips とりあえずデータを作る

データを等分割して並列化する 各行…

この記事を読む

pandasで不均衡データをアンダーサンプリング、オーバーサンプリングする

何やらよさげな記事を見つけたんですが pandasを使った不均衡データの整形 – drilldripper’s blog imblearnというパッケージを使えばもっと簡単にアンダー(オーバー)サンプリング可能なのでgistにあ…

この記事を読む

pandasでよく使うけど忘れやすい処理のメモ

特定の列削除

行のイテレーション

列条件に一致する行の抽出 [crayon-5a1345407cbf0556…