備忘録。
signate CLIの準備
Signate CLIを使えば、Colab上でデータダウンロード、提出ができる。
参考: SIGNATE CLI でデータセットをダウンロードする - Qiita
# signate CLIのインストール pip install signate # APIトークンをダウンロード !signate token --email="ここに登録時のメールアドレス" --password="ここに登録時のパスワード" # 現在開催中のコンペリストを表示 !signate list # 上のリストのIDでコンペを指定して、データをダウンロード !signate download --competition-id=102 # タイタニックの問題のデータをDLしている
データの読み込み
import pandas as pd import numpy as np # 今回はtsvファイル = タブ区切りなのでread_tableで読み込む # csvならread_csv()を使う df = pd.read_table("./train.tsv", index_col = 0) X_test = pd.read_table("./test.tsv", index_col = 0) # 内容確認 print(df.info()) print(X_test.info())
分析
飛ばす。
以下、予測結果が、提出形式にあった形でy_pred
に入っているとする。
提出
# 提出形式をチェックする !cat "./sample_submit.tsv" # to_csvは区切り文字を変更できるので、タブ区切りにしてtsvファイルとして保存 y_pred.to_csv("./out.tsv", sep="\t", header=False) # 保存したファイルを確認 !cat ./out.tsv # ファイルを提出 提出先のコンペのIDを指定する !signate submit --competition-id=102 ./out.tsv