日記

日本語の勉強のためのブログ

GoogleColabでSignateを始めてみる

備忘録。

signate CLIの準備

Signate CLIを使えば、Colab上でデータダウンロード、提出ができる。
参考: SIGNATE CLI でデータセットをダウンロードする - Qiita

# signate CLIのインストール
pip install signate

# APIトークンをダウンロード
!signate token --email="ここに登録時のメールアドレス" --password="ここに登録時のパスワード"

# 現在開催中のコンペリストを表示
!signate list

# 上のリストのIDでコンペを指定して、データをダウンロード
!signate download --competition-id=102 # タイタニックの問題のデータをDLしている

データの読み込み

import pandas as pd
import numpy as np

# 今回はtsvファイル = タブ区切りなのでread_tableで読み込む
# csvならread_csv()を使う
df = pd.read_table("./train.tsv", index_col = 0)
X_test = pd.read_table("./test.tsv", index_col = 0)

# 内容確認
print(df.info())
print(X_test.info())

分析

飛ばす。
以下、予測結果が、提出形式にあった形でy_predに入っているとする。

提出

# 提出形式をチェックする
!cat "./sample_submit.tsv"

# to_csvは区切り文字を変更できるので、タブ区切りにしてtsvファイルとして保存
y_pred.to_csv("./out.tsv", sep="\t", header=False)

# 保存したファイルを確認
!cat ./out.tsv

# ファイルを提出 提出先のコンペのIDを指定する
!signate submit --competition-id=102 ./out.tsv