web-dev-qa-db-ja.com

Google Colab ipynbをGithubにプッシュしますか?

私はChromebook(標準設定)を使用していますが、コーディング業界全体では比較的新しいです。現在、Googleドライブと連携したGoogle Colaboratoryに慣れ親しんで、どこでもデータ分析を行っています。

私の問題は次のとおりです。Colabで!gitを介してGithubに自動的にアクセスできるため、新しいリポジトリを作成し、それを複製しました。ただし、.ipynbに変更が表示されないか、自分がいるノートブックがファイルとして表示されないため、!git statusを追加できません。 GoogleドライブからGithubに.ipynbをプッシュするにはどうすればよいですか?

基本的には、どこでもColabをプルアップし、データを操作し、.ipynbに変更を保存し、Githubにプッシュし、他の場所に移動してデータを操作し続けたいと思います。

手動コピーはおそらく機能しますが、よりエレガントな解決策はありますか?

TIA!

10
jaymullr

おそらくこれで解決策を思い付くでしょうが、Colabには「コピーをGithubに保存」機能があり、 このブログ投稿: から引用されているようです。

また、[ファイル]> [コピーをGithubに保存]を使用して、ColabノートブックのコピーをGithubに簡単に保存できます。

4
Dan Reia

@jaymullr、どうにか道を見つけた?

Clouderizerを使用してgithubからGoogle Colabにノートブックを簡単にセットアップする方法のチュートリアルは次のとおりです: Medium tutorial 。さて、多分あなたが欲しかったのはその逆です、Google ColabからGithubへ。ワクワクするのは、クラウダライザーを使用すると、両方を実行できることです。 jupyterノートブック、github、およびColabを同期します。私の手順は非常に長いように思えるかもしれませんが、実際には非常に簡単で、一度にすべてをセットアップできます。方法の全体像を知りたい場合は、次のようにします(にスキップしてGitHubに同期します)。

Clouderizer for Google Colab Project

前提条件

  1. Google/gmailアカウントにサインアップ
  2. サインアップ Clouderizerアカウント [リンク]
  3. Githubにリポジトリを作成し、プロジェクト(すべてのipynb、pyモジュール、さらにはデータセット(1 GB未満の場合はそれを圧縮))をリポジトリにアップロードします。

Clouderizerプロジェクトのセットアップ

  1. Clouderizerコンソールにログインします。最初のログイン時に、GoogleドライブをClouderizerにリンクするように求められます。画面の指示に従ってください。リンクが表示されない場合は、Clouderizerダッシュボード->サイドバーメニュー-> Clouderizerドライブに移動して、Googleドライブを設定できます。 Clouderizerは、Googleドライブに「clouderizer」と呼ばれるフォルダーをセットアップして、ipynbプロジェクト(機械学習など)を含めます。
  2. Clouderizerダッシュボードに戻ります。次に、[新しいプロジェクト]をクリックします。指示に従って、Google Colabにアップロードする予定のipynb作業を含むgithubプロジェクト全体をロードすることを選択できます。
  3. ステップ5では、データセットのURLを指定することにより(たとえば、kaggleデータセットのURLから)、作業する追加のデータセットを含めることができます。データセット、メインコード/モジュール、および出力ファイル用に個別のフォルダーを用意することで、プロジェクトをリファクタリングするかどうかを選択して指定することもできます。
  4. 次に、Google Colabに移動し、Googleドライブの任意の場所にGoogle Colabファイルを作成して、次のコマンドを実行します。!wget NS -content disposition ' https:// to_whatever_link_you_get_to_console '
  5. 最後に、Clouderizerダッシュボードに戻り、プロジェクト環境がすでに実行されており、Google Colabに同期されているかどうかを確認します。次に、そのダッシュボードで、指定したプロジェクトのタイトル名のすぐ横にあるノートブックアイコンをクリックします。これで、ローカルマシンで実行している場合と同じように、機械学習などの作業を開始して、Google Colabですぐに同期できます。
  6. 最後に、.ipynbが機能するかどうかを確認し、モジュール/データセットをGoogle Colabにインポートすることもできます。 Google Drive-> clouderizer folder-> your projectに戻ってください。次に、実行してみて、jupyter Notebookのようにすべてが機能するかどうかを確認します。

Githubに同期します

  1. ここで特別なことはありません。 Clouderizer jupyterノートブックに戻り、ルート/トップレベルディレクトリでターミナルを開き、$git Push Origin master。それでおしまい!

私のやり方が面白いと思ったら、賛成投票してください。ただし、この方法は最初は面倒すぎるかもしれません。どう考えているか教えてください! Clouderizerは無料です。

0
Daniel Kurniadi