GoogleドライブフォルダーにCSVまたはXLSレポートを生成するサーバー上にレガシーデータベースシステム(Webアクセス不可)があります。現在、ドライブのウェブインターフェースでこれらのファイルを手動で開き、Googleスプレッドシートに変換しています。
他のシートのデータを追加/変換およびグラフ化するジョブを作成できるように、これはむしろ自動化されます。
ネイティブの.gsheetファイルを出力することは可能ですか?または、CSVまたはXLSをGoogle Appsで、またはWindowsベースのスクリプト/ユーティリティを使用してGoogleドライブに保存した後、プログラムで.gsheetに変換する方法はありますか?
Google Apps Scriptを使用して、ドライブのCSVファイルから既存のGoogleスプレッドシートにプログラムでデータをインポートし、必要に応じてデータを置換/追加できます。
以下にサンプルコードを示します。 a)ドライブにCSVファイルが保存/アップロードされる指定フォルダーがあることを前提としています。 b)CSVファイルの名前は「report.csv」で、その中のデータはカンマ区切りです。およびc)CSVデータが指定されたスプレッドシートにインポートされます。詳細については、コード内のコメントを参照してください。
function importData() {
var fSource = DriveApp.getFolderById(reports_folder_id); // reports_folder_id = id of folder where csv reports are saved
var fi = fSource.getFilesByName('report.csv'); // latest report file
var ss = SpreadsheetApp.openById(data_sheet_id); // data_sheet_id = id of spreadsheet that holds the data to be updated with new report data
if ( fi.hasNext() ) { // proceed if "report.csv" file exists in the reports folder
var file = fi.next();
var csv = file.getBlob().getDataAsString();
var csvData = CSVToArray(csv); // see below for CSVToArray function
var newsheet = ss.insertSheet('NEWDATA'); // create a 'NEWDATA' sheet to store imported data
// loop through csv data array and insert (append) as rows into 'NEWDATA' sheet
for ( var i=0, lenCsv=csvData.length; i<lenCsv; i++ ) {
newsheet.getRange(i+1, 1, 1, csvData[i].length).setValues(new Array(csvData[i]));
}
/*
** report data is now in 'NEWDATA' sheet in the spreadsheet - process it as needed,
** then delete 'NEWDATA' sheet using ss.deleteSheet(newsheet)
*/
// rename the report.csv file so it is not processed on next scheduled run
file.setName("report-"+(new Date().toString())+".csv");
}
};
// http://www.bennadel.com/blog/1504-Ask-Ben-Parsing-CSV-Strings-With-Javascript-Exec-Regular-Expression-Command.htm
// This will parse a delimited string into an array of
// arrays. The default delimiter is the comma, but this
// can be overriden in the second argument.
function CSVToArray( strData, strDelimiter ) {
// Check to see if the delimiter is defined. If not,
// then default to COMMA.
strDelimiter = (strDelimiter || ",");
// Create a regular expression to parse the CSV values.
var objPattern = new RegExp(
(
// Delimiters.
"(\\" + strDelimiter + "|\\r?\\n|\\r|^)" +
// Quoted fields.
"(?:\"([^\"]*(?:\"\"[^\"]*)*)\"|" +
// Standard fields.
"([^\"\\" + strDelimiter + "\\r\\n]*))"
),
"gi"
);
// Create an array to hold our data. Give the array
// a default empty first row.
var arrData = [[]];
// Create an array to hold our individual pattern
// matching groups.
var arrMatches = null;
// Keep looping over the regular expression matches
// until we can no longer find a match.
while (arrMatches = objPattern.exec( strData )){
// Get the delimiter that was found.
var strMatchedDelimiter = arrMatches[ 1 ];
// Check to see if the given delimiter has a length
// (is not the start of string) and if it matches
// field delimiter. If id does not, then we know
// that this delimiter is a row delimiter.
if (
strMatchedDelimiter.length &&
(strMatchedDelimiter != strDelimiter)
){
// Since we have reached a new row of data,
// add an empty row to our data array.
arrData.Push( [] );
}
// Now that we have our delimiter out of the way,
// let's check to see which kind of value we
// captured (quoted or unquoted).
if (arrMatches[ 2 ]){
// We found a quoted value. When we capture
// this value, unescape any double quotes.
var strMatchedValue = arrMatches[ 2 ].replace(
new RegExp( "\"\"", "g" ),
"\""
);
} else {
// We found a non-quoted value.
var strMatchedValue = arrMatches[ 3 ];
}
// Now that we have our value string, let's add
// it to the data array.
arrData[ arrData.length - 1 ].Push( strMatchedValue );
}
// Return the parsed data.
return( arrData );
};
その後、スクリプトプロジェクトで time-driven trigger を作成して、定期的に(たとえば、毎晩1AMに)importData()
関数を実行します。そのため、新しいレポートを作成するだけです。 csvファイルを指定されたドライブフォルダーに保存すると、次にスケジュールされた実行時に自動的に処理されます。
CSVではなくExcelファイルを使用する必要がある場合は、次のコードを使用できます。動作させるには、スクリプトとデベロッパーコンソールで高度なGoogleサービスでDrive APIを有効にする必要があります(詳細については 高度なサービスを有効にする方法 をご覧ください)。
/**
* Convert Excel file to Sheets
* @param {Blob} excelFile The Excel file blob data; Required
* @param {String} filename File name on uploading drive; Required
* @param {Array} arrParents Array of folder ids to put converted file in; Optional, will default to Drive root folder
* @return {Spreadsheet} Converted Google Spreadsheet instance
**/
function convertExcel2Sheets(excelFile, filename, arrParents) {
var parents = arrParents || []; // check if optional arrParents argument was provided, default to empty array if not
if ( !parents.isArray ) parents = []; // make sure parents is an array, reset to empty array if not
// Parameters for Drive API Simple Upload request (see https://developers.google.com/drive/web/manage-uploads#simple)
var uploadParams = {
method:'post',
contentType: 'application/vnd.ms-Excel', // works for both .xls and .xlsx files
contentLength: excelFile.getBytes().length,
headers: {'Authorization': 'Bearer ' + ScriptApp.getOAuthToken()},
payload: excelFile.getBytes()
};
// Upload file to Drive root folder and convert to Sheets
var uploadResponse = UrlFetchApp.fetch('https://www.googleapis.com/upload/drive/v2/files/?uploadType=media&convert=true', uploadParams);
// Parse upload&convert response data (need this to be able to get id of converted sheet)
var fileDataResponse = JSON.parse(uploadResponse.getContentText());
// Create payload (body) data for updating converted file's name and parent folder(s)
var payloadData = {
title: filename,
parents: []
};
if ( parents.length ) { // Add provided parent folder(s) id(s) to payloadData, if any
for ( var i=0; i<parents.length; i++ ) {
try {
var folder = DriveApp.getFolderById(parents[i]); // check that this folder id exists in drive and user can write to it
payloadData.parents.Push({id: parents[i]});
}
catch(e){} // fail silently if no such folder id exists in Drive
}
}
// Parameters for Drive API File Update request (see https://developers.google.com/drive/v2/reference/files/update)
var updateParams = {
method:'put',
headers: {'Authorization': 'Bearer ' + ScriptApp.getOAuthToken()},
contentType: 'application/json',
payload: JSON.stringify(payloadData)
};
// Update metadata (filename and parent folder(s)) of converted sheet
UrlFetchApp.fetch('https://www.googleapis.com/drive/v2/files/'+fileDataResponse.id, updateParams);
return SpreadsheetApp.openById(fileDataResponse.id);
}
/**
* Sample use of convertExcel2Sheets() for testing
**/
function testConvertExcel2Sheets() {
var xlsId = "0B9**************OFE"; // ID of Excel file to convert
var xlsFile = DriveApp.getFileById(xlsId); // File instance of Excel file
var xlsBlob = xlsFile.getBlob(); // Blob source of Excel file for conversion
var xlsFilename = xlsFile.getName(); // File name to give to converted file; defaults to same as source file
var destFolders = []; // array of IDs of Drive folders to put converted file in; empty array = root folder
var ss = convertExcel2Sheets(xlsBlob, xlsFilename, destFolders);
Logger.log(ss.getId());
}
Googleドライブを追加すると、csvファイルを自動的にGoogleスプレッドシートに変換できます
?convert=true
呼び出しているAPI URLの最後まで。
編集:利用可能なパラメーターのドキュメントは次のとおりです。 https://developers.google.com/drive/v2/reference/files/insert
また、上記のリンクを検索しているときに、この質問にはすでに回答されていることがわかりました。
(2017年3月)受け入れられた答えは最良の解決策ではありません。 Apps Scriptを使用した手動翻訳に依存しており、コードは回復力がなく、メンテナンスが必要な場合があります。レガシーシステムがCSVファイルを自動生成する場合、一時処理([Googleドライブへのアップロードと変換]をGoogleスプレッドシートファイルにインポートする)のために別のフォルダーに移動するのが最善です。
私の考えは、Drive APIにすべての重労働を任せることです。 Google Drive API チーム v3リリース済み 2015年末に、そのリリースでは、insert()
が名前をcreate()
に変更して、より適切に反映するようにしましたファイル操作。また、変換フラグもありません。MIMEtypeを指定するだけです...想像してみてください!
ドキュメントも改善されました:Java、Python、PHP、C#/。NET、Ruby、JavaScriptのサンプルコードに付属する アップロード専用の特別ガイド (シンプル、マルチパート、再開可能)が追加されました。 /Node.js、およびCSVファイルを必要に応じてGoogleスプレッドシート形式にインポートするiOS/Obj-C。
以下は、短いファイル(「シンプルアップロード」)のPythonソリューションの1つで、apiclient.http.MediaFileUpload
クラスを必要としないのソリューションです。このスニペットは、サービスエンドポイントがDRIVE
で、https://www.googleapis.com/auth/drive.file
の最小認証スコープで認証コードが機能することを前提としています。
# filenames & MIMEtypes
DST_FILENAME = 'inventory'
SRC_FILENAME = DST_FILENAME + '.csv'
SHT_MIMETYPE = 'application/vnd.google-apps.spreadsheet'
CSV_MIMETYPE = 'text/csv'
# Import CSV file to Google Drive as a Google Sheets file
METADATA = {'name': DST_FILENAME, 'mimeType': SHT_MIMETYPE}
rsp = DRIVE.files().create(body=METADATA, media_body=SRC_FILENAME).execute()
if rsp:
print('Imported %r to %r (as %s)' % (SRC_FILENAME, DST_FILENAME, rsp['mimeType']))
さらに良いことに、My Drive
にアップロードするのではなく、1つ(または複数)の特定のフォルダーにアップロードします。つまり、親フォルダーIDをMETADATA
に追加します。 ( このページ のコードサンプルも参照してください。)最後に、ネイティブの.gsheet "file"はありません。このファイルにはオンラインシートへのリンクがあるだけなので、上記の操作を行います。 。
Pythonを使用しない場合は、上記のスニペットを擬似コードとして使用して、システム言語に移植できます。とにかく、CSV解析がないため、維持するコードがはるかに少なくなります。残っているのは、レガシーシステムが書き込んだCSVファイルのtempフォルダーを吹き飛ばすことだけです。
誰かが検索する場合-xlsxファイルをGoogleスプレッドシートに自動インポートするユーティリティを作成しました: xls2sheets 。 ./cmd/sheets-refresh
のcronjobを設定することで自動的に実行できます。readmeですべてが説明されています。それが役に立つことを願っています。