コマンドでsolr
からすべてのデータを削除するにはどうすればよいですか? solr
およびlily
とともにhbase
を使用しています。
Hbaseとsolrの両方からデータを削除するにはどうすればよいですか?
http://lucene.Apache.org/solr/4_10_0/tutorial.html#Deleting+Data
Solrインデックスをクリーンアップする場合-
http urlを起動できます-
http://Host:port/solr/[core name]/update?stream.body=<delete><query>*:*</query></delete>&commit=true
([core name]
を削除するコアの名前に置き換えます)。または、データxmlデータを投稿する場合はこれを使用します。
<delete><query>*:*</query></delete>
必ずcommit=true
を使用して変更をコミットしてください
ただし、hbaseデータをクリアすることについてはあまり考えないでください。
このリクエストを使用してすべてのレコードを削除しましたが、時々これをコミットする必要があります。
そのためには、&commit=true
をリクエストに追加します:
http://Host:port/solr/core/update?stream.body=<delete><query>*:*</query></delete>&commit=true
次のコマンドを使用して削除できます。 delete by queryコマンドで「match all docs」クエリを使用します。
'<delete><query>*:*</query></delete>
削除を実行した後もコミットする必要があるため、インデックスを空にするには、次の2つのコマンドを実行します。
curl http://localhost:8983/solr/update --data '<delete><query>*:*</query></delete>' -H 'Content-type:text/xml; charset=utf-8'
curl http://localhost:8983/solr/update --data '<commit/>' -H 'Content-type:text/xml; charset=utf-8'
もう1つの戦略は、ブラウザーに2つのブックマークを追加することです。
http://localhost:8983/solr/update?stream.body=<delete><query>*:*</query></delete>
http://localhost:8983/solr/update?stream.body=<commit/>
SOLRからのソースドキュメント:
https://wiki.Apache.org/solr/FAQ#How_can_I_delete_all_documents_from_my_index.3F
JSONデータの投稿(例:curlを使用)
curl -X POST -H 'Content-Type: application/json' \
'http://<Host>:<port>/solr/<core>/update?commit=true' \
-d '{ "delete": {"query":"*:*"} }'
SolrJを介してSolrのすべてのデータを削除する場合は、次のようにします。
public static void deleteAllSolrData() {
HttpSolrServer solr = new HttpSolrServer("http://localhost:8080/solr/core/");
try {
solr.deleteByQuery("*:*");
} catch (SolrServerException e) {
throw new RuntimeException("Failed to delete data in Solr. "
+ e.getMessage(), e);
} catch (IOException e) {
throw new RuntimeException("Failed to delete data in Solr. "
+ e.getMessage(), e);
}
}
HBaseのすべてのデータを削除する場合は、次のようにします。
public static void deleteHBaseTable(String tableName, Configuration conf) {
HBaseAdmin admin = null;
try {
admin = new HBaseAdmin(conf);
admin.disableTable(tableName);
admin.deleteTable(tableName);
} catch (MasterNotRunningException e) {
throw new RuntimeException("Unable to delete the table " + tableName
+ ". The actual exception is: " + e.getMessage(), e);
} catch (ZooKeeperConnectionException e) {
throw new RuntimeException("Unable to delete the table " + tableName
+ ". The actual exception is: " + e.getMessage(), e);
} catch (IOException e) {
throw new RuntimeException("Unable to delete the table " + tableName
+ ". The actual exception is: " + e.getMessage(), e);
} finally {
close(admin);
}
}
クエリによる削除コマンドで「すべてのドキュメントに一致」クエリを使用します。:
削除を実行した後もコミットする必要があるため、インデックスを空にするには、次の2つのコマンドを実行します。
curl http://localhost:8983/solr/update --data '<delete><query>*:*</query></delete>' -H 'Content-type:text/xml; charset=utf-8'
curl http://localhost:8983/solr/update --data '<commit/>' -H 'Content-type:text/xml; charset=utf-8'
SolrNetを使用して、.Netフレームワークを介してsolrインスタンスからすべてのドキュメントを削除するためにここに来ました。ここに私がそれをどうやってできたかがあります:
Startup.Init<MyEntity>("http://localhost:8081/solr");
ISolrOperations<MyEntity> solr =
ServiceLocator.Current.GetInstance<ISolrOperations<MyEntity>>();
SolrQuery sq = new SolrQuery("*:*");
solr.Delete(sq);
solr.Commit();
これにより、すべてのドキュメントがクリアされました。 (これを回復できるかどうかはわかりませんが、Solrの学習およびテスト段階にあるため、このコードを使用する前にバックアップを検討してください)
ブラウザでこれを起動します
http://localhost:8983/solr/update?stream.body=<delete><query>*:*</query></delete>&commit=true
このコマンドは、solrのインデックス内のすべてのドキュメントを削除します
このクエリを使用して、すべてのレコードを削除しました。
http://Host/solr/core-name/update?stream.body=%3Cdelete%3E%3Cquery%3E*:*%3C/query%3E%3C/delete%3E&commit=true
すべてのデータを消去する必要がある場合は、コレクションを再作成する方が速い場合があります。
solrctl --zk localhost:2181/solr collection --delete <collectionName>
solrctl --zk localhost:2181/solr collection --create <collectionName> -s 1
コマンドラインから次を使用します。
bin/post -c core_name -type text/xml -out yes -d $'<delete><query>*:*</query></delete>'
上記のcurlの例は、cygwinターミナルから実行したときに失敗しました。スクリプト例を実行すると、このようなエラーが発生しました。
curl http://192.168.2.20:7773/solr/CORE1/update --data '<delete><query>*:*</query></delete>' -H 'Content-type:text/xml; charset=utf-8'
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader"><int name="status">0</int><int name="QTime">1</int></lst>
</response>
<!--
It looks like it deleted stuff, but it did not go away
maybe because the committing call failed like so
-->
curl http://192.168.1.2:7773/solr/CORE1/update --data-binary '' -H 'Content-type:text/xml; charset=utf-8'
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader"><int name="status">400</int><int name="QTime">2</int></lst><lst name="error"><str name="msg">Unexpected EOF in prolog
at [row,col {unknown-source}]: [1,0]</str><int name="code">400</int></lst>
</response>
プロジェクトでコア名をすべて消去するには、コア名のループで削除を使用する必要がありました。
以下のこのクエリは、Cygwinターミナルスクリプトで機能しました。
curl http://192.168.1.2:7773/hpi/CORE1/update?stream.body=<delete><query>*:*</query></delete>&commit=true
<?xml version="1.0" encoding="UTF-8"?>
<response>
<lst name="responseHeader"><int name="status">0</int><int name="QTime">1</int></lst>
</response>
この1行により、データはなくなり、変更が持続しました。
Solrよくわかりませんが、以下のようなtruncateコマンドを使用してhbaseからすべてのデータを削除できます。
truncate 'table_name'
Hbaseテーブルからすべての行キーを削除します。
Solrインデックスをクリアするときは、全削除クエリの実行後にコミットと最適化も行う必要があります。完全な手順が必要です(カールだけで十分です): http://www.alphadevx.com/a/365-Clearing-a-Solr-search-index
Solr管理UIに削除リンクを追加するJavaScriptブックマークを作成しました
javascript: (function() {
var str, $a, new_href, href, upd_str = 'update?stream.body=<delete><query>*:*</query></delete>&commit=true';
$a = $('#result a#url');
href = $a.attr('href');
str = href.match('.+solr\/.+\/(.*)')[1];
new_href = href.replace(str, upd_str);
$('#result').prepend('<a id="url_upd" class="address-bar" href="' + new_href + '"><strong>DELETE ALL</strong> ' + new_href + '</a>');
})();
Cloudera 5.xを使用している場合、このドキュメントでは、Lilyがリアルタイムの更新と削除も維持していることを説明しています。
Cloudera Searchで使用するためのLily HBase NRTインデクサーサービスの構成
HBaseはHBaseテーブルセルに挿入、更新、削除を適用するため、インデクサーは標準のHBaseレプリケーションを使用して、HBaseテーブルのコンテンツとSolrの一貫性を維持します。
Iftruncate 'hTable'
も同じでサポートされているかどうかはわかりません。
それ以外の場合は、特定のイベントなどでSolrとHBaseの両方からデータを消去するトリガーまたはサービスを作成します。