AndroidのHTMLリンクからページのHTMLソースを取得する方法は？

Question

リンクからWebページのソースを取得し、そのページからhtmlを解析する必要があるアプリケーションに取り組んでいます。

そのようなアプリの作成を開始するためのいくつかの例、または開始点を教えてください。

Mark B · Accepted Answer

HttpClient を使用して、HTTP GETを実行し、次のようなHTML応答を取得できます。

HttpClient client = new DefaultHttpClient(); HttpGet request = new HttpGet(url); HttpResponse response = client.execute(request); String html = ""; InputStream in = response.getEntity().getContent(); BufferedReader reader = new BufferedReader(new InputStreamReader(in)); StringBuilder str = new StringBuilder(); String line = null; while((line = reader.readLine()) != null) { str.append(line); } in.close(); html = str.toString();

Spipau · Answer

jsoup をお勧めします。

彼らのウェブサイトによると：

ウィキペディアのホームページを取得し、DOMに解析して、ニュースセクションの見出しを要素のリスト（オンラインサンプル）に選択します。

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); Elements newsHeadlines = doc.select("#mp-itn b a");

入門：

ダウンロード jsoup jar core library
cookbook はじめにを読む

Colin White · Answer

この質問は少し古いですが、DefaultHttpClient、HttpGetなどが非推奨になったため、回答を投稿する必要があると考えました。この関数は、URLを指定してHTMLを取得および返す必要があります。

public static String getHtml(String url) throws IOException { // Build and set timeout values for the request. URLConnection connection = (new URL(url)).openConnection(); connection.setConnectTimeout(5000); connection.setReadTimeout(5000); connection.connect(); // Read and store the result line by line then return the entire string. InputStream in = connection.getInputStream(); BufferedReader reader = new BufferedReader(new InputStreamReader(in)); StringBuilder html = new StringBuilder(); for (String line; (line = reader.readLine()) != null; ) { html.append(line); } in.close(); return html.toString(); }

Julian · Answer

public class RetrieveSiteData extends AsyncTask<String, Void, String> { @Override protected String doInBackground(String... urls) { StringBuilder builder = new StringBuilder(100000); for (String url : urls) { DefaultHttpClient client = new DefaultHttpClient(); HttpGet httpGet = new HttpGet(url); try { HttpResponse execute = client.execute(httpGet); InputStream content = execute.getEntity().getContent(); BufferedReader buffer = new BufferedReader(new InputStreamReader(content)); String s = ""; while ((s = buffer.readLine()) != null) { builder.append(s); } } catch (Exception e) { e.printStackTrace(); } } return builder.toString(); } @Override protected void onPostExecute(String result) { } }

Anupam Rajanish · Answer

他の1つ[〜＃〜] so [〜＃〜]投稿の回答が役に立ちました。これは行ごとに読み取りません。おそらく、htmlファイルの間に行nullがありました。前提条件として、プロジェクト設定からこの依存関係を追加します"com.koushikdutta.ion：ion：2.2.1"このコードをAsyncTASKに実装します。返された-something-をUIスレッドに入れたい場合は、相互インターフェースに渡します。

Ion.with(getApplicationContext()). load("https://google.com/hashbrowns") .asString() .setCallback(new FutureCallback<String>() { @Override public void onCompleted(Exception e, String result) { //int s = result.lastIndexOf("user_id")+9; // String st = result.substring(s,s+5); // Log.e("USERID",st); //something } });

Sephy · Answer

外観が here または here である場合、Android APIを使用して直接実行できないことがわかります。外部図書館...

外部ライブラリーが必要な場合は、上記の2つから選択できます。

Xar E Ahmer · Answer

のように呼ぶ

new RetrieveFeedTask(new OnTaskFinished() { @Override public void onFeedRetrieved(String feeds) { //do whatever you want to do with the feeds } }).execute("http://enterurlhere.com");

RetrieveFeedTask.class

class RetrieveFeedTask extends AsyncTask<String, Void, String> { String HTML_response= ""; OnTaskFinished onOurTaskFinished; public RetrieveFeedTask(OnTaskFinished onTaskFinished) { onOurTaskFinished = onTaskFinished; } @Override protected void onPreExecute() { super.onPreExecute(); } @Override protected String doInBackground(String... urls) { try { URL url = new URL(urls[0]); // enter your url here which to download URLConnection conn = url.openConnection(); // open the stream and put it into BufferedReader BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream())); String inputLine; while ((inputLine = br.readLine()) != null) { // System.out.println(inputLine); HTML_response += inputLine; } br.close(); System.out.println("Done"); } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return HTML_response; } @Override protected void onPostExecute(String feed) { onOurTaskFinished.onFeedRetrieved(feed); } }

OnTaskFinished.Java

public interface OnTaskFinished { public void onFeedRetrieved(String feeds); }