web-dev-qa-db-ja.com

WebViewからHTMLコンテンツを取得する方法(文字列として)

WebViewに現在表示されているすべてのHTMLコンテンツを取得するにはどうすればよいですか?

WebView.loadData()を見つけましたが、反対の同等物を見つけることができませんでした(例:WebView.getData())

私が制御できないWebページのデータを取得することに興味があることに注意してください(つまり、WebViewでJavascriptインターフェイスを呼び出すように、これらのページにJavascript関数を挿入することはできません)。

36
JohnK

残念ながら、これを行う簡単な方法はありません。

WebViewからWebページのコンテンツを取得する方法 を参照してください。

WebViewと同じページにHttpRequestを作成し、応答を取得することができます。

17
brendan

これは次の方法で実現できます。

final Context myApp = this;

/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
    @SuppressWarnings("unused")
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);

/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");

/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
    @Override
    public void onPageFinished(WebView view, String url)
    {
        /* This call inject JavaScript into the page which just finished loading. */
        browser.loadUrl("javascript:window.HTMLOUT.processHTML('<html>'+document.getElementsByTagName('html')[0].innerHTML+'</html>');");
    }
});

/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");

ProcessHTMLメソッドでHtmlコントロール全体を取得します。そして、それはウェブページの別のリクエストを行いません。これを行うためのより効率的な方法でもあります。

ありがとう。

33
webView.evaluateJavascript("(function(){return window.document.body.outerHTML})();", 
      new ValueCallback<String>() {
          @Override
          public void onReceiveValue(String html) {

          }
      });
12
noamtcohen

これをコードに追加します。

private String getUrlSource(String site) throws IOException {
    //GNU Public, from ZunoZap Web Browser
    URL url = new URL(site);
    URLConnection urlc = url.openConnection();
    BufferedReader in = new BufferedReader(new InputStreamReader(
    urlc.getInputStream(), "UTF-8"));
    String inputLine;
    StringBuilder a = new StringBuilder();
    while ((inputLine = in.readLine()) != null)
    a.append(inputLine);
    in.close();

    return a.toString();
}

次に、Googleのソースを取得する方法を説明します。

getURLSource("http://google.com");
2
Isaiah Patton

WebViewによって行われたHTTPリクエストをインターセプトし、HTMLを変更して、HTMLページと通信するために必要なJavaScript関数を含めることができます。 WebViewClient shouldInterceptRequest()メソッドを介してHTTP要求をインターセプトします。

このメカニズムを使用すると、ロードされたページに自分でロードしてアクセスし、WebViewに渡す前に変更したり、必要に応じてローカルにキャッシュすることもできます。

1
Jakob Jenkov

webviewからJavaScriptInterfaceを介してデータを渡すことができます。これを行いました。データを静的変数に保存してから、Android applcation

0
Ryan