DOMNodeのinnerHTMLを取得する方法は？

Question

PHP DOM実装で指定されたDOMNodeのinnerHTMLを取得するためにどの関数を使用しますか？信頼できるソリューションを提供できますか？

もちろんouterHTMLも同様です。

Haim Evgi · Accepted Answer

比較この更新されたバリアントは PHP Manual User Note＃89718 ：

<?php function DOMinnerHTML(DOMNode $element) { $innerHTML = ""; $children = $element->childNodes; foreach ($children as $child) { $innerHTML .= $element->ownerDocument->saveHTML($child); } return $innerHTML; } ?>

例：

<?php $dom= new DOMDocument(); $dom->preserveWhiteSpace = false; $dom->formatOutput = true; $dom->load($html_string); $domTables = $dom->getElementsByTagName("table"); // Iterate over DOMNodeList (Implements Traversable) foreach ($domTables as $table) { echo DOMinnerHTML($table); } ?>

trincot · Answer

機能プログラミングスタイルのバージョンは次のとおりです。

function innerHTML($node) { return implode(array_map([$node->ownerDocument,"saveHTML"], iterator_to_array($node->childNodes))); }

Pedro Lobito · Answer

要素のhtmlを返すには、 C14N（）を使用できます。

$dom = new DOMDocument(); $dom->loadHtml($html); $x = new DOMXpath($dom); foreach($x->query('//table') as $table){ echo $table->C14N(); }

Alf Eaton · Answer

Haim Evgiの答えの簡略版：

<?php function innerHTML(\DOMElement $element) { $doc = $element->ownerDocument; $html = ''; foreach ($element->childNodes as $node) { $html .= $doc->saveHTML($node); } return $html; }

使用例：

<?php $doc = new \DOMDocument(); $doc->loadHTML("<body><div id='foo'><p>This is <b>an <i>example</i></b> paragraph<br>

containing newlines.</p><p>This is another paragraph.</p></div></body>"); print innerHTML($doc->getElementById('foo')); /* <p>This is <b>an <i>example</i></b> paragraph<br> containing newlines.</p> <p>This is another paragraph.</p> */

preserveWhiteSpaceまたはformatOutputを設定する必要はありません。

flu · Answer

_array_map_およびimplodeを含むtrincotのNiceバージョンに加えて、今回は_array_reduce_を使用します。

_return array_reduce( iterator_to_array($node->childNodes), function ($carry, \DOMNode $child) { return $carry.$child->ownerDocument->saveHTML($child); } ); _

それでも、配列とイテレータを同様に受け入れるreduce()メソッドがない理由を理解していない。

Chris · Answer

function setnodevalue($doc, $node, $newvalue){ while($node->childNodes->length> 0){ $node->removeChild($node->firstChild); } $fragment= $doc->createDocumentFragment(); $fragment->preserveWhiteSpace= false; if(!empty($newvalue)){ $fragment->appendXML(trim($newvalue)); $nod= $doc->importNode($fragment, true); $node->appendChild($nod); } }

birgire · Answer

Php.netのDrupellaによるこのコメントに基づく別のアプローチがありますが、これは私のプロジェクトでうまく機能しました。 innerHTML()は、新しいDOMDocumentを作成して、子ノードを明示的に繰り返すのではなく、ターゲットノードにインポートして追加することで定義します。

InnerHTML

このヘルパー関数を定義しましょう：

function innerHTML( \DOMNode $n, $include_target_tag = true ) { $doc = new \DOMDocument(); $doc->appendChild( $doc->importNode( $n, true ) ); $html = trim( $doc->saveHTML() ); if ( $include_target_tag ) { return $html; } return preg_replace( '@^<' . $n->nodeName .'[^>]*>|</'. $n->nodeName .'>$@', '', $html ); }

ここで、2番目の入力引数を介して外側のターゲットタグを含める/除外することができます。

使用例

ここでは、「first」id属性で指定されたターゲットタグの内部HTMLを抽出します。

$html = '<div id="first"><h1>Hello</h1></div><div id="second"><p>World!</p></div>'; $doc = new \DOMDocument(); $doc->loadHTML( $html ); $node = $doc->getElementById( 'first' ); if ( $node instanceof \DOMNode ) { echo innerHTML( $node, true ); // Output: <div id="first"><h1>Hello</h1></div> echo innerHTML( $node, false ); // Output: <h1>Hello</h1> }

ライブの例：

http://sandbox.onlinephpfunctions.com/code/2714ea116aad9957c3c437d46134a1688e9133b8