• 2010-05-19

    PHP解析HTML和loadHTML乱码

    Views: 34331 | 1 Comment

    为了对 RSS 输出的博客文章进行重新格式化, 比如去掉过于花哨的样式, 去除 JavaScript 脚本代码, 去除 onclick 等, 所以写了相关的 PHP 代码, 使用 DOM 模块.

    1. 乱码解决

    毫无疑问, 一上来就遇到了乱码问题, 虽然我已经按文档所述, 所有的字符使用 UTF-8 编码:

    $html = '<p>你好</p>';
    $dom = new DOMDocument();
    @$dom->loadHTML($html);
    echo $dom->documentElement->nodeValue;
    

    Continue reading »

    Posted by ideawu at 2010-05-19 13:44:57 Tags: ,
|<<<1>>>| 1/1 Pages, 1 Results.