把这段代码放到 theme 里的 functions.php 文件:
function theme_pre_comment_post( $c) {
$c['comment_content'] = htmlspecialchars($c['comment_content']);
return $c;
}
add_filter( 'preprocess_comment', 'theme_pre_comment_post', '', 1);
Written by ideawu
at 2010-06-22 13:54:47 | tags: WordPress
function http_post($url, $data){
$ch = curl_init($url) ;
curl_setopt($ch, CURLOPT_POST, 1) ;
curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data));
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1) ;
$result = curl_exec($ch) ;
curl_close($ch) ;
return $result;
}
获取 HTTP 请求的首部:
curl_setopt($ch, CURLINFO_HEADER_OUT, true);
$result = curl_exec($ch) ;
echo curl_getinfo($ch, CURLINFO_HEADER_OUT);
Written by ideawu
at 2010-06-21 14:44:40 | tags: HTTP
为了对 RSS 输出的博客文章进行重新格式化, 比如去掉过于花哨的样式, 去除 JavaScript 脚本代码, 去除 onclick 等, 所以写了相关的 PHP 代码, 使用 DOM 模块.
1. 乱码解决
毫无疑问, 一上来就遇到了乱码问题, 虽然我已经按文档所述, 所有的字符使用 UTF-8 编码:
$html = '<p>你好</p>';
$dom = new DOMDocument();
@$dom->loadHTML($html);
echo $dom->documentElement->nodeValue;
Continue reading »
Written by ideawu
at 2010-05-19 13:44:57 | tags: DOM, XML
tableview 即原来的 two-column-selector, 在升级为 1.1 版本时, 它的项目名称变为 tableview. 1.1 版本最大的变化是加入了排序功能.
在网页开发中, 常常需要一个表格与列表相结合的控件, 即能像表格(table)一样显示丰富的信息, 又能像列表选择控件(select)一样方便地选择数据. 在桌面应用程序开发中, 许多GUI库都提供了类似的控件, 如.Net的ListView.
-
PagerView是一个好看精巧的分页控件. PagerView+TableView为网页开发提供了类似的工具, 但代码更简单, 功能更紧凑.
-
SortView是一个方便易用的分页控件.
-
TableView是一个数据表格控件, 代码简单, 功能紧凑.
-
SelectorView是一个由两个TableView组合而成的控件, 相对于列表选择器, 提供了一个临时的存放已选中项的地方.
下载及文档: http://www.ideawu.net/person/tableview/v1.1/

Written by ideawu
at 2010-05-12 22:16:46 | tags: JavaScript
对于中文搜索引擎来说, 中文分词是整个系统最基础的部分之一, 因为目前基于单字的中文搜索算法并不是太好. 当然, 本文不是要对中文搜索引擎做研究, 而是分享如果用 PHP 做一个站内搜索引擎. 本文是这个系统中的一篇.
我使用的分词工具是中科院计算所的开源版本的 ICTCLAS. 另外还有开源的 Bamboo, 我随后也会对该工具进行调研.
从 ICTCLAS 出发是个不错的选择, 因为其算法传播比较广泛, 有公开的学术文档, 并且编译简单, 库依赖少. 但目前只提供了 C/C++, Java 和 C# 版本的代码, 并没有 PHP 版本的代码. 怎么办呢? 也许可以学习它的 C/C++ 源码和学术文档中, 然后再开发一个 PHP 版本出来. 不过, 我要使用进程间通信, 在 PHP 代码里调用 C/C++ 版本的可执行文件.
Continue reading »
Written by ideawu
at 2010-05-07 08:30:07 | tags: ICTCLAS, Lucene
IT牛人博客聚合网站(www.udpwork.com)用到了 Apache 的 mod_rewrite 模块进行 URL 重写. 但是, 在使用过程中曾经出现过一个比较诡异的问题. 开始认为是重写规则设置得不对, 后来才发现, 是”%2F”导致 Apache 直接返回 404 错误.
比如浏览查看某个标签下的文章列表的链接为
http://www.udpwork.com/tag/Linux
在重写之前的链接是
http://www.udpwork.com/?tag=Linux
Continue reading »
Written by ideawu
at 2010-05-05 10:05:09 | tags: Apache, mod_rewrite
Recent Comments