2012-07-26

流式数据的模型设计

Views: 10857 | Add Comments

流式数据是指带有时间点参数的数值数据. 例如在某个网站的 PV 统计中, 有整个网站的 PV 统计, 也有分不同子域名的统计, 而这个统计数据可能每小时统计一次, 同时每天统计一次. 而在不同的子域名下, 又有不同的功能模块的统计, 如论坛子域名下的发贴 PV, 回复 PV, 等等.

显然, 这类的数据还有至少一个维度, 表明这条数据的产生条件(或者说产生地点), 这样, 数据才有了实际意义. 维度是有序的, 子域名维度必须在网站维度之下, 因为要先有了网站, 子域名才有意义. 每一条数据的维度可以这样表示: /dim1=v1/dim2=v2/... 表示该条数据在 dim1 维度下的值是 v1, 在 dim2 维度下的值是 v2, ...

数据还要有一个统计方法, 如pv, uv.

Related posts:

  1. 并发编程的核心技术 – 多版本(Multi Version)
  2. 小心递归次数限制
  3. Redis 导数据的 PHP 脚本
  4. Redis被bgsave和bgrewriteaof阻塞的解决方法
  5. Google Talk 界面开发分析
Posted by ideawu at 2012-07-26 22:37:53

Leave a Comment