2012-07-26

流式数据的模型设计

Views: 12739 | Add Comments

流式数据是指带有时间点参数的数值数据. 例如在某个网站的 PV 统计中, 有整个网站的 PV 统计, 也有分不同子域名的统计, 而这个统计数据可能每小时统计一次, 同时每天统计一次. 而在不同的子域名下, 又有不同的功能模块的统计, 如论坛子域名下的发贴 PV, 回复 PV, 等等.

显然, 这类的数据还有至少一个维度, 表明这条数据的产生条件(或者说产生地点), 这样, 数据才有了实际意义. 维度是有序的, 子域名维度必须在网站维度之下, 因为要先有了网站, 子域名才有意义. 每一条数据的维度可以这样表示: /dim1=v1/dim2=v2/... 表示该条数据在 dim1 维度下的值是 v1, 在 dim2 维度下的值是 v2, ...

数据还要有一个统计方法, 如pv, uv.

Related posts:

  1. 企业级SSD硬盘fsync速度
  2. 为什么 Leader Based 的分布式协议 Raft 是更好的
  3. 一个 GUI 系统的组成部分
  4. 异步编程语言的常见坑
  5. 在线状态服务在网站系统中的应用
Posted by ideawu at 2012-07-26 22:37:53

Leave a Comment