留言 - 吴祖洋的技术博客

留言

在这里填写留言和我交流.

SSDB 相关的问题, 建议提在这里: http://www.ideawu.net/blog/ssdb, 就是本页顶部菜单的"SSDB"链接.

581 Responses to "留言"

simon 2013-11-26 at 11:04:03

ssdb-stable-1.6.6 版本里的Makefile中 chmod u+x tools/ssdb-cli tools/ssdb-benchmark 这里的"tools/ssdb-benchmark" 是不是要删除了，因为编译不过去，删除后通过编译。对比了一下1.6.6和1.6.4，"tools/ssdb-benchmark"，被"tools/ssdb-bench.cpp"代替了 Reply

ideawu 2013-11-26 at 11:28:55

@simon: 这是一个失误, 已经更正. 请重新获取代码. Reply

simon 2013-11-26 at 16:43:37

@ideawu: 你好
目前我有个大数据需要用SSDB
5000万个k/v
key: 20节
value: >=2K
删除少，写入、更新、查询比较多，是用kv,还是用hashmap合适？

在配置中cache_size: 多少合适 Reply

ideawu 2013-11-26 at 17:00:41

@simon: 如果操作只有 get/set, 就用 kv. 如果需要遍历, 就用 hashmap. cache_size 你可以设置为 1000(单位 MB) Reply
yuyoo4j 2013-11-25 at 11:33:48

你好!
我对你这个项目很赶兴趣. 我有2个小需求,你评估下能不能加进去ssdb.
1) 给ssdb增加数据域空间支持, 比如, 数据可以按db存在,业务上不同域的数据存在在ssdb上的不同数据库(或者什么), 像redis的select命令.
2) ssdb的配置能不能通过命令进行配置和更新,像redis的server相关命令.
静待你的答复. Reply

ideawu 2013-11-25 at 13:45:28

@yuyoo4j: Hi, 谢谢你对 ssdb 的关注. 你提的这几项改进建议不错, 以前也考虑过. 不过, 根据实际使用经验来看, 这些功能的收益相对于实现成本来说, 不是很可观, 所以一直没有实现. 请问, 你能讲一下你的使用场景吗? Reply

yuyoo4j 2013-11-25 at 17:31:47

@ideawu: 我也看你在github上回复,你的建议是使用启动多个端口来解决. 但是,这个和我的想法和对ssdb的定位不是很符合.
我想将ssdb作为
1)一个大的存储池,在ssdb与应用之间做一个代理的模块,想实现ssdb节点的动态管理;
2)把系统中多个模块的数据都放进去. 对应涉及的模块比较多(超过30个模块), 不太可能启动30个端口来解决(不好管理).
现在我使用redis, 各个模块的数据是通过key的前缀来区分, 一般命名规则 XXX_key
这样对组织数据很不好.
建议可以在建立连接时指定"库" Reply

ideawu 2013-11-26 at 00:37:14

@yuyoo4j: 你好, 多谢反馈. 我会考虑在以后的版本中增加"库"的支持.

请问你使用的数据类型只有 KV(get, set, del) 吗? 如果是的话, 可以用 map 来替换, 然后用 XXX 作为 map 的名字. Reply

yuyoo4j 2013-11-26 at 10:21:10

@ideawu: 多数域的数据都是KV(get, set, del),或者稍微改下操行模式,也可以转成KV(get, set, del). 我想过用map来存储同类项的key,我的担心是如果map中key的数量达到100w会怎样? 在底层,一个map使用leveldb的一个key来实现吗? Reply

ideawu 2013-11-26 at 11:02:30

@yuyoo4j: 这个担心倒可不必, ssdb 的集合数据类型支持数亿个元素而不影响性能.
whl 2013-11-22 at 16:05:04

今天又遇到一个ssdb崩溃的问题，直接起不来了，看起来像是leveldb坏掉了。
用ssdb-repair 修复的时候，repair程序也挂掉了。

#0 0x000000000044aa2c in leveldb::Block::Iter::SeekToFirst() ()
#1 0x0000000000445f58 in leveldb::(anonymous namespace)::TwoLevelIterator::SeekToFirst() ()
#2 0x0000000000445e8a in leveldb::(anonymous namespace)::TwoLevelIterator::SkipEmptyDataBlocksForward() ()
#3 0x0000000000442fe0 in leveldb::(anonymous namespace)::MergingIterator::Next() ()
#4 0x000000000042f242 in leveldb::DBImpl::DoCompactionWork(leveldb::DBImpl::CompactionState*) ()
#5 0x000000000042fa00 in leveldb::DBImpl::BackgroundCompaction() ()
#6 0x00000000004304fb in leveldb::DBImpl::BackgroundCall() ()
#7 0x000000000044c86f in leveldb::(anonymous namespace)::PosixEnv::BGThreadWrapper(void*) ()
#8 0x00007f4cf43e4e9a in start_thread (arg=0x7f4cf37ff700) at pthread_create.c:308
#9 0x00007f4cf4111ccd in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:112
#10 0x0000000000000000 in ?? () Reply

whl 2013-11-23 at 13:47:54

@whl:
这个问题应该是硬盘问题导致leveldb数据文件损坏。

badblocks检查之后，发现有坏道。
Pass completed, 81 bad blocks found. (81/0/0 errors) Reply
whl 2013-11-13 at 11:00:03

楼主，遇到个问题，ssdb-server开启后内存一直在增长，然后ssdb-cli连接的时候报Connection error: (111, ‘Connection refused’)。

这是什么原因？ Reply

ideawu 2013-11-13 at 11:40:29

@whl: Hi, 能否提供下这些信息:
1. 你的环境?
2. ssdb版本?
3. 你的程序是如何使用的?
4. log.txt 在无法连接的前后, 有什么输出? Reply

whl 2013-11-13 at 12:10:15

@ideawu:

操作过程：
存完数据后，用zscan查询，由于数据比较多，阻塞住了，就把ssdb kill掉了，然后重启server就出现了上述现象。

log.txt都是启动server后的正常内容。
我那台机器跑的东西比较多，机器比较卡。
ssdb是1.6.3，开启了压缩。
看现象应该是server启动后，在做某些操作，要申请内存，由于机器跑的东西多，导致比较慢。

后面又重复了几遍，还是得等server的内存涨到一定程度，client才能连。 Reply

ideawu 2013-11-13 at 13:58:25

@whl: 如果数据较多的话, ssdb会在启动过程整理数据. 你可以在ssdb-cli中执行compact命令, 强制整理. 整理后查询速度就快了. Reply

whl 2013-11-13 at 15:43:46

@ideawu:
嗯，后面都比较快了。 Reply

whl 2013-11-13 at 11:20:05

@whl: 额。。最后可以连上了，等了差不多10分钟，server的内存到了1G多。 Reply
zhch 2013-11-08 at 05:12:10

哈喽, 楼主, 看了下java的客户端,没有multi_hget/set系列和multi_zget/set系列,php的api中有这几个方法, java版的近期有计划加上吗 Reply
zhch 2013-11-07 at 21:09:31

楼主, java的客户端哪里下载, 只有javadoc没有jar包也没有源码呢 Reply

ideawu 2013-11-07 at 22:35:44

@zhch: 你好, java 客户端的源码在 api/java 目录里. Reply
whl 2013-11-07 at 16:45:35

今天用的时候出现了三次ssdb进程异常退出，log里没有异常信息。
生成了core文件，堆栈是：
（1）：
#0 0x000000000044c6bf in leveldb::ReadBlock(leveldb::RandomAccessFile*, leveldb::ReadOptions const&, leveldb::BlockHandle const&, leveldb::BlockContents*) ()
(gdb) bt
#0 0x000000000044c6bf in leveldb::ReadBlock(leveldb::RandomAccessFile*, leveldb::ReadOptions const&, leveldb::BlockHandle const&, leveldb::BlockContents*) ()
#1 0x00000000004450fc in leveldb::Table::BlockReader(void*, leveldb::ReadOptions const&, leveldb::Slice const&) ()
#2 0x00000000004460d0 in leveldb::(anonymous namespace)::TwoLevelIterator::InitDataBlock() ()
#3 0x00000000004462fb in leveldb::(anonymous namespace)::TwoLevelIterator::SkipEmptyDataBlocksForward() ()
#4 0x000000000044635e in leveldb::(anonymous namespace)::TwoLevelIterator::Next() ()
#5 0x0000000000443460 in leveldb::(anonymous namespace)::MergingIterator::Next() ()
#6 0x000000000042f6c2 in leveldb::DBImpl::DoCompactionWork(leveldb::DBImpl::CompactionState*) ()
#7 0x000000000042fe80 in leveldb::DBImpl::BackgroundCompaction() ()
#8 0x000000000043097b in leveldb::DBImpl::BackgroundCall() ()
#9 0x000000000044ccef in leveldb::(anonymous namespace)::PosixEnv::BGThreadWrapper(void*) ()
#10 0x00007f8453145e9a in start_thread (arg=0x7f843a645700) at pthread_create.c:308
#11 0x00007f8452e72ccd in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:112
#12 0x0000000000000000 in ?? ()
（2）：
#0 __memcpy_ssse3_back () at ../sysdeps/x86_64/multiarch/memcpy-ssse3-back.S:2065
#1 0x00007f95e29e0bc8 in std::string::append(char const*, unsigned long) () from /usr/lib/x86_64-linux-gnu/libstdc++.so.6
#2 0x000000000044a0bb in leveldb::BlockBuilder::Add(leveldb::Slice const&, leveldb::Slice const&) ()
#3 0x0000000000444579 in leveldb::TableBuilder::Add(leveldb::Slice const&, leveldb::Slice const&) ()
#4 0x000000000042f6a2 in leveldb::DBImpl::DoCompactionWork(leveldb::DBImpl::CompactionState*) ()
#5 0x000000000042fe80 in leveldb::DBImpl::BackgroundCompaction() ()
#6 0x000000000043097b in leveldb::DBImpl::BackgroundCall() ()
#7 0x000000000044ccef in leveldb::(anonymous namespace)::PosixEnv::BGThreadWrapper(void*) ()
#8 0x00007f95e2219e9a in start_thread (arg=0x7f95c6ac8700) at pthread_create.c:308
#9 0x00007f95e1f46ccd in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:112
#10 0x0000000000000000 in ?? ()
（3）：
#0 0x000000000045157d in UnalignedCopy64 (dst=0x7f8ebced8304, src=0x7f8e9c3efffd) at snappy-stubs-internal.h:195
#1 TryFastAppend (len=1, available=7147, ip=0x7f8e9c3efff5 <Address 0x7f8e9c3efff5 out of bounds>, this=<optimized out>) at snappy.cc:1000
#2 DecompressAllTags<snappy::SnappyArrayWriter> (writer=<synthetic pointer>, this=0x7f8ed15ce630) at snappy.cc:730
#3 InternalUncompressAllTags<snappy::SnappyArrayWriter> (decompressor=0x7f8ed15ce630, max_len=4294967295, uncompressed_len=<optimized out>, writer=<synthetic pointer>) at snappy.cc:866
#4 InternalUncompress<snappy::SnappyArrayWriter> (writer=<synthetic pointer>, r=<optimized out>, max_len=<optimized out>) at snappy.cc:850
#5 snappy::RawUncompress (compressed=<optimized out>, uncompressed=0x7f8ebced6000 "") at snappy.cc:1042
#6 0x0000000000451702 in snappy::RawUncompress (compressed=<optimized out>, n=<optimized out>, uncompressed=<optimized out>) at snappy.cc:1037
#7 0x000000000044c7ee in leveldb::ReadBlock(leveldb::RandomAccessFile*, leveldb::ReadOptions const&, leveldb::BlockHandle const&, leveldb::BlockContents*) ()
#8 0x00000000004450fc in leveldb::Table::BlockReader(void*, leveldb::ReadOptions const&, leveldb::Slice const&) ()
#9 0x00000000004460d0 in leveldb::(anonymous namespace)::TwoLevelIterator::InitDataBlock() ()
#10 0x00000000004462fb in leveldb::(anonymous namespace)::TwoLevelIterator::SkipEmptyDataBlocksForward() ()
#11 0x000000000044635e in leveldb::(anonymous namespace)::TwoLevelIterator::Next() ()
#12 0x0000000000443460 in leveldb::(anonymous namespace)::MergingIterator::Next() ()
#13 0x000000000042f6c2 in leveldb::DBImpl::DoCompactionWork(leveldb::DBImpl::CompactionState*) ()
#14 0x000000000042fe80 in leveldb::DBImpl::BackgroundCompaction() ()
#15 0x000000000043097b in leveldb::DBImpl::BackgroundCall() ()
#16 0x000000000044ccef in leveldb::(anonymous namespace)::PosixEnv::BGThreadWrapper(void*) ()
#17 0x00007f8fb9c63e9a in start_thread (arg=0x7f8ed15cf700) at pthread_create.c:308
#18 0x00007f8fb9990ccd in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:112
#19 0x0000000000000000 in ?? ()

另外：启用了压缩。 Reply

ideawu 2013-11-07 at 19:19:46

@whl: 多谢反馈! 这看起来是LevelDB和Snappy配合的问题. 你能给出重现方法吗? 我打算剥离SSDB看是否是LevelDB的bug, 然后在官网上提一个issue. Reply

whl 2013-11-08 at 10:18:33

@ideawu: 好像是snappy的问题，关了压缩之后就没出现了。
我这个是日志分析的程序，大约30G的日志，分析完成后存到ssdb中。
大约有400万个zset。 Reply

ideawu 2013-11-08 at 10:28:16

@whl: 好的, 我已经在leveldb官网提了一个issue, 等待他们的回复. Reply
muser 2013-11-07 at 13:13:23

我有3千万的K/V要存储
每个K/v 大概5KB

这样的数量。内存和硬盘占用多少？
还有一个问题，如果查看有多个key? redis可以用dbsize,SSDB用什么命令？ Reply

ideawu 2013-11-07 at 13:51:07

@muser: 在不启用压缩的情况下, 可以这么算硬盘占用:

30M x (5K + 20 + 10) ~= 150GB

假设 key 是 20 字节, SSDB 额外占用 10 个字节. 内存占用按默认配置, 会稳定在 1 GB 左右.

SSDB 没有一个命令看数据库中有多少个 key, 如果你需要统计, 那么可以把所有的 KV 存储到一个 hashmap 中, 然后用 hsize 来获取这个 map 的 KV 个数. Reply
whl 2013-10-17 at 14:25:57

再请教个问题：我有一些数据要存到ssdb上，数据量和要存的结构大概是一个zlist：80W个元素，160W个hashmap。
4个进程一块跑，用了大概4分钟。有没有加快速度的方法？
PS:下面那个多次send和recv 跟一次send完所有数据的问题就是想加快一下速度,结果有问题。 Reply

ideawu 2013-10-17 at 17:20:34

@whl: 可以使用 multi_* 方法, 例如依次执行的步骤是:

request("zset", "h", "a", "1");
request("zset", "h", "b", "2");
request("zset", "h", "c", "3");

可以改成

std::vector<std::string> req;
req.push_back("multi_zset");
req.push_back("h");
req.push_back("a");
req.push_back("1");
req.push_back("b");
req.push_back("2");
req.push_back("c");
req.push_back("3");
request(req);

控制批量在 1000 个元素以内. Reply

whl 2013-10-17 at 17:28:50

@ideawu: 我使用的是zincr和hincr，相同key的值要加起来。没有multi_*incr的命令吧？ Reply

ideawu 2013-10-17 at 18:33:36

@whl: 没有 multi_*incr 命令. 或者, 你在批量 send 的时间, 控制一下数量, 例如 100 个. 或者, 修改 socket 的发送缓冲和接收缓冲大小. Reply

whl 2013-10-17 at 15:56:46

@whl: 用redis的pipeline，差不多半分钟。ssdb怎样才能批量执行呢？ Reply
whl 2013-10-16 at 17:01:53

博主，有个问题：
ssdb使用c++接口，发送很多命令，最后一次接收，类似：
link->send();
……//多次send
link->flush();
link->recv();
发现程序卡住。
阻塞在write：
[<ffffffff81537ec9>] sk_stream_wait_memory+0x1b9/0x270
[<ffffffff81583537>] tcp_sendmsg+0x727/0xd80
[<ffffffff815a92b4>] inet_sendmsg+0x64/0xb0
[<ffffffff81529224>] do_sock_write.isra.10+0xd4/0xf0
[<ffffffff815292a3>] sock_aio_write+0x63/0x90
[<ffffffff8117723a>] do_sync_write+0xda/0x120
[<ffffffff81177bfd>] vfs_write+0x16d/0x180
[<ffffffff81177e6a>] sys_write+0x4a/0x90
[<ffffffff81661ec2>] system_call_fastpath+0x16/0x1b
[<ffffffffffffffff>] 0xffffffffffffffff

怎么回事？ Reply

whl 2013-10-16 at 18:14:47

@whl: google一下，说是网络栈内存不足了，把send的次数改小了点，还是会出现。一次发送多少数据合适？ Reply

ideawu 2013-10-16 at 20:57:34

@whl: Hi, 请问你是send多少次之后再flush? 每一次的数据量有多少字节? 推荐的用法是send一次之后, flush, 然后recv直到成功. 或者可以改用 request() 方法. Reply

whl 2013-10-16 at 21:16:23

@ideawu: 多次send和recv 跟一次send完所有数据，再recv 耗时一样吗？ Reply

ideawu 2013-10-16 at 21:34:59

@whl: send完立即recv, 或者使用 request(), 也即所谓的停止等待. 而多次send再多次recv, 则是批量执行. 后者可以节省rtt(网络和交互延时), 可以多起几个客户端, 让rtt的对整体无影响.

之所以卡住, 过程是这样的: 默认TCP socket的发送和接收缓冲区大概在8k, 如果响应的数据超过16k(服务器的发送缓冲+客户端的接收缓冲), 这时, 服务器的发送缓冲和客户端的接收缓冲已满, 导致服务器不再接收, 最终也导致客户端的发送缓冲满, send完全卡住. Reply

ideawu 2013-10-17 at 10:01:08

@whl: 已经在项目wiki里添加了 ssdb-go 的链接: https://github.com/ideawu/ssdb/wiki

whl 2013-10-16 at 21:54:04

@ideawu: 嗯，明白了，多谢。
另外GO客户端差不多完成了，新增加了支持批量模式。
https://github.com/whl739/ssdb-go

whl 2013-10-16 at 21:01:39

@ideawu: 我是根据数据的大小send的，大于8K 就send. Reply

« [5][6][7][8][9][10][11][12][13] » 9/28

idea's blog

留言

在这里填写留言和我交流.

581 Responses to "留言"

Leave a Comment

IT牛人

Polls

Categories

Recent Posts

Recent Comments

Links

Meta

	Name *
	Email *(will not be published)
	Website

idea's blog

留言

在这里填写留言和我交流.

581 Responses to "留言"

Leave a Comment

IT牛人

Polls

Categories

Recent Posts

Recent Comments

Tags

Links

Meta