采用位图标记技术的垃圾收集器将会大幅改善内存占用

Ruby 1.9.3最重要的特性就是引入了惰性垃圾收集清理器,这项工作是由中村成洋(InfoQ此前有过相关报道)完成的,它极大地降低了最坏情况下垃圾收集器所需要的时间。在近期的一份文档中, 中村成洋表示他已经实现了写时拷贝的位图标记垃圾收集器(简记bmap),这个收集器和Ruby企业版的写时拷贝垃圾收集器很类似,都是通过使用 POSIX的fork系统调用来降低内存需要,这个调用的巧妙之处在于让子进程共享父进程的内存,除非有修改才会拷贝。不幸的是,当前的Ruby收集器并没有很好地利用这个特性

Ruby使用的是标记清除垃圾收集技术。这项技术的特点是,垃圾收集器首先会遍历所有的对象,然后标记哪些正在使用,即设置FL_MARK标记位。 然后收集器将会再遍历所有的对象,删除没有被标记的对象,并且释放空间。不过,问题是,这种技术和写时拷贝逻辑上有冲突:收集器可能会把所有的页都标记为 脏。

InfoQ联系了了中村成洋,希望得知他的bmap实现是如何改善现有惰性垃圾收集器的缺陷。他指出,位图标记算法拥有如下几个优点:

  • 相比每个对象有个头部位标记,位图对存储空间利用更加高效
  • 高局部性
  • 标记不会修改任何对象。而且清理也不会修改任何活动对象
  • 非常适合写时拷贝,脏缓存行很少
  • 我们使用memset来重置标记位
  • 清除操作将会快一些

在CRuby中,写时拷贝是非常重要的。Linux环境下,位图标记技术将会显著改善使用fork程序的内存使用情况。而且在CRuby中,使用fork可以大幅提高并行性能。不仅如此,在库支持方面,也有很多采用了fork的库可供使用。(例如UnicornResque

InfoQ:但是从性能方面来看,惰性垃圾搜集器降低了吞吐量,而且bmap也比当前的垃圾收集器略微慢一些。bmap将会代替现有的垃圾收集器么?或者开发者和用户可以通过配置来选择使用哪种垃圾收集器?

我的计划是位图标记垃圾收集器将会是默认的垃圾收集器。至于你所提到的“bmap略微慢一些”,的确是这样,不过,我认为性能下降程度仍然是在所有人可以接受的范围内。所以,我觉得用户并不需要这样的配置。

InfoQ:你也提到了你准备将位图标记技术应用到并行垃圾收集器中。听起来这将会大幅提高垃圾收集器性能,你能否透露一下这项技术将能够能够提高大概多少性能么(或者减少多少停顿时间)?

事实上我已经编写出了无位图标记技术的并行垃圾收集器。在某些情况下,我能够将运行在双核机器上的垃圾收集器性能提高40%。应用位图标记技术之后,性能只会有微量降低。我在RubyConf US 2011上已经详细地阐述了并行垃圾收集器(视频幻灯片)。

松本行弘也将位图标记垃圾收集器提交到了Ruby代码库中,它将会随着下一个版本一同发布,我们认为这个版本将会是2.0版。

查看英文原文:Bitmap Marking GC for Ruby Improves Memory Usage

Advertisements
This entry was posted in Achitecture. Bookmark the permalink.

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s