Java 8新特性:字符串去重

杜老師說 2022-01-07 11:19:02 阅读数:773

java 特性 字符串 字符

本文首發與InfoQ

8月19日,Oracle發布了JDK 8u20,JDK 8u20包含很多新特性,比如Java編譯器更新、支持在運行時通過API來修改MinHeapFreeRatio和MaxHeapFreeRatio參數、新的GC調優指南文檔。不過在眾多新特性中,最令人期待的還屬字符串去重(String Deduplication )。如何减少內存占用一直是一個永恒的話題,而在Java應用中,經常會看到String對象會占用應用30%的內存,它是Java中最常用的對象之一。新的字符串去重特性可以幫助减少應用中String對象的內存占用,目前該特性只適用於G1垃圾收集器,並且默認不被開啟。

Fabian Lange解釋了字符串去重特性的實現方式:

垃圾收集器會在訪問String對象時對其字符數組進行標記,並將String的哈希值以及弱引用保存到一個數組中。當垃圾收集器發現另一個具有相同哈希值的String對象時,它就會逐字符比對這兩個對象。如果他們完全匹配,那其中一個String就會被修改指向到另一個String的字符數組。由於第一個字符數組已經不再被引用,所以它也就可以被回收了。垃圾收集器會盡量减少整個操作的開銷,比如某個String對象掃描未發現有重複,那接下來的一段時間內它不會再被檢查。

緊接著,Fabian Lange通過代碼的方式解釋了字符串去重特性的神奇效果。首先使用Java 8 Update 20通過參數-Xmx256m -XX:+UseG1GC運行以下代碼:

public class LotsOfStrings { private static final LinkedList<String> LOTS_OF_STRINGS = new LinkedList<>(); public static void main(String[] args) throws Exception { int iteration = 0; while (true) { for (int i = 0; i < 100; i++) { for (int j = 0; j < 1000; j++) { LOTS_OF_STRINGS.add(new String("String " + j)); } } iteration++; System.out.println("Survived Iteration: " + iteration); Thread.sleep(100); } }}

代碼會在30次循環之後因OutOfMemoryError异常而結束運行。在使用參數 -XX:+UseStringDeduplication -XX:+PrintStringDeduplicationStatistics開啟字符串去重特性後,程序可以多運行一段時間。通過JVM的日志也可以詳細了解整個去重過程的詳細信息。請讀者自行測試。

最後,Fabian Lange還解釋了字符串去重與字符串駐留的區別,它們很相似,除了字符串駐留重用了整個的String實例,而字符串去重只是針對String的字符數組。

原創文章,轉載請注明: 轉載自並發編程網 – ifeve.com本文鏈接地址: Java 8新特性:字符串去重

FavoriteLoading添加本文到我的收藏
版权声明:本文为[杜老師說]所创,转载请带上原文链接,感谢。 https://gsmany.com/2022/01/202201071119014854.html