본문 바로가기
책/effective java

[effective java] item 6. 불필요한 객체 생성을 피하라

by 2245 2023. 7. 25.

결론

기존의 객체를 재사용할 수 있다면, 새로운 객체를 생성하지 마라.

[재사용이 가능한 경우]
1. 기능이 같은 불변 객체 (ex) String) 
2. 불변 클래스
3. 비싼 객체가 반복해서 필요한 경우 
4. 어댑터

 

 

 


객체를 재사용할 수 있는 경우

1. 기능이 같은 불변 객체 (ex) String) 

똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많습니다. 

특히, 불변 객체는 언제든 재사용할 수 있습니다.

 

String 객체 생성

String s = new String("bikini");
  • 문장이 실행될 때마다 String 객체를 생성합니다.
  • 생성자에 넘겨진 "bikini" 객체는 이 생성자로 만들어내려는 String과 완전히 똑같습니다. 
  • 완전히 똑같은 불필요한 객체를 계속해서 생성합니다.
  • 이 문장이 반복문이나 빈번히 호출되는 메서드 안에 있다면 쓸데 없는 String 인스턴스가 수백만 개 만들어질 수도 있습니다.

 

String 객체 재사용

String s = "bikini";

이 코드는 새로운 인스턴스를 생성하는 대신 이미 만들어진 하나의 String 인스턴스를 사용합니다. 

 

 

2. 불변 클래스: 생성자 대신 정적 팩토리를 제공해라

불변 변수만을 가지고 있는 불변 클래스에선 생성자 대신 정적 팩터리 메서드를 제공하면 불필요한 객체 생성을 피할 수 있습니다.

 

예를 들어, Boolean(String) 생성자 대신 Boolean.valueOf(String) 팩터리 메서드를 사용하는 것이 좋습니다.

public final class Boolean implements java.io.Serializable, Comparable<Boolean>
{
    public static final Boolean TRUE = new Boolean(true);
    public static final Boolean FALSE = new Boolean(false);
    
    //생성자
    public Boolean(String s) {
    	this(parseBoolean(s));
    }
    
    public static boolean parseBoolean(String s) {
        return ((s != null) && s.equalsIgnoreCase("true"));
    }
    
    //정적 팩토리 메소드
    public static Boolean valueOf(String s) {
    	return parseBoolean(s) ? TRUE : FALSE;
	}
    
    ...
}

생성자는 호출될 떄마다 새로운 객체를 만드는 반면, 정적 팩터리 메서드는 새로운 객체를 생성하지 않습니다. 

따라서, 이 생성자는 자바 9에서 사용 자제(deprecated) API로 지정되었습니다.

 

불변 객체만이 아니라, 가변 객체라 해도 사용 중에 변경이 되지 않을 것임을 안다면 재사용할 수 있습니다.

 

3. '비싼 객체'가 반복해서 필요하다면, 캐싱하여 재사용해라

주어진 문자열이 유효한 로마 숫자인지 확인하는 메서드를 작성한다고 해봅시다.

다음은 정규표현식을 활용한 가장 쉬운 해법입니다.

문자열이 유효한 로마 숫자인지 확인하는 메서드 (p. 32)

static boolean isRomanNumeralSlow(String s) {
    return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
            + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
}

문제점 : String.matches 메서드

  • String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법입니다
  • 하지만, 해당 메서드 내부에서 생성하는 정규표현식용  Pattern 인스턴스는 한 번 쓰고 버려져 가비지 컬렉션의 대상이 됩니다.
  • Patten은 입력받은 정규 표현식에 해당하는 유한 상태 머신(finite state machine)을 만들기 때문에, 인스턴스 생성 비용이 높습니다.
  • 따라서, 성능이 중요한 상황에서 반복하여 사용하기에 적합하지 않습니다. 
참고 비싼 객체
이처럼, 생성 비용이 아주 비싼 객체가 가끔 있습니다. 이런 '비싼 객체'가 반복해서 필요하다면 캐싱하여 재사용하길 권장합니다. 하지만 자신이 만드는 객체가 안타깝게도 비싼 객체인지를 매번 명확히 알 수는 없습니다.

 

값비싼 객체를 재사용하여 성능을 개선 (p. 32)

성능을 개선하기 위해서 필요한 정규 표현식을 표현하는 (불변인) Pattern 인스턴스를 클래스 초기화(정적 초기화) 과정에서 직접 생성해 캐싱해둡니다.

isRomanNumeral 메서드가 호출될 때마다 이 인스턴스를 재사용합니다.

public class RomanNumerals {
    private static final Pattern ROMAN = Pattern.compile(
            "^(?=.)M*(C[MD]|D?C{0,3})"
                    + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");

    static boolean isRomanNumeralFast(String s) {
        return ROMAN.matcher(s).matches();
    }
}

 

  •  생성 비용이 비싼 Pattern 객체를 재사용함으로써, isRomanNumberal이 빈번히 호출되는 상황에 매번 객체를 생성할 필요가 없어져, 성능을 상당히 끌어올릴 수 있습니다. (필자의 컴퓨터에서 6.5배정도 빨라졌습니다.)
  • 성능만 좋아진 것이 아니라 코드도 명확해졌습니다.
    개선 전에는 존재조차 몰랐던 Pattern 인스턴스를 static final 필드로 끄집어내고 이름을 지어주어 코드의 의미가 훨씬 잘 드러납니다.

 

참고 지연 초기화(lazy initialization)
만약, 해당 코드의 클래스가 초기화된 후 이 메서드를 한 번도 호출하지 않는다면 ROMAN 필드는 쓸데없이 초기화된 꼴입니다. isRomanNumeral 메서드가 처음 호출될 때 필드를 초기화하는 지연 초기화(lazy initialization)로 불필요한 초기화를 없앨 수 있지만, 지연 초기화는 코드를 복잡하게 만드는데, 성능은 크게 개선되지 않을 때가 많기 때문에 권하지는 않습니다. 

 

 

4. 어댑터 패턴 (공부 필요)

객체가 불변이라면 재사용을 해도 안전함이 명백합니다. 

하지만, 훨씬 덜 명확하거나 심지어 직관에 반대되는 상황도 있습니다. 어댑터를 생각해봅시다. 

참고 어댑터(뷰(view))
어댑터는 실제 작업은 뒷단 객체에 위임하고, 자신은 제 2의 인터페이스 역할을 해주는 객체입니다.
어댑터는 뒷단 객체만 관리하면 됩니다. 즉, 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 만들어지면 충분합니다.

 

 

예를 들어, Map 인터페이스의 keySet메서드는 Map 객체 안의 키 전부를 담은 Set 뷰를 반환합니다.

Map 인터페이스의 keySet 메서드

public interface Map<K,V> {
	...
    //@return a set view of the keys contained in this map
    Set<K> keySet();
}
  • keySet을 호출할 때마다, 새로운 Set 인스턴스가 만들어진다고 생각할 수도 있습니다.
  • 사실은 매번 같은 Set 인스턴스를 반환할지도 모릅니다. 
  • 반환된 Set 인스턴스가 일반적으로 가변이더라도, 반환된 인스턴스들은 기능적으로 모두 똑같습니다.
    즉, 모두가 똑같은 Map 인스턴스를 대변하기 때문에, 반환된 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀝니다. 
  • 따라서  keySet이 뷰 객체를 여러 개 만들어도 상관은 없지만, 그럴 필요도 없고 이득도 없습니다.

 

참고) 불필요한 객체를 생성하는 오토박싱(auto boxing)을 최소화해라.

오토박싱은 의미상으로는 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주어 의미상으로는 별다른 것이 없지만 성능에서는 그렇지 않습니다.

 

예시를 통해 검증해보겠습니다.

모든 양의 정수의 총합을 구하는 메서드 (p. 34)

private static long sum() {
    Long sum = 0L;
    for (long i = 0; i <= Integer.MAX_VALUE; i++)
        sum += i;
    return sum;
}

 

모든 양의 정수의 총합을 구하는 메서드입니다. 이 프로그램은 정확한 답을 내기는 하지만, 잘못된 문자 하나 때문에 굉장히 느려졌습니다. 

  • sum 변수를 long이 아닌 Long으로 선언하여, 불필요한 Long 인스턴스가 약 2^31개나 만들어집니다.
    (대략, long 타입인 i가 Long 타입인 sum에 더해질 때마다)
  • 단순히 sum의 타입을 long으로만 바꿔주면 내 컴퓨터에서는 6.3초에서 0.59초로 빨라집니다.

 

결론
박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 주의합시다. 

 

 

주의 

단, 객체 생성은 비싸니 무조건 피하고 재사용해야 한다로 오해하면 안됩니다. 
요즘의 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일은 크게 부담이 되지 않습니다. 
프로그램의 명확성, 간결성, 기능을 위해 객체를 추가로 생성하는 것이라면 일반적으로 좋은 일입니다.

 

거꾸로, 아주 무거운 객체가 아니고서야 단순히 객체 생성을 피하고자 여러분만의 객체 풀(pool)을 만들지는 맙시다. 

물론 객체 풀을 만드는 게 나은 예가 있긴 합니다. 데이터베이스 연결 같은 경우는 생성 비용이 워낙 비싸니 재사용하는편이 낫습니다. 하지만 일반적으로는 자체 객체 풀은 코드를 헷갈리게 만들고 메모리 사용량도 늘리고 성능을 떨어트립니다. 

요즘 JVM의 가비지 컬렉터는 상당히 잘 최적화되어서 가벼운 객체용을 다룰 때는 직접 만든 객체 풀보다 훨씬 빠릅니다. 

 

 


출처

https://www.yes24.com/Product/Goods/65551284

 

이펙티브 자바 Effective Java 3/E - YES24

자바 플랫폼 모범 사례 완벽 가이드 - Java 7, 8, 9 대응자바 6 출시 직후 출간된 『이펙티브 자바 2판』 이후로 자바는 커다란 변화를 겪었다. 그래서 졸트상에 빛나는 이 책도 자바 언어와 라이브

www.yes24.com