shurain

Harmless stuff is for the weak.

취향의 탐색

Jul 23, 14

본인이 좋아하고 싫어하는 것이 무엇인지 아는 것은 얼핏 쉬운 일인 것 같다. 스스로의 호불호를 본인이 모른다면 도대체 누가 안단 말인가? 하지만 개인의 경험은 지극히 제한적일 수 밖에 없고, 이렇게 한정적인 경험으로부터 스스로의 취향을 정확히 알아내는 것은 힘든 일이다. 결국 우리는 적당한 방법을 사용해서 우리의 기호를 추측하는 수 밖에 없다.

어떤 주제에 대해서는 취향이 분명한 때가 있고, 또 다른 분야에 대해서는 취향이 없기도 하다. 이는 스스로 얼마나 많은 자원을 사용해서 취향을 탐색하였는가로 결정된다. 전체 취향을 표현한 어떤 공간이 있다면 좋아하는 것들은 높은 봉우리를 이루고, 반대로 싫어하는 것들은 깊은 계곡을 만들 것이다. 내가 탐색을 열심히 한 부분은 머릿속에 일종의 지도가 만들어져서 스스로의 호불호를 비교적 명확하게 알지만 탐색을 하지 않은 부분은 어떤 모양인지 알 수 없다.

개인의 행복이나 즐거움을 위해 좋아하는 것을 계속해서 반복하고 싫어하는 것을 피하는 것은 자연스러운 현상으로 보인다. 독서를 좋아한다면 계속해서 책을 읽고자 할 것이며 여행을 즐긴다면 가능하면 여행을 갈 기회를 늘리고자 노력할 것이다. 하지만 이런 선택은 기회 비용을 유발한다. 내가 이미 알고 있는 취향을 선택하는 것은 잘 모르는 영역을 탐색하는 기회를 뺏어가기 때문이다.

최종적으로는 선택의 효용의 합이 극대화 되는 선택을 하고 싶지만 처음에는 효용 함수의 모양을 모르므로 탐색을 해야만 한다. 하지만 탐색에만 열을 내면 효용을 극대화 하는 활용을 하지 못하기 때문에 두 선택이 상충하는 상황에 부딪히게 된다. 학자들은 이런 문제를 탐색-활용 (exploration-exploitation) 문제라고 부른다. 이는 강화 학습, 전역 최적화와 A/B 테스팅 등의 다양한 분야에서 등장하는 문제이다.

이런 문제에 접근하는 몇 가지 방법이 있다. A/B 테스팅의 관점에서는 각종 bandit 알고리즘이 있으며, 전역 최적화의 관점에서는 메타 휴리스틱들이 있다. 흥미로운 점은 모든 기법이 초반에는 다양한 탐색을 권장한다는 것이다. 주어진 시간 자원이 있을 때 처음에는 당장의 효용보다는 탐색을 해서 대강의 지도를 만들고 이를 활용해서 효용의 극대화를 노리는 것이 좋다. 개인이 특정 분야를 공략하는 능력도 비슷한 시각에서 볼 수 있다. 많은 사람들이 안정적으로 실력이 향상하는 것을 더 좋은 것으로 보지만 실제로는 초반에 개인의 퍼포먼스가 들쭉날쭉 하는 편이 최종적으로는 더 나은 실력을 갖추게 된다는 연구 결과가 있다. 역시 탐색-활용의 시점에서 이를 바라보면 쉽게 이해할 수 있다.

결국 다양한 경험을 하는 것이 중요하다는 결론이다. 새로운 시도나 새로운 경험은 늘 두려움을 동반하게 되는 것 같다. 그 중 많은 부분은 실패에 대한 두려움이 아닌가 싶다. 그럴 때 제임스 카메론이 TED 강연에서 했던 말을 떠올리곤 한다.

NASA has this phrase that they like: "Failure is not an option." But failure has to be an option in art and in exploration, because it's a leap of faith. And no important endeavor that required innovation was done without risk. You have to be willing to take those risks. So, that's the thought I would leave you with, is that in whatever you're doing, failure is an option, but fear is not.