오피스 평균값을 한 번씩 보신 적 있죠? 처음 보면 그 숫자를 그대로 받아들이게 돼요. 그런데 한 번 더 들여다본 적 있는 사람은 다른 질문부터 던지거든요. 이 평균, 도대체 누구의 평균인가요?
지난 글 에서 강남 사무용 매매 평균값을 RTMS 에서 뽑아 봤더니 2.72억이 나왔어요. 그런데 같은 데이터에서 빌딩만 따로 추리니까 267억으로 바뀌었거든요. 약 100배 차이가 난 이유는 단 하나. 누구를 묶었느냐가 달랐기 때문이에요.
이게 한 번만 생긴 함정이 아니에요. 오피스 평균값을 다루는 거의 모든 자리에서 같은 일이 일어나거든요. 그래서 평균값을 받았을 때 그 숫자 옆에 항상 따라붙어야 할 다섯 가지 질문이 있어요.
평균을 만드는 다섯 단계의 좁히기
오피스 평균값은 다섯 단계에 걸쳐 좁혀진 결과예요. 각 단계에서 무엇을 묶고 무엇을 갈랐는지가 평균값 자체보다 더 중요한 정보거든요.
- 자산 유형. office 인가요, retail 인가요. 같은 강남이라도 사무용 빌딩과 상가의 가격대는 처음부터 다른 시장이에요.
- 거래 유형. 매매인가요, 임대인가요. RTMS 안에 두 가지가 같이 들어 있어요.
- 거래 방식. RTMS 에 신고된 거래만인가요, 신탁 양수도와 SPC 주식 양수도까지 포함인가요. 후자는 RTMS 에 아예 안 잡혀요.
- 권역. 강남구인가요, 강남구 역삼동인가요. 같은 구 안에서도 동마다 가격대가 크게 달라요.
- 시점. 직전 12개월인가요, 직전 분기인가요. 호황기와 침체기 거래를 한 그릇에 담으면 평균이 흐려져요.
차원 하나만 빠져도 평균이 다른 시장이 돼요
다섯 차원 중 하나라도 잘못 묶으면 평균값이 다른 시장을 가리키게 돼요. 차원별로 짧게 짚어볼게요.
자산 유형을 안 가르면 호실이 빌딩을 묻어버려요
지난 강남 글에서 본 케이스예요. 빌딩 한 채 매매(수백억대) 와 호실 한 칸 매매(수억대) 를 한 평균에 담으면 표본 많은 호실이 빌딩을 묻어버려요. 강남 사무용 매매 평균값이 2.72억으로 떨어졌던 게 그 결과였죠. 빌딩만 따로 추리니까 267억이 됐고요.
시점을 안 가르면 호황과 침체가 섞여요
2022 년 상반기 매매와 2024 년 하반기 매매를 한 평균에 담으면 어떻게 될까요. 둘은 완전히 다른 시장이거든요. 직전 12개월 평균은 그 둘 사이의 어색한 가운데값이 돼요. 같은 강남 사무용 매매도 분기별로 끊어 보면 평균값이 분기마다 크게 흔들리는 게 보여요.
권역을 안 가르면 강남구 평균이 강남구를 안 닮아요
같은 강남구 안에서도 역삼동·청담동·신사동의 사무용 빌딩 가격대가 크게 달라요. 시군구 단위로 묶은 평균은 동 단위 평균과 잘 안 맞아요. Veacon API 가 동 단위 좁히기를 Pro 플랜부터 열어 두는 이유가 여기에 있어요.
거래 방식을 안 가르면 RTMS 의 한계가 평균에 박혀요
부동산신탁 양수도와 SPC 주식 양수도는 사실상 부동산 매매인데 RTMS 에 안 잡혀요. RTMS 평균만 보고 시장을 읽으면 큰 거래 일부를 놓치는 셈이죠. 이게 한국 상업용 매매의 40~60% 만 RTMS 에 신고된다는 구조적 한계 와 직접 연결돼요.
그럼 다섯 차원을 다 좁히면 정확해질까요
아쉽게도 정반대예요. 차원을 좁힐수록 표본 수가 줄어들거든요. 강남구 사무용 빌딩 매매를 직전 12개월 기준으로 좁혔더니 표본이 20건이었어요. 여기서 한 차원 더 좁혀서 분기 단위로 자르면 표본은 3~5건. 가격대를 추정하기 어려워지죠.
그래서 좁히기는 어디선가 멈춰야 해요. 멈출 지점을 정하는 게 평가팀의 진짜 일이고요.
Veacon API 응답에 항상 표본 수가 같이 표시되는 이유가 여기에 있어요. 평균값 옆에 표본 수가 보여야 어디까지 좁힐 수 있는지 판단할 수 있거든요. 표본이 두 자릿수 이하로 떨어지면 그 평균은 가격대 추정보다 ‘신고된 사례 가운데값’ 정도로만 봐야 정직해요.
이 평균은 누구의 평균인가요
그래서 오피스 평균값을 받았을 때 가장 먼저 물어야 할 질문이 정해져 있어요. 이 평균은 누구의 평균인가요?
자산 유형, 거래 유형, 거래 방식, 권역, 시점. 이 다섯 가지가 어떻게 좁혀졌는지가 평균값 자체보다 더 중요한 정보예요. 좁히기 정보 없이 평균값 한 줄만 받으면 그 숫자가 어느 시장을 가리키는지 알 수 없어요.
Veacon API 가 모든 응답에 cohort 정의를 같이 노출하는 이유가 그거예요. 평균값 한 줄만 보고 신뢰 여부를 판단하기 어려우니까, 누구의 평균인지를 함께 보여줘서 사용자가 직접 판단할 수 있게 만드는 거죠.
데이터 출처·검증
본문에서 ‘평균값’이라고 쓴 숫자는 통계적으로 분포의 가운데값(중위가격, median) 이에요. 부동산 분포는 한쪽으로 치우치는 경우가 많아서, 산술 평균보다 가운데값이 시장 대표값에 더 가깝거든요.
본문의 다섯 차원은 Veacon API 의 펄스 응답 파라미터와 1:1 로 대응해요 (자산 유형 = property_type, 거래 유형 = transaction_type, 권역 = sigungu·dong, 시점 = period). 자세한 cohort 정의와 데이터 갱신 주기는 데이터 출처·검증 문서에 정리되어 있어요.
