투자 분석2026년 4월 25일 · 6분 읽기

Veacon Confidence Score — 다중 출처 합의를 정량화하다

RTMS · R-ONE · 공시지가 세 출처를 같은 cohort 위에 올리고 disagreement 를 측정합니다. ADR-015 Layer 3 공식이 어떻게 high / medium / low 라벨을 만드는지 풀어봅니다.

Veacon 리서치팀

2026년 4월 25일6분

기관 buyer 가 부동산 데이터에서 사고 싶은 것은 raw price 가 아닙니다. 그들이 사고 싶은 건 이 숫자를 얼마나 믿어도 되는지에 대한 판단 입니다. Veacon Confidence Score 는 이 판단을 schema 와 공식으로 환원한 것입니다. PowerPoint 위에서 손으로 조정하던 작업의 자동화.

전제: 한 개의 숫자로는 부족하다

한국 CRE 데이터는 단일 출처 정의의 시장가를 갖지 못합니다 (앞 포스트의 5가지 구조적 한계). RTMS 신고 데이터, R-ONE 분기 인덱스, 공시지가 평가 — 세 출처가 같은 cohort 에 대해 다른 답을 줍니다.

단일 출처 평균 한 개 숫자는 무엇이 빠져있는지 알려주지 못합니다. 3개 출처가 합의하는지 가 그 숫자를 신뢰해도 좋은지에 대한 가장 강한 신호입니다.

공식

각 cohort (sigungu × property_type × transaction_type × period) 에 대해:

src_mean[s]      = AVG(price) within data_source_type = s
distinct_sources = COUNT(DISTINCT data_source_type)
total_samples    = COUNT(*)
relative_spread  = (MAX(src_mean) - MIN(src_mean)) / AVG(price)

confidence =
  'high'    if distinct_sources >= 3 AND relative_spread <= 0.10
  'medium'  if distinct_sources >= 2 AND relative_spread <= 0.20
  'medium'  if total_samples    >= 5  (single-source 통계적 fallback)
  'low'     otherwise

왜 이 모양인가

네 가지 선택이 들어가 있고, 각각의 이유가 있습니다.

3-source 합의가 high 의 조건

3개 출처가 ±10% 이내로 합의하면 — RTMS spot, R-ONE 모델, 공시지가 모델이 모두 같은 가격을 가리키면 — 한국 공공기록 데이터 안에서 가능한 가장 강한 신호입니다. 어느 출처에 단독으로 의존하지 않고, 셋 모두의 편향이 동시에 같은 방향으로 일어날 가능성은 매우 낮습니다.

2-source 합의는 medium

2개 출처가 ±20% 이내로 합의하면 medium. 더 약한 신호이지만 단일 출처 fluke 는 아닙니다. ±20% 까지 허용하는 이유는 모델-derived 출처 (R-ONE, 공시지가) 가 RTMS spot 과 자연스럽게 ±15-20% 차이가 나기 때문입니다 — 모델은 공식상 inflated/deflated 되어 있고 그것 자체가 정상입니다.

Single-source ≥5 samples 도 medium 으로 인정

출처가 하나 (예: RTMS 만 있는 cohort) 라도 sample 5개 이상이면 통계적으로 medium 까지 올립니다. multi-source agreement 의 대안적 근거 — 같은 출처 안에서 5개 이상의 일관된 거래는 cross-source 1-1 agreement 보다 강한 신호일 수 있습니다.

나머지는 정직하게 low

다중 출처 disagreement 도 small single-source 도 의미 있는 신호가 아닙니다. 이 경우 정직한 'low'. “우리가 아는 한 이 숫자는 흔들립니다” 가 정확한 메시지입니다.

실 cohort 예시

현재 시점 (2026-04-25) 강남 office sale, last_12m 윈도우의 응답:

{
  "sigungu": "서울특별시 강남구",
  "property_type": "office",
  "transaction_type": "sale",
  "sample_count": 5,
  "median_price": 4150000000,
  "p25_price":    3675000000,
  "p75_price":    4975000000,
  "confidence": "medium",
  "source_mix":  { "rtms_official": 3, "rone_index_derived": 1, "public_assessment": 1 },
  "source_means": {
    "rtms_official":      4383333333,  // 3 RTMS 거래 평균 4.38B
    "rone_index_derived": 4000000000,  // R-ONE 모델 4.0B
    "public_assessment":  10769230769  // 공시지가 모델 10.77B
  },
  "confidence_factors": {
    "distinct_sources": 3,
    "relative_spread":  1.21,           // 121% spread between max/min
    "sample_count":     5,
    "ladder_reason":    "single-source >= 5 samples"
  }
}

무엇을 알 수 있을까요. 3개 출처가 같은 cohort 에 대해 4.0B / 4.4B / 10.8B 라는 추정을 내놓고 있습니다. RTMS 와 R-ONE 은 가깝고, 공시지가는 높게 나옵니다. relative_spread = 1.21 즉 121% 차이.

이 cohort 가 high 가 아니라 medium 인 이유는 ladder_reason: single-source >= 5 samples 에 명시된 대로 — 3 sources 합의 gate (≤10% spread) 를 통과 못 했고, 2 sources 합의 gate (≤20%) 도 통과 못 했지만, sample_count = 5 fallback 으로 medium 이 됩니다.

공시지가 모델 (10.8B) 이 이 cohort 에서 RTMS 실거래 (4.4B) 와 크게 disagreement 하는 것은 model calibration 문제입니다. 강남구 특정 land parcel 의 공시지가에 적용한 cre_uplift_multiplier 가 high-rise office 에 비해 inflated 되어 있을 가능성. 이건 비콘의 예시 데이터가 개선되어야 할 부분이고, 실제 ETL 로 들어오는 R-ONE / 공시지가 역시 비슷한 disagreement 패턴이 발견될 것입니다.

중요한 건 — 이 disagreement 가 응답에 그대로 surface 된다는 사실 자체입니다. Buyer 가 confidence_factors.relative_spread = 1.21 을 보고 “아, 이 cohort 는 모델 출처들이 disagree 하니 RTMS spot 만 기준으로 사용하자” 같은 판단을 내릴 수 있습니다. raw price 4.4B 만 봤으면 못 했을 판단입니다.

버전 1 의 단순함

현재 공식은 의도적으로 단순합니다. ADR-015 Layer 3 spec 에는 source weighting (RTMS=1.0, partner_attestation=1.0, proprietary_survey=0.9, R-ONE=0.7, 공시지가=0.5) 이 명시되어 있지만, v1 RPC 는 이를 아직 구현하지 않습니다.

이유는 간단합니다 — weight calibration 데이터가 없기 때문 입니다. weight 0.7 을 R-ONE 에 줬을 때 실제 buyer 의 자체 valuation 과 얼마나 일치하는지 측정할 ground truth 가 없습니다. cohort 1 의 founding member 들이 자체 valuation 을 contribute 하기 시작하면 그것이 weight 보정의 baseline 이 됩니다 (Layer 4 panel program). 그 전에 weight 를 hardcoded 하는 것은 over-engineering 으로 잘못된 정밀도를 만듭니다.

현재 max-min-spread 공식은 정확히 이 weight 를 implicitly 적용합니다 — RTMS-actual 과 modeled source 가 disagree 하면 자동으로 spread 가 커지고 confidence 가 낮아집니다. weight 의 실용적 효과를 더 단순한 연산으로 얻는 것입니다. 진짜 weighted-mean 은 calibration 데이터가 쌓인 후 v2 에서.

API 호출자 입장에서의 응답 활용

confidence 라벨은 빠르게 pass/medium/fail 결정용입니다. 그러나 진짜 의사결정은 confidence_factors + source_means 의 raw 숫자에서 나옵니다:

relative_spread < 0.10 + 3 sources → 가장 강한 신호. IC 자료에 그대로 인용 가능.
0.10 < relative_spread < 0.30 → 출처별 mean 을 footnote 에 모두 표기, “RTMS spot 기준” 등 어느 출처를 primary 로 사용했는지 명시 권장.
relative_spread > 0.30 → cohort 가 disagree 상태. 권역을 좁히거나 (sigungu → dong) period 를 좁혀 (last_6m → 분기) cohort 정의를 sharpening 하는 게 더 나은 신호 생산 경로.

Confidence 가 product 인 이유

비콘이 기관 buyer 에게 파는 것은 RTMS 데이터의 사본이 아닙니다. 그것은 무료고, 누구나 다운받을 수 있고, 부정확합니다. 우리가 파는 것은 이 데이터를 얼마나 믿어도 되는지에 대한 판단 이고, 그 판단을 schema · 공식 · API 응답으로 환원해서 reproduce 가능하게 만든 것입니다.

이게 Layer 3 의 핵심 가치이고, 국내 기관 CRE 데이터 시장에서 현재 비어있는 위치입니다.

모든 인사이트로 돌아가기

Veacon Confidence Score — 다중 출처 합의를 정량화하다

전제: 한 개의 숫자로는 부족하다

공식

왜 이 모양인가

3-source 합의가 high 의 조건

2-source 합의는 medium

Single-source ≥5 samples 도 medium 으로 인정

나머지는 정직하게 low

실 cohort 예시

버전 1 의 단순함

API 호출자 입장에서의 응답 활용

Confidence 가 product 인 이유

Veacon 리서치팀한국 CRE 데이터 분석

관련 인사이트

한국 상업용 부동산 데이터의 5가지 구조적 한계

한국 CRE 데이터를
한 통의 메일로.

Veacon Confidence Score — 다중 출처 합의를 정량화하다

전제: 한 개의 숫자로는 부족하다

공식

왜 이 모양인가

3-source 합의가 high 의 조건

2-source 합의는 medium

Single-source ≥5 samples 도 medium 으로 인정

나머지는 정직하게 low

실 cohort 예시

버전 1 의 단순함

API 호출자 입장에서의 응답 활용

Confidence 가 product 인 이유

Veacon 리서치팀한국 CRE 데이터 분석

관련 인사이트

한국 상업용 부동산 데이터의 5가지 구조적 한계

한국 CRE 데이터를한 통의 메일로.

한국 CRE 데이터를
한 통의 메일로.