기관 buyer 가 부동산 데이터에서 사고 싶은 것은 raw price 가 아닙니다. 그들이 사고 싶은 건 이 숫자를 얼마나 믿어도 되는지에 대한 판단 입니다. Veacon Confidence Score 는 이 판단을 schema 와 공식으로 환원한 것입니다. PowerPoint 위에서 손으로 조정하던 작업의 자동화.
전제: 한 개의 숫자로는 부족하다
한국 CRE 데이터는 단일 출처 정의의 시장가를 갖지 못합니다 (앞 포스트의 5가지 구조적 한계). RTMS 신고 데이터, R-ONE 분기 인덱스, 공시지가 평가 — 세 출처가 같은 cohort 에 대해 다른 답을 줍니다.
단일 출처 평균 한 개 숫자는 무엇이 빠져있는지 알려주지 못합니다. 3개 출처가 합의하는지 가 그 숫자를 신뢰해도 좋은지에 대한 가장 강한 신호입니다.
공식
각 cohort (sigungu × property_type × transaction_type × period) 에 대해:
src_mean[s] = AVG(price) within data_source_type = s
distinct_sources = COUNT(DISTINCT data_source_type)
total_samples = COUNT(*)
relative_spread = (MAX(src_mean) - MIN(src_mean)) / AVG(price)
confidence =
'high' if distinct_sources >= 3 AND relative_spread <= 0.10
'medium' if distinct_sources >= 2 AND relative_spread <= 0.20
'medium' if total_samples >= 5 (single-source 통계적 fallback)
'low' otherwise왜 이 모양인가
네 가지 선택이 들어가 있고, 각각의 이유가 있습니다.
3-source 합의가 high 의 조건
3개 출처가 ±10% 이내로 합의하면 — RTMS spot, R-ONE 모델, 공시지가 모델이 모두 같은 가격을 가리키면 — 한국 공공기록 데이터 안에서 가능한 가장 강한 신호입니다. 어느 출처에 단독으로 의존하지 않고, 셋 모두의 편향이 동시에 같은 방향으로 일어날 가능성은 매우 낮습니다.
2-source 합의는 medium
2개 출처가 ±20% 이내로 합의하면 medium. 더 약한 신호이지만 단일 출처 fluke 는 아닙니다. ±20% 까지 허용하는 이유는 모델-derived 출처 (R-ONE, 공시지가) 가 RTMS spot 과 자연스럽게 ±15-20% 차이가 나기 때문입니다 — 모델은 공식상 inflated/deflated 되어 있고 그것 자체가 정상입니다.
Single-source ≥5 samples 도 medium 으로 인정
출처가 하나 (예: RTMS 만 있는 cohort) 라도 sample 5개 이상이면 통계적으로 medium 까지 올립니다. multi-source agreement 의 대안적 근거 — 같은 출처 안에서 5개 이상의 일관된 거래는 cross-source 1-1 agreement 보다 강한 신호일 수 있습니다.
나머지는 정직하게 low
다중 출처 disagreement 도 small single-source 도 의미 있는 신호가 아닙니다. 이 경우 정직한 'low'. “우리가 아는 한 이 숫자는 흔들립니다” 가 정확한 메시지입니다.
실 cohort 예시
현재 시점 (2026-04-25) 강남 office sale, last_12m 윈도우의 응답:
{
"sigungu": "서울특별시 강남구",
"property_type": "office",
"transaction_type": "sale",
"sample_count": 5,
"median_price": 4150000000,
"p25_price": 3675000000,
"p75_price": 4975000000,
"confidence": "medium",
"source_mix": { "rtms_official": 3, "rone_index_derived": 1, "public_assessment": 1 },
"source_means": {
"rtms_official": 4383333333, // 3 RTMS 거래 평균 4.38B
"rone_index_derived": 4000000000, // R-ONE 모델 4.0B
"public_assessment": 10769230769 // 공시지가 모델 10.77B
},
"confidence_factors": {
"distinct_sources": 3,
"relative_spread": 1.21, // 121% spread between max/min
"sample_count": 5,
"ladder_reason": "single-source >= 5 samples"
}
}무엇을 알 수 있을까요. 3개 출처가 같은 cohort 에 대해 4.0B / 4.4B / 10.8B 라는 추정을 내놓고 있습니다. RTMS 와 R-ONE 은 가깝고, 공시지가는 높게 나옵니다. relative_spread = 1.21 즉 121% 차이.
이 cohort 가 high 가 아니라 medium 인 이유는 ladder_reason: single-source >= 5 samples 에 명시된 대로 — 3 sources 합의 gate (≤10% spread) 를 통과 못 했고, 2 sources 합의 gate (≤20%) 도 통과 못 했지만, sample_count = 5 fallback 으로 medium 이 됩니다.
공시지가 모델 (10.8B) 이 이 cohort 에서 RTMS 실거래 (4.4B) 와 크게 disagreement 하는 것은 model calibration 문제입니다. 강남구 특정 land parcel 의 공시지가에 적용한 cre_uplift_multiplier 가 high-rise office 에 비해 inflated 되어 있을 가능성. 이건 Veacon 의 예시 데이터가 개선되어야 할 부분이고, 실제 ETL 로 들어오는 R-ONE / 공시지가 역시 비슷한 disagreement 패턴이 발견될 것입니다.
중요한 건 — 이 disagreement 가 응답에 그대로 surface 된다는 사실 자체입니다. Buyer 가 confidence_factors.relative_spread = 1.21 을 보고 “아, 이 cohort 는 모델 출처들이 disagree 하니 RTMS spot 만 기준으로 사용하자” 같은 판단을 내릴 수 있습니다. raw price 4.4B 만 봤으면 못 했을 판단입니다.
버전 1 의 단순함
현재 공식은 의도적으로 단순합니다. ADR-015 Layer 3 spec 에는 source weighting (RTMS=1.0, partner_attestation=1.0, proprietary_survey=0.9, R-ONE=0.7, 공시지가=0.5) 이 명시되어 있지만, v1 RPC 는 이를 아직 구현하지 않습니다.
이유는 간단합니다 — weight calibration 데이터가 없기 때문 입니다. weight 0.7 을 R-ONE 에 줬을 때 실제 buyer 의 자체 valuation 과 얼마나 일치하는지 측정할 ground truth 가 없습니다. cohort 1 의 founding member 들이 자체 valuation 을 contribute 하기 시작하면 그것이 weight 보정의 baseline 이 됩니다 (Layer 4 panel program). 그 전에 weight 를 hardcoded 하는 것은 over-engineering 으로 잘못된 정밀도를 만듭니다.
현재 max-min-spread 공식은 정확히 이 weight 를 implicitly 적용합니다 — RTMS-actual 과 modeled source 가 disagree 하면 자동으로 spread 가 커지고 confidence 가 낮아집니다. weight 의 실용적 효과를 더 단순한 연산으로 얻는 것입니다. 진짜 weighted-mean 은 calibration 데이터가 쌓인 후 v2 에서.
API 호출자 입장에서의 응답 활용
confidence 라벨은 빠르게 pass/medium/fail 결정용입니다. 그러나 진짜 의사결정은 confidence_factors + source_means 의 raw 숫자에서 나옵니다:
- relative_spread < 0.10 + 3 sources → 가장 강한 신호. IC 자료에 그대로 인용 가능.
- 0.10 < relative_spread < 0.30 → 출처별 mean 을 footnote 에 모두 표기, “RTMS spot 기준” 등 어느 출처를 primary 로 사용했는지 명시 권장.
- relative_spread > 0.30 → cohort 가 disagree 상태. 권역을 좁히거나 (sigungu → dong) period 를 좁혀 (last_6m → 분기) cohort 정의를 sharpening 하는 게 더 나은 신호 생산 경로.
Confidence 가 product 인 이유
Veacon 이 기관 buyer 에게 파는 것은 RTMS 데이터의 사본이 아닙니다. 그것은 무료고, 누구나 다운받을 수 있고, 부정확합니다. 우리가 파는 것은 이 데이터를 얼마나 믿어도 되는지에 대한 판단 이고, 그 판단을 schema · 공식 · API 응답으로 환원해서 reproduce 가능하게 만든 것입니다.
이게 Layer 3 의 핵심 가치이고, 한국 기관 CRE 데이터 시장에서 현재 비어있는 위치입니다.
