Confidence Score (Layer 3)

Veacon 의 multi-source agreement 정량화 공식. RTMS · R-ONE · 공시지가 spread 측정으로 high / medium / low 라벨 + confidence_factors 노출.

Last updated: 2026-04-26

institutional buyer 가 부동산 데이터에서 사고 싶은 것은 raw price 가 아니라 이 숫자를 얼마나 믿어도 되는지 입니다. Veacon Confidence Score 는 그 판단을 schema · 공식 · API 응답으로 환원한 것입니다.

ADR-015 Layer 3. blog post 의 Veacon Confidence Score explainer 와 같은 공식을 다른 각도에서 — API 호출자 입장에서.

공식

각 cohort (sigungu × property_type × transaction_type × period) 에 대해:

src_mean[s]      = AVG(price) within data_source_type = s
distinct_sources = COUNT(DISTINCT data_source_type)
total_samples    = COUNT(*)
relative_spread  = (MAX(src_mean) - MIN(src_mean)) / AVG(price)

confidence =
  'high'    if distinct_sources >= 3 AND relative_spread <= 0.10
  'medium'  if distinct_sources >= 2 AND relative_spread <= 0.20
  'medium'  if total_samples    >= 5  (single-source 통계적 fallback)
  'low'     otherwise

API 응답에서 활용

/real-estate/pulse 응답의 row 마다:

json

{
  "confidence": "medium",
  "source_mix":   { "rtms_official": 3, "rone_index_derived": 1, "public_assessment": 1 },
  "source_means": {
    "rtms_official":      4383333333,
    "rone_index_derived": 4000000000,
    "public_assessment":  10769230769
  },
  "confidence_factors": {
    "distinct_sources": 3,
    "relative_spread":  1.21,
    "sample_count":     5,
    "ladder_reason":    "single-source >= 5 samples"
  }
}

confidence 라벨은 빠른 pass/medium/fail 결정용. 진짜 의사결정은 source_means + confidence_factors 의 raw 숫자에서 나옵니다.

의사결정 가이드

relative_spread	distinct_sources	추천 활용
`< 0.10`	`≥ 3`	가장 강한 신호. IC 자료에 그대로 인용 가능.
`< 0.20`	`≥ 2`	출처별 mean 을 footnote 에 표기, primary 출처 명시.
`< 0.30`	any	confidence='medium' 가능, 그러나 caveats footnote 권장.
`> 0.30`	any	cohort 가 disagreement 상태. 권역 / period 좁혀 (sigungu → dong, last_6m → 분기) cohort 재정의 권장.

ladder_reason 케이스

confidence_factors.ladder_reason 가 어떻게 도출됐는지 명시합니다:

"3+ sources, spread <= 10%" — high. 3개 출처 모두 ±10% 이내 합의.
"2+ sources, spread <= 20%" — medium. 2개 출처 ±20% 이내.
"single-source >= 5 samples" — medium via statistical fallback. 단일 출처지만 5개 이상 sample.
"low (multi-source disagreement or small single-source)" — low. spread 크거나 sample 적음.

출처 (data_source_type) 의미

값	출처	신뢰도
`rtms_official`	국토부 RTMS 신고 (실거래)	높음 (공공기록)
`rone_index_derived`	한국부동산원 R-ONE 분기 인덱스 + baseline 환산	중간 (모델 derived)
`public_assessment`	공시지가 + cre_uplift_multiplier + market_ratio 환산	중간 (모델 derived)
`partner_attestation`	Veacon Layer 4 panel 파트너 직접 제출	높음 (Year 2+)
`proprietary_survey`	Veacon 자체 분기 survey	높음 (Year 2+)

rtms_official 과 modeled source (rone_index_derived, public_assessment) 가 disagreement 하면 relative_spread 가 커지고 confidence 가 자동으로 낮아집니다 — 명시적 source weight 없이도 같은 효과 (ADR-015 v1 RPC).

예시 — 강남 office sale

현재 시점 (2026-04 기준) 강남구 office sale last_12m cohort:

RTMS spot: 3.2B / 4.15B / 5.8B (3 transactions, mean 4.38B)
R-ONE 모델: 4.0B (1 cohort row, 모델 derived)
공시지가 모델: 10.77B (1 cohort row, 모델 derived)

distinct_sources = 3
relative_spread = (10.77B - 4.0B) / 5.58B avg = 1.21 (121%)
sample_count = 5

ladder evaluation:
  3 sources but spread 1.21 > 0.10  → not 'high'
  3 sources but spread 1.21 > 0.20  → not 'medium' via spread gate
  sample_count = 5                  → 'medium' via fallback

ladder_reason: "single-source >= 5 samples"
confidence: 'medium'

이 cohort 가 medium 인 이유는 sample 충분하지만 출처들이 disagree 한다는 뜻. 의사결정 시 RTMS spot (4.38B) 을 primary 로 쓰고, 공시지가 모델 (10.77B) 의 outlier 신호를 footnote 로 표기하는 게 정직한 활용.

향후 (v2)

Source weighting — RTMS=1.0, partner_attestation=1.0, proprietary_survey=0.9, R-ONE=0.7, 공시지가=0.5. cohort 1 paying customer 의 자체 valuation contribute (Layer 4 panel) 가 calibration baseline 이 된 후 v2 RPC.
Dynamic coverage_estimate — Phase 1.5 KAB ratio 통합 후 _meta.coverage_estimate 가 정량적 0.30-0.60 값으로 surface (현재 null).
Outlier flag — 단일 출처가 cohort median 에서 ±20% 이상 차이날 때 confidence_warnings array 에 명시.

자세한 내용은 /data-trust §Layer 3.