Confidence Score (Layer 3)
Veacon 의 multi-source agreement 정량화 공식. RTMS · R-ONE · 공시지가 spread 측정으로 high / medium / low 라벨 + confidence_factors 노출.
institutional buyer 가 부동산 데이터에서 사고 싶은 것은 raw price 가 아니라 이 숫자를 얼마나 믿어도 되는지 입니다. Veacon Confidence Score 는 그 판단을 schema · 공식 · API 응답으로 환원한 것입니다.
ADR-015 Layer 3. blog post 의 Veacon Confidence Score explainer 와 같은 공식을 다른 각도에서 — API 호출자 입장에서.
공식
각 cohort (sigungu × property_type × transaction_type × period) 에 대해:
src_mean[s] = AVG(price) within data_source_type = s
distinct_sources = COUNT(DISTINCT data_source_type)
total_samples = COUNT(*)
relative_spread = (MAX(src_mean) - MIN(src_mean)) / AVG(price)
confidence =
'high' if distinct_sources >= 3 AND relative_spread <= 0.10
'medium' if distinct_sources >= 2 AND relative_spread <= 0.20
'medium' if total_samples >= 5 (single-source 통계적 fallback)
'low' otherwise
API 응답에서 활용
/real-estate/pulse 응답의 row 마다:
{
"confidence": "medium",
"source_mix": { "rtms_official": 3, "rone_index_derived": 1, "public_assessment": 1 },
"source_means": {
"rtms_official": 4383333333,
"rone_index_derived": 4000000000,
"public_assessment": 10769230769
},
"confidence_factors": {
"distinct_sources": 3,
"relative_spread": 1.21,
"sample_count": 5,
"ladder_reason": "single-source >= 5 samples"
}
}
confidence 라벨은 빠른 pass/medium/fail 결정용. 진짜 의사결정은 source_means + confidence_factors 의 raw 숫자에서 나옵니다.
의사결정 가이드
| relative_spread | distinct_sources | 추천 활용 |
|---|---|---|
< 0.10 | ≥ 3 | 가장 강한 신호. IC 자료에 그대로 인용 가능. |
< 0.20 | ≥ 2 | 출처별 mean 을 footnote 에 표기, primary 출처 명시. |
< 0.30 | any | confidence='medium' 가능, 그러나 caveats footnote 권장. |
> 0.30 | any | cohort 가 disagreement 상태. 권역 / period 좁혀 (sigungu → dong, last_6m → 분기) cohort 재정의 권장. |
ladder_reason 케이스
confidence_factors.ladder_reason 가 어떻게 도출됐는지 명시합니다:
"3+ sources, spread <= 10%"— high. 3개 출처 모두 ±10% 이내 합의."2+ sources, spread <= 20%"— medium. 2개 출처 ±20% 이내."single-source >= 5 samples"— medium via statistical fallback. 단일 출처지만 5개 이상 sample."low (multi-source disagreement or small single-source)"— low. spread 크거나 sample 적음.
출처 (data_source_type) 의미
| 값 | 출처 | 신뢰도 |
|---|---|---|
rtms_official | 국토부 RTMS 신고 (실거래) | 높음 (공공기록) |
rone_index_derived | 한국부동산원 R-ONE 분기 인덱스 + baseline 환산 | 중간 (모델 derived) |
public_assessment | 공시지가 + cre_uplift_multiplier + market_ratio 환산 | 중간 (모델 derived) |
partner_attestation | Veacon Layer 4 panel 파트너 직접 제출 | 높음 (Year 2+) |
proprietary_survey | Veacon 자체 분기 survey | 높음 (Year 2+) |
rtms_official 과 modeled source (rone_index_derived, public_assessment) 가 disagreement 하면 relative_spread 가 커지고 confidence 가 자동으로 낮아집니다 — 명시적 source weight 없이도 같은 효과 (ADR-015 v1 RPC).
예시 — 강남 office sale
현재 시점 (2026-04 기준) 강남구 office sale last_12m cohort:
RTMS spot: 3.2B / 4.15B / 5.8B (3 transactions, mean 4.38B)
R-ONE 모델: 4.0B (1 cohort row, 모델 derived)
공시지가 모델: 10.77B (1 cohort row, 모델 derived)
distinct_sources = 3
relative_spread = (10.77B - 4.0B) / 5.58B avg = 1.21 (121%)
sample_count = 5
ladder evaluation:
3 sources but spread 1.21 > 0.10 → not 'high'
3 sources but spread 1.21 > 0.20 → not 'medium' via spread gate
sample_count = 5 → 'medium' via fallback
ladder_reason: "single-source >= 5 samples"
confidence: 'medium'
이 cohort 가 medium 인 이유는 sample 충분하지만 출처들이 disagree 한다는 뜻. 의사결정 시 RTMS spot (4.38B) 을 primary 로 쓰고, 공시지가 모델 (10.77B) 의 outlier 신호를 footnote 로 표기하는 게 정직한 활용.
향후 (v2)
- Source weighting — RTMS=1.0, partner_attestation=1.0, proprietary_survey=0.9, R-ONE=0.7, 공시지가=0.5. cohort 1 paying customer 의 자체 valuation contribute (Layer 4 panel) 가 calibration baseline 이 된 후 v2 RPC.
- Dynamic coverage_estimate — Phase 1.5 KAB ratio 통합 후
_meta.coverage_estimate가 정량적 0.30-0.60 값으로 surface (현재 null). - Outlier flag — 단일 출처가 cohort median 에서 ±20% 이상 차이날 때
confidence_warningsarray 에 명시.
자세한 내용은 /data-trust §Layer 3.