Veacon Data Methodology
데이터 출처, 우선순위,검증 방법,한계.
기관 투자자가 실사 단계에서 묻는 데이터 검증 항목에 사전 답변합니다. 다섯 개 출처 매트릭스, 출처 우선순위, 검증 방법, 알려진 한계, 그리고 안 하는 것과 자동 수집 게이트까지.
0개 출처. 각각 다른 공신력 + 다른 한계.
모든 거래 데이터는 다섯 개 출처 중 하나로 태깅됩니다. 응답의 data_source_type 컬럼이 행 단위 출처를, source_mix 필드가 코호트 단위 출처 분포를 노출합니다.
rtms_officialRTMS, 국토교통부 실거래가 공개시스템
Tier 1- Origin
- 국토교통부 부동산거래신고 등에 관한 법률에 따른 의무 신고 데이터
- Licensing
- data.go.kr 공공데이터 (CC BY). Veacon이 운영자 등록 후 수집
- Refresh
- 월 1회. 매월 첫 영업일 갱신
- Reporting lag
- 60~90일 (실거래, 신고, 공개의 단계별 지연)
- Rollover window
- 신고 후 60일 이내에 정정이 가능합니다. 분기 단위 회차로 안정화합니다.
- Scope
- 주택, 오피스텔, 상가, 토지 매매 신고. 임대차 신고는 2024년 7월부터 의무화
- Notes
- 거래 미신고, 신고 후 정정, 다세대 단가 분리 등 RTMS 자체의 알려진 정합성 이슈는 출처 단계에서 명시 공개합니다.
rone_index_derivedR-ONE, 한국부동산원 부동산통계정보시스템
Tier 2- Origin
- 한국부동산원이 발표하는 권역별 가격지수와 거래량 통계
- Licensing
- 한국부동산원 통계 활용 약관 (출처 명시 필수)
- Refresh
- 분기 1회. 분기 종료 후 시점
- Reporting lag
- 60~90일
- Rollover window
- 발표 후 정정 사례가 거의 없습니다.
- Scope
- 오피스 권역 (CBD, GBD, YBD), 중대형 상가, 집합 상가의 분기별 지수
- Notes
- 단일 거래가 아닌 집계 지표라서 개별 거래 수준 분석은 불가합니다. RTMS와 교차 검증하는 보조 신호로만 사용합니다.
public_assessment공시지가, LX 한국국토정보공사 / 국토교통부
Tier 3- Origin
- 표준지·개별공시지가, 표준주택가격, 개별주택가격 공시
- Licensing
- data.go.kr 공공데이터 (CC BY)
- Refresh
- 연 1회. 매년 1월 1일 기준, 5월 공시
- Reporting lag
- 4~5개월
- Rollover window
- 이의신청 기간이 끝난 5월에 확정됩니다.
- Scope
- 필지 단위 공시가격. 시장 거래가의 기준선 역할
- Notes
- 시장가 대비 60~80% 수준이라는 일반론이 있지만, 시군구와 용도에 따라 편차가 큽니다. 단독 추정용이 아닌 기준선으로만 사용합니다.
partner_attestation파트너 검증 데이터
Tier 4- Origin
- 신탁사, 자산운용사, 중개법인이 제공하는 익명화된 거래 검증 데이터
- Licensing
- 개별 NDA와 데이터 제공 계약 (Veacon DPA 부속서)
- Refresh
- 거래 발생 시점 기준 실시간. 파트너별 SLA에 따라 상이
- Reporting lag
- 0~7일 (파트너 데이터 흐름에 의존)
- Rollover window
- 검증 데이터가 정정되면 전송 로그에 새 행으로 덮어 씁니다.
- Scope
- RTMS 신고 전 거래, 계약 의향서나 MOU 단계 거래 등 RTMS 사각지대
- Notes
- 현재 운영 단계에 따라 단계적으로 확장하고 있는 출처입니다.
proprietary_survey자체 조사 데이터
Tier 5- Origin
- Veacon 운영진의 직접 시장 조사 (현장 실사, 매물 인터뷰 등)
- Licensing
- Veacon 자체 IP. 라이선스 표시 의무 없음
- Refresh
- 비정기. 특정 코호트별로 진행
- Reporting lag
- 조사 종료 후 2~4주 (정성 데이터를 정량 데이터로 변환하는 시간)
- Rollover window
- 조사가 마감된 시점 이후에는 변경하지 않습니다.
- Scope
- RTMS와 R-ONE 모두 사각지대인 좁은 코호트 (예: 신축 오피스의 사용 전 임대 조건)
- Notes
- 운영진이 직접 조사한 데이터를 단계적으로 추가합니다. 데이터가 충분히 누적되면 Veacon 자체의 정량 신호로 발전합니다.
Hover or focus to expand →
“같은 코호트에 RTMS, R-ONE, 공시지가가 모두 존재할 때 Veacon은 출처를 통합하지 않습니다. 각 출처의 평균을 별도로 노출합니다.”
응답의 source_means 필드는 코호트의 가격 평균을 출처별로 따로 계산해 dict 형태로 노출합니다.
"source_means": {
"rtms_official": <원본 평균>,
"rone_index_derived": <지수 환산 평균>
}출처 간 평균 차이 (relative_spread) 가 작을수록 confidence 값이 high로 표시되고, 차이가 커질수록 단계적으로 강등됩니다. 강등 사유는 ladder_reason 필드에 함께 노출됩니다.
정부 출처가 우선.
RTMS, 공시지가, R-ONE 같은 정부 출처가 파트너 검증 데이터나 자체 조사 데이터보다 항상 우선합니다. 충돌이 있을 때 표시되는 평균값의 기준은 정부 출처입니다.
RTMS 거래가 R-ONE 지수보다 우선.
같은 코호트에 RTMS 거래 표본이 충분하면 RTMS 평균을 주 지표로 사용하고, R-ONE 지수는 검증용 보조 신호로만 활용합니다.
가중치는 buyer가 결정.
출처별 가중평균을 자동 계산해 전달하지 않습니다. 가중치는 buyer가 자체 모델로 결정합니다. Veacon은 source_means 원본 값과 코호트 단위 통합 평균을 함께 제공합니다.
파트너 데이터는 항상 명시.
파트너 검증 데이터나 자체 조사 데이터가 코호트에 섞여 있으면 source_mix에 그대로 표기합니다. distinct_sources가 3 이상이어야 high confidence가 부여되는 이유입니다.
네 가지 검증 패턴.
다중 출처 confidence ladder.
출처 간 평균 차이.
같은 코호트에 출처가 둘 이상일 때 출처 간 평균값의 상대 차이를 계산해 confidence 등급을 산정합니다. 출처 다양성, 출처 간 일치도, 표본 수의 세 축을 결합한 ladder 방식입니다.
표본 충분성.
코호트의 sample_count가 일정 임계 미만이면 confidence를 강등합니다. 단일 거래 한 건의 이상치가 코호트 평균을 왜곡할 수 있다는 점을 명시적으로 반영합니다.
이상치 처리.
코호트 단위 사분위 기반 이상치는 응답의 p25, 중앙값, p75를 통해 buyer가 직접 판단합니다. Veacon이 자동으로 잘라내지 않는 이유는, 매매 이상치가 종종 기관의 자산 매각 신호를 담고 있어 데이터에서 제거하면 정보가 손실되기 때문입니다.
커버리지 추정.
Veacon에 들어온 거래량과 공식 거래 총액의 비율을 회차로 추적합니다. 초기 단계에는 정성적 범위만 표시하고, 데이터가 안정화된 이후에는 정량 비율을 노출합니다.
무엇을 모르는지, 왜 모르는지.
응답의 known_limitations 필드가 코호트 단위 한계를 명시합니다. 아래는 제품 차원에서 공개하는 한계입니다.
주거용 부동산
- What
- 아파트, 단독주택 등 주거 거래는 포함하지 않습니다.
- Why
- 주거 시장 데이터는 KB부동산, 한국부동산원, 민간 프롭테크가 이미 충분히 다루고 있습니다. Veacon이 집중하는 영역은 기관 투자자가 다루는 상업용 부동산입니다.
- Plan
- 기관 투자자 3팀 이상이 명시 요청한 시점에 검토합니다.
상업용 임대차 (월세, 보증금)
- What
- 오피스와 상가의 임대차 데이터 커버리지가 매매보다 현저히 낮습니다. RTMS 임대차 신고 의무화 시점이 매매보다 늦었고, 상가는 아직 부분적으로만 의무화되어 있기 때문입니다.
- Why
- 한국의 상업용 임대차는 단일 출처가 없습니다. 부분적인 RTMS 신고와 사적 데이터, 분기 R-ONE 임대료 지수가 전부입니다.
- Plan
- 파트너 검증 데이터의 우선 확장 대상입니다. 신탁사와 중개법인을 통한 검증 데이터 도입을 단계적으로 진행하고 있습니다.
진행 중 거래
- What
- MOU, 계약 의향서, 계약금 단계의 거래는 RTMS 신고 이전이라 Veacon에 반영되지 않습니다.
- Why
- RTMS 신고 의무는 잔금일 기준 30일이라, 기관 투자자가 보고 싶어하는 "활성 거래"와 시차가 발생합니다.
- Plan
- 파트너 검증 데이터의 신뢰도는 파트너별 SLA로 명시 공개합니다.
정정과 취소 추적
- What
- RTMS 신고 이후의 정정과 취소는 분기 단위 회차로만 반영하며, 실시간 갱신은 하지 않습니다.
- Why
- 정정 빈도가 분기 1% 이하 수준이라, 실시간 추적의 비용이 가치 대비 큽니다.
- Plan
- RTMS 정정 빈도가 분기 5% 초과로 상승한 시점에 도입합니다.
서울 외 권역
- What
- 초기 도입 우선순위는 서울 (특히 CBD, GBD, YBD, 마포, 성수)입니다. 광역시와 도 단위는 R-ONE 지수만 있고 RTMS 거래 단위 분석은 아직 반영하지 않았습니다.
- Why
- 기관 투자자의 상업용 부동산 거래량이 서울 권역에 80% 이상 집중되어 있어, 초기 표본 충분성을 서울에 우선 확보했습니다.
- Plan
- 부산, 인천, 대전, 광주 등 광역시 단위 도입은 다음 단계로 계획하고 있습니다.
오피스 등급 세분화
- What
- 오피스를 prime, class A, class B로 세분하지 않습니다. 현재는 property_type = "office" 단일 분류로만 표시합니다.
- Why
- 등급 분류는 중개법인이나 감정평가사마다 기준이 달라, 단일 출처가 존재하지 않습니다. 자체 분류는 실사 단계에서 검증을 받기 어려운 영역입니다.
- Plan
- 주요 중개법인과의 데이터 처리 계약을 체결하고, 중개법인이 제공하는 등급 분류를 그대로 수용할 계획입니다.
무엇을 안 하는지, 왜 안 하는지.
아래 여섯 가지는 단기 매력이 있지만 장기 신뢰와 충돌합니다. 제품 결정 기준에 명시되어 있고, 향후 24개월 동안 자동으로 거부됩니다.
- 01
모델 추정으로 생성한 행을 실거래로 표시하지 않습니다.
- 02
지수 환산이나 공시지가 데이터를 거래 데이터로 재라벨링하지 않습니다.
- 03
라이선스가 명시된 외부 보고서를 우회 수집하지 않습니다.
- 04
호가 사이트의 listing 데이터를 실거래로 표시하지 않습니다.
- 05
거래 당사자 식별 정보를 노출하지 않습니다.
- 06
스키마와 명세로 검증할 수 없는 정성적 주장을 사양에 포함하지 않습니다.
자동 수집 게이트, 현재 상태.
초기 단계 데이터 도입의 자동화는 data.go.kr RTMS API의 운영자 등록과 승인이 게이트의 선행 조건이었습니다. 현재 5개 게이트가 모두 Live 상태입니다. 약속형 일정 대신 게이트별 상태와 변경 시점을 노출하고, 운영진이 진행 상황에 따라 직접 갱신합니다. 마지막 갱신 2026-05-01.
| Gate | Status | State change |
|---|---|---|
data.go.kr 운영자 등록 국토부 RTMS API 사용 신청과 공공데이터포털 운영자 등록 | Live | 2026-05-01 |
승인과 운영용 API 토큰 발급 국토부 심사 후 운영용 토큰 발급 | Live | 2026-05-01 |
일별 RTMS 자동 수집 활성화 신고분과 정정 내역을 자동으로 수집하는 일별 파이프라인을 운영합니다. | Live | 2026-05-01 |
R-ONE 분기 지수 수집 한국부동산원 분기 지수와 거래량 통계. 분기말 기준 60일 이내에 운영진이 수동으로 갱신합니다. | Live | 2026-04-25 |
공시지가 연 1회 수집 LX 한국국토정보공사와 국토교통부 공시지가를 연 1회 (5월 공시 시점에 맞춰) 수집합니다. | Live | 2026-04-25 |
한 게이트가 in_progress 상태로 오래 머물러 있다면 그 자체가 신호입니다. 운영진이 막혀 있거나, 우선순위가 낮거나, 외부 의존이 풀리지 않았다는 뜻입니다. 평가 단계에서 신경 쓰이는 게이트가 있으면 hello@veacon.io 로 직접 문의 부탁드립니다. 진행 의도와 예상 일정 (확약이 아닌 노력 기준)을 공유드립니다.
관련 문서와 출처 링크.
- 01
Confidence 산정 방식
distinct_sources, relative_spread, sample_count를 결합하는 confidence ladder 공식을 다룹니다.
Internal - 02
API 레퍼런스: /real-estate/pulse
pulse 응답의 모든 envelope와 row 필드 레퍼런스입니다. coverage_note, source_mix, source_means, confidence_factors 등을 포함합니다.
Internal - 03
OpenAPI 3.1 명세
코드 생성, Postman 가져오기, Spectral 검증을 지원하는 명세입니다.
External - 04
Trust Center
SOC2 준비도, 데이터 처리 위탁 업체, 보안, 개인정보, DPA를 한 페이지에서 검토할 수 있습니다.
Internal - 05
공공 데이터 출처
data.go.kr의 RTMS 실거래가 공개시스템 OpenAPI 등록 페이지입니다.
External
Extra DDQ evidence on request
이 페이지가답하지 않은항목이 있다면.
VSAQ, SIG, CAIQ, 자체 DDQ 템플릿 등 추가 항목이 필요하시면 직접 문의 부탁드립니다. 5 영업일 이내에 답변 드립니다. NDA 체결 후에는 데이터 흐름의 상세 워크스루도 가능합니다.
5 business days
Asia/Seoul timezone
