00.Pre-answered DDQ

Veacon Data Methodology

데이터 출처, 우선순위,
검증 방법,
한계.

기관 투자자가 실사 단계에서 묻는 데이터 검증 항목에 사전 답변합니다. 다섯 개 출처 매트릭스, 출처 우선순위, 검증 방법, 알려진 한계, 그리고 안 하는 것과 자동 수집 게이트까지.

01.Source matrix

0개 출처. 각각 다른 공신력 + 다른 한계.

모든 거래 데이터는 다섯 개 출처 중 하나로 태깅됩니다. 응답의 data_source_type 컬럼이 행 단위 출처를, source_mix 필드가 코호트 단위 출처 분포를 노출합니다.

01rtms_official

RTMS, 국토교통부 실거래가 공개시스템

Tier 1
Origin
국토교통부 부동산거래신고 등에 관한 법률에 따른 의무 신고 데이터
Licensing
data.go.kr 공공데이터 (CC BY). Veacon이 운영자 등록 후 수집
Refresh
월 1회. 매월 첫 영업일 갱신
Reporting lag
60~90일 (실거래, 신고, 공개의 단계별 지연)
Rollover window
신고 후 60일 이내에 정정이 가능합니다. 분기 단위 회차로 안정화합니다.
Scope
주택, 오피스텔, 상가, 토지 매매 신고. 임대차 신고는 2024년 7월부터 의무화
Notes
거래 미신고, 신고 후 정정, 다세대 단가 분리 등 RTMS 자체의 알려진 정합성 이슈는 출처 단계에서 명시 공개합니다.
02rone_index_derived

R-ONE, 한국부동산원 부동산통계정보시스템

Tier 2
Origin
한국부동산원이 발표하는 권역별 가격지수와 거래량 통계
Licensing
한국부동산원 통계 활용 약관 (출처 명시 필수)
Refresh
분기 1회. 분기 종료 후 시점
Reporting lag
60~90일
Rollover window
발표 후 정정 사례가 거의 없습니다.
Scope
오피스 권역 (CBD, GBD, YBD), 중대형 상가, 집합 상가의 분기별 지수
Notes
단일 거래가 아닌 집계 지표라서 개별 거래 수준 분석은 불가합니다. RTMS와 교차 검증하는 보조 신호로만 사용합니다.
03public_assessment

공시지가, LX 한국국토정보공사 / 국토교통부

Tier 3
Origin
표준지·개별공시지가, 표준주택가격, 개별주택가격 공시
Licensing
data.go.kr 공공데이터 (CC BY)
Refresh
연 1회. 매년 1월 1일 기준, 5월 공시
Reporting lag
4~5개월
Rollover window
이의신청 기간이 끝난 5월에 확정됩니다.
Scope
필지 단위 공시가격. 시장 거래가의 기준선 역할
Notes
시장가 대비 60~80% 수준이라는 일반론이 있지만, 시군구와 용도에 따라 편차가 큽니다. 단독 추정용이 아닌 기준선으로만 사용합니다.
04partner_attestation

파트너 검증 데이터

Tier 4
Origin
신탁사, 자산운용사, 중개법인이 제공하는 익명화된 거래 검증 데이터
Licensing
개별 NDA와 데이터 제공 계약 (Veacon DPA 부속서)
Refresh
거래 발생 시점 기준 실시간. 파트너별 SLA에 따라 상이
Reporting lag
0~7일 (파트너 데이터 흐름에 의존)
Rollover window
검증 데이터가 정정되면 전송 로그에 새 행으로 덮어 씁니다.
Scope
RTMS 신고 전 거래, 계약 의향서나 MOU 단계 거래 등 RTMS 사각지대
Notes
현재 운영 단계에 따라 단계적으로 확장하고 있는 출처입니다.
05proprietary_survey

자체 조사 데이터

Tier 5
Origin
Veacon 운영진의 직접 시장 조사 (현장 실사, 매물 인터뷰 등)
Licensing
Veacon 자체 IP. 라이선스 표시 의무 없음
Refresh
비정기. 특정 코호트별로 진행
Reporting lag
조사 종료 후 2~4주 (정성 데이터를 정량 데이터로 변환하는 시간)
Rollover window
조사가 마감된 시점 이후에는 변경하지 않습니다.
Scope
RTMS와 R-ONE 모두 사각지대인 좁은 코호트 (예: 신축 오피스의 사용 전 임대 조건)
Notes
운영진이 직접 조사한 데이터를 단계적으로 추가합니다. 데이터가 충분히 누적되면 Veacon 자체의 정량 신호로 발전합니다.

Hover or focus to expand →

02.Authority hierarchy

같은 코호트에 RTMS, R-ONE, 공시지가가 모두 존재할 때 Veacon은 출처를 통합하지 않습니다. 각 출처의 평균을 별도로 노출합니다.

응답의 source_means 필드는 코호트의 가격 평균을 출처별로 따로 계산해 dict 형태로 노출합니다.

"source_means": {
  "rtms_official":      <원본 평균>,
  "rone_index_derived": <지수 환산 평균>
}

출처 간 평균 차이 (relative_spread) 가 작을수록 confidence 값이 high로 표시되고, 차이가 커질수록 단계적으로 강등됩니다. 강등 사유는 ladder_reason 필드에 함께 노출됩니다.

IRule 01

정부 출처가 우선.

RTMS, 공시지가, R-ONE 같은 정부 출처가 파트너 검증 데이터나 자체 조사 데이터보다 항상 우선합니다. 충돌이 있을 때 표시되는 평균값의 기준은 정부 출처입니다.

IIRule 02

RTMS 거래가 R-ONE 지수보다 우선.

같은 코호트에 RTMS 거래 표본이 충분하면 RTMS 평균을 주 지표로 사용하고, R-ONE 지수는 검증용 보조 신호로만 활용합니다.

IIIRule 03

가중치는 buyer가 결정.

출처별 가중평균을 자동 계산해 전달하지 않습니다. 가중치는 buyer가 자체 모델로 결정합니다. Veacon은 source_means 원본 값과 코호트 단위 통합 평균을 함께 제공합니다.

IVRule 04

파트너 데이터는 항상 명시.

파트너 검증 데이터나 자체 조사 데이터가 코호트에 섞여 있으면 source_mix에 그대로 표기합니다. distinct_sources가 3 이상이어야 high confidence가 부여되는 이유입니다.

03.Validation

네 가지 검증 패턴.
다중 출처 confidence ladder.

4.1pattern

출처 간 평균 차이.

같은 코호트에 출처가 둘 이상일 때 출처 간 평균값의 상대 차이를 계산해 confidence 등급을 산정합니다. 출처 다양성, 출처 간 일치도, 표본 수의 세 축을 결합한 ladder 방식입니다.

4.2pattern

표본 충분성.

코호트의 sample_count가 일정 임계 미만이면 confidence를 강등합니다. 단일 거래 한 건의 이상치가 코호트 평균을 왜곡할 수 있다는 점을 명시적으로 반영합니다.

4.3pattern

이상치 처리.

코호트 단위 사분위 기반 이상치는 응답의 p25, 중앙값, p75를 통해 buyer가 직접 판단합니다. Veacon이 자동으로 잘라내지 않는 이유는, 매매 이상치가 종종 기관의 자산 매각 신호를 담고 있어 데이터에서 제거하면 정보가 손실되기 때문입니다.

4.4pattern

커버리지 추정.

Veacon에 들어온 거래량과 공식 거래 총액의 비율을 회차로 추적합니다. 초기 단계에는 정성적 범위만 표시하고, 데이터가 안정화된 이후에는 정량 비율을 노출합니다.

04.Known limitations

무엇을 모르는지, 왜 모르는지.

응답의 known_limitations 필드가 코호트 단위 한계를 명시합니다. 아래는 제품 차원에서 공개하는 한계입니다.

01Limit

주거용 부동산

What
아파트, 단독주택 등 주거 거래는 포함하지 않습니다.
Why
주거 시장 데이터는 KB부동산, 한국부동산원, 민간 프롭테크가 이미 충분히 다루고 있습니다. Veacon이 집중하는 영역은 기관 투자자가 다루는 상업용 부동산입니다.
Plan
기관 투자자 3팀 이상이 명시 요청한 시점에 검토합니다.
02Limit

상업용 임대차 (월세, 보증금)

What
오피스와 상가의 임대차 데이터 커버리지가 매매보다 현저히 낮습니다. RTMS 임대차 신고 의무화 시점이 매매보다 늦었고, 상가는 아직 부분적으로만 의무화되어 있기 때문입니다.
Why
한국의 상업용 임대차는 단일 출처가 없습니다. 부분적인 RTMS 신고와 사적 데이터, 분기 R-ONE 임대료 지수가 전부입니다.
Plan
파트너 검증 데이터의 우선 확장 대상입니다. 신탁사와 중개법인을 통한 검증 데이터 도입을 단계적으로 진행하고 있습니다.
03Limit

진행 중 거래

What
MOU, 계약 의향서, 계약금 단계의 거래는 RTMS 신고 이전이라 Veacon에 반영되지 않습니다.
Why
RTMS 신고 의무는 잔금일 기준 30일이라, 기관 투자자가 보고 싶어하는 "활성 거래"와 시차가 발생합니다.
Plan
파트너 검증 데이터의 신뢰도는 파트너별 SLA로 명시 공개합니다.
04Limit

정정과 취소 추적

What
RTMS 신고 이후의 정정과 취소는 분기 단위 회차로만 반영하며, 실시간 갱신은 하지 않습니다.
Why
정정 빈도가 분기 1% 이하 수준이라, 실시간 추적의 비용이 가치 대비 큽니다.
Plan
RTMS 정정 빈도가 분기 5% 초과로 상승한 시점에 도입합니다.
05Limit

서울 외 권역

What
초기 도입 우선순위는 서울 (특히 CBD, GBD, YBD, 마포, 성수)입니다. 광역시와 도 단위는 R-ONE 지수만 있고 RTMS 거래 단위 분석은 아직 반영하지 않았습니다.
Why
기관 투자자의 상업용 부동산 거래량이 서울 권역에 80% 이상 집중되어 있어, 초기 표본 충분성을 서울에 우선 확보했습니다.
Plan
부산, 인천, 대전, 광주 등 광역시 단위 도입은 다음 단계로 계획하고 있습니다.
06Limit

오피스 등급 세분화

What
오피스를 prime, class A, class B로 세분하지 않습니다. 현재는 property_type = "office" 단일 분류로만 표시합니다.
Why
등급 분류는 중개법인이나 감정평가사마다 기준이 달라, 단일 출처가 존재하지 않습니다. 자체 분류는 실사 단계에서 검증을 받기 어려운 영역입니다.
Plan
주요 중개법인과의 데이터 처리 계약을 체결하고, 중개법인이 제공하는 등급 분류를 그대로 수용할 계획입니다.
05.Negative space

무엇을 안 하는지, 왜 안 하는지.

아래 여섯 가지는 단기 매력이 있지만 장기 신뢰와 충돌합니다. 제품 결정 기준에 명시되어 있고, 향후 24개월 동안 자동으로 거부됩니다.

  • 01

    모델 추정으로 생성한 행을 실거래로 표시하지 않습니다.

  • 02

    지수 환산이나 공시지가 데이터를 거래 데이터로 재라벨링하지 않습니다.

  • 03

    라이선스가 명시된 외부 보고서를 우회 수집하지 않습니다.

  • 04

    호가 사이트의 listing 데이터를 실거래로 표시하지 않습니다.

  • 05

    거래 당사자 식별 정보를 노출하지 않습니다.

  • 06

    스키마와 명세로 검증할 수 없는 정성적 주장을 사양에 포함하지 않습니다.

06.Ingestion status

자동 수집 게이트, 현재 상태.

초기 단계 데이터 도입의 자동화는 data.go.kr RTMS API의 운영자 등록과 승인이 게이트의 선행 조건이었습니다. 현재 5개 게이트가 모두 Live 상태입니다. 약속형 일정 대신 게이트별 상태와 변경 시점을 노출하고, 운영진이 진행 상황에 따라 직접 갱신합니다. 마지막 갱신 2026-05-01.

GateStatusState change
data.go.kr 운영자 등록
국토부 RTMS API 사용 신청과 공공데이터포털 운영자 등록
Live2026-05-01
승인과 운영용 API 토큰 발급
국토부 심사 후 운영용 토큰 발급
Live2026-05-01
일별 RTMS 자동 수집 활성화
신고분과 정정 내역을 자동으로 수집하는 일별 파이프라인을 운영합니다.
Live2026-05-01
R-ONE 분기 지수 수집
한국부동산원 분기 지수와 거래량 통계. 분기말 기준 60일 이내에 운영진이 수동으로 갱신합니다.
Live2026-04-25
공시지가 연 1회 수집
LX 한국국토정보공사와 국토교통부 공시지가를 연 1회 (5월 공시 시점에 맞춰) 수집합니다.
Live2026-04-25

한 게이트가 in_progress 상태로 오래 머물러 있다면 그 자체가 신호입니다. 운영진이 막혀 있거나, 우선순위가 낮거나, 외부 의존이 풀리지 않았다는 뜻입니다. 평가 단계에서 신경 쓰이는 게이트가 있으면 hello@veacon.io 로 직접 문의 부탁드립니다. 진행 의도와 예상 일정 (확약이 아닌 노력 기준)을 공유드립니다.

08.Contact

Extra DDQ evidence on request

이 페이지가
답하지 않은
항목이 있다면.

VSAQ, SIG, CAIQ, 자체 DDQ 템플릿 등 추가 항목이 필요하시면 직접 문의 부탁드립니다. 5 영업일 이내에 답변 드립니다. NDA 체결 후에는 데이터 흐름의 상세 워크스루도 가능합니다.

Response SLA

5 business days
Asia/Seoul timezone