안녕하세요 컴퓨터공학 박사과정 도비입니다.
오늘은 여러 인공지능 분야의 논문들 중 시계열 예측 논문을 들고왔습니다.
시계열 예측은 데이터 사이언스를 전공하시는 분들은 다 아는 분야지만
실제로, 대부분 연구가 끝났다고 생각하는 분야 중 하나에요
그런 분야에서 이번에 새로운 논문이 나와 이렇게 소개드리고자 합니다.
오늘은 논문 SEQFUSION : Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting을 바탕으로 글을 작성해보겠습니다.

왜 시계열 예측이 어려울까?
우리 일상이나 산업 분야를 살펴보면, 시간에 따라 값이 변하는 시계열 데이터(Time Series)가 정말 많습니다.
당장 예시만 들어도 주가, 기온, 트렌드 등 정말 많은 분야에서 사용 중이에요
- 주가 : 매일매일 혹은 실시간으로 변동
- 기온·강수량 : 매시간 또는 10분 단위로 수집
- 소비 트렌드 : 기간별 판매 수치 기록
이렇듯 시계열 데이터는 경제·환경·의료 뿐만 아니라 다양한 의사결정에서 중요한 자료로 사용이 됩니다.
그런데 막상 시계열 예측 모델을 만들려면, 보통 충분한 양의 데이터가 필요합니다.
- 예측 모델은 데이터를 많이 접해야 시계열의 패턴을 인식하고 학습하기 때문이죠.
- 하지만 현실적으로 데이터가 제한적이거나, 민감 정보 유출 문제로 데이터를 마음껏 공유하기 어려운 경우가 많습니다.
이런 한계를 극복하기 위한 한 가지 방법이 바로 Zero-Shot Forecasting입니다.
- Zero-Shot Forecasting : 새로운 환경에 닥쳤을 때 추가 학습이나 재훈련 없이 바로 예측하는 기법을 의미합니다.

SEQFUSION이란 무엇인가?
이번에 소개할 논문인 SEQFUSION: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting에서는 사전 학습된 모델들을 필요에 따라 조합해, 추가 학습 없이 예측 정확도를 높이는 방법을 제안합니다.
- 사전 학습된 모델(Pre-Trained Models, PTMs)이란?
-
- PTMs는 이미 어떤 특정 분야나 데이터셋에서 학습을 마친 모델입니다.
- 예를 들어, 기상청 데이터로 학습된 PTM, 병원 데이터로 학습된 PTM 등, 각기 다른 특징과 주기를 학습해 놓은 모델들이 모여있다고 생각하시면 돼요.
-
- SEQFUSION이 특별한 이유
- SEQFUSION은 이렇게 여러 PTMs를 모아둔 모델 저장소(Model Zoo)에서 가장 적합한 모델만 골라 씁니다.
- 여러 단계로 미래를 조금씩 예측(Sequential Forecasting) 해서 점진적으로 길게 예측합니다.
- 필요하다면, 앙상블 방식으로, 단일 모델보다 더 정확한 최종 예측값을 얻어냅니다.
*앙상블(Ensemble) : 상위 k개 모델의 결과값을 평균 내는 인공지능 기법

Comparison of traditional zero-shot forecasting and SEQFUSION. Traditional methods rely on sampling data and training, while SEQFUSION leverages pre-trained models (PTMs) through matching the target time series to suitable PTMs and fusing their predictions
출처 ) 논문 원문
SEQFUSION의 핵심 메커니즘 자세히 살펴보기
1. 모델 저장소 구성 (Model Zoo)
-
- 다양한 도메인에서 이미 학습된 PTM들을 수집합니다. (예: 금융, 의료, 기상, 교통 등)
- 각 PTM은 서로 다른 패턴을 학습했기 때문에, 서로 보완적인 장점을 가집니다.
2. 일반화된 특징 추출 (General Extractor)
-
- 데이터 자체를 통째로 공유하기 어려우므로, 일부 작은 샘플 또는 변환된 형태만 사용합니다.
- 이렇게 모은 소량의 데이터를 일반화 추출기(General Extractor)에 넣어 벡터 형태로 변환합니다.
- PTMs마다도 소량의 데이터를 대응시켜 벡터로 표현합니다. 결국 시계열 데이터와 PTM들이 같은 공간에서 비교 가능해집니다.

General Extractor
3. 최적 모델 선택 & 예측 (Matching and Sequential Forecasting)
-
- 벡터 공간상에서 유사도가 가장 높은 PTM들을 찾아 선택합니다.
- 선택된 PTMs는 시계열의 과거 구간을 입력으로 받아, 예측해야 할 미래 구간을 단계적으로 산출합니다.
- 예측값이 필요한 길이가 PTM의 출력 범위를 넘어가는 경우, 순차적으로 예측(Recursive Prediction)하여 조금씩 끌어가면서 최종 예측 시점까지 확장합니다.
4. 앙상블(Ensemble) 결합
-
- 상위로 선택된 PTM 여러 개가 있으면, 각자의 예측값을 평균 혹은 가중 조합해 하나의 최종 결과를 도출합니다.
- 이렇게 하면 단일 모델의 편향을 줄일 수 있고, 더 높은 정확도를 기대할 수 있습니다.

SeqFusion의 구조
실제 성능은 어떨까? (실험 결과)
다양한 시나리오에서 실험한 결과, 교통량 예측, 전력 수요 예측, 인플루엔자 환자수 예측 등 여러 벤치마크에서 기존 기법 대비 우수한 성능을 달성했습니다.
특히 오랜 기간, 대규모 데이터로 단일 모델을 학습한 것보다, 특정 패턴을 잘 학습한 여러 PTMs를 결합했을 때 더 좋은 예측력을 보였습니다.
4.1 데이터 부족 환경에서의 특징
- 일반적으로 딥러닝 기반 모델은 충분한 학습 데이터가 없으면 오버피팅이 심해져서 예측 성능이 떨어지곤 합니다.
- 그러나 SEQFUSION은 Zero-Shot 접근 방식이므로, 새로 들어온 시계열 데이터가 매우 적어도, 모델 재학습 없이 이미 학습된 PTMs를 적절히 쓸 수 있습니다.
4.2 모델 크기 및 메모리 효율
- 데이터 전체를 쌓아두는 대신, 학습된 모델들(PTMs)만 보관하면 됩니다.
- 즉, 저장 공간 절약은 물론이고, 학습 데이터를 통째로 옮길 때 생길 수 있는 프라이버시 침해 위험도 크게 줄어듭니다.

실험결과. 대부분의 환경에서 가장 높은 성능을 보이며, 타 모델에 비해 매우 적은 용량을 차지함
응용 분야와 예시
- 금융/주식 예측
- 민감한 자금 흐름 데이터를 일일이 공유하기 어렵더라도, 모델 자체(블랙박스 상태)만 공유해 각자 Zero-Shot 예측을 수행할 수 있습니다.
- 의료 데이터 분석
- 환자 정보 보호가 중요한 병원 간 협업에서, 환자 기록을 전부 주고받지 않고 PTM만 공유해 질병 발생 추이 예측이나 병상 수요량 예측 등을 진행할 수 있습니다.
- 소비 트렌드 분석
- 여러 이커머스 업체가 실제 판매 데이터를 모으기 어려울 때, 사전에 학습된 마케팅/소매 분야 PTMs를 이용해 빠르게 소비 트렌드를 파악할 수 있습니다.
- 환경·기상
- 지역별로 기상 센서나 관측소가 서로 다른 형식을 가지고 있어도, 필요한 최소한의 표현 정보만으로 각 PTM을 선택해 날씨 예측 정확도를 향상시킬 수 있습니다.
앞으로의 전망
- 개인정보 보호와 데이터 부족은 많은 산업에서 점점 더 중요한 이슈가 되고 있습니다. SEQFUSION은 이러한 문제를 해결하는 효과적인 방법이 될 것으로 기대됩니다.
- 앞으로는 오픈소스 PTM이 다양한 도메인에서 공개된다면, 더 많은 영역에서 Zero-Shot 시계열 예측이 실현될 수 있을 것입니다.
- 또한, 모델 선택 및 앙상블 과정에서 더 정교한 방법(가중치 최적화, 메타러닝 등)이 도입된다면, 예측 능력이 한층 더 개선될 가능성이 큽니다.
마무리하며
데이터가 부족하거나, 사생활·저작권 등의 이유로 데이터를 직접 공유하기 어려운 상황이라면, SEQFUSION 같은 PTM 결합형 Zero-Shot 예측 기법을 꼭 고려해보세요.
- 정확도와 개인정보 보호, 확장성을 동시에 잡을 수 있다는 것이 큰 장점입니다.
- 모든 문제를 해결해 주는 만능 모델을 만들기보다는, 도메인마다 특화된 모델들을 조금씩 가져와 현장의 문제를 효율적으로 해결하는 모습이 앞으로 점점 더 중요해질 것으로 보입니다.
이상으로 논문 SEQFUSION: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting의 핵심 내용을 정리해보았습니다.
더 궁금한 점이 있으면 언제든 댓글로 남겨주세요. 감사합니다!